2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角

李牧南

李牧南. 区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角. 自动化学报, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
引用本文: 李牧南. 区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角. 自动化学报, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
LI Mu-Nan. Analyzing Intellectual Structure of Related Topics to Blockchain and Bitcoin: From Co-citation Clustering and Bibliographic Coupling Perspectives. ACTA AUTOMATICA SINICA, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
Citation: LI Mu-Nan. Analyzing Intellectual Structure of Related Topics to Blockchain and Bitcoin: From Co-citation Clustering and Bibliographic Coupling Perspectives. ACTA AUTOMATICA SINICA, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648

区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角


DOI: 10.16383/j.aas.2017.c160648
详细信息
    作者简介:

    李牧南    华南理工大学工商管理学院副教授, 广东省创新方法与决策管理系统重点实验室副主任, 美国佐治亚理工学院访问学者. 2006年获得华南理工大学计算机应用技术专业博士学位. 2008年从华南理工大学管理科学与工程博士后流动站出站.主要研究方向为文本挖掘与大数据, 新兴技术管理, 信息系统.E-mail:limn@scut.edu.cn

  • 本文责任编委 袁勇
  • 基金项目:

    国家自然科学基金 71673088

    广东省软科学研究基金 2017A070706003

Analyzing Intellectual Structure of Related Topics to Blockchain and Bitcoin: From Co-citation Clustering and Bibliographic Coupling Perspectives

More Information
    Author Bio:

        Associate professor at the School of Business Administration, South China University of Technology, deputy director of the Key Laboratory on Innovation Methods and Decision Management System of Guangdong, and the visiting scholar at Georgia Institute of Technology, USA. He received his Ph. D. degree from South China University of Technology in computer science in 2006, and experienced two-year postdoctoral career in management science. His research interest covers text mining and big data, management of emerging technology, and information systems. E-mail:

  • Fund Project:

    Natural Science Foundation of China 71673088

    Soft Science Research Funds of Guangdong Province 2017A070706003

  • 摘要: 区块链与比特币作为当前一种重要的新兴技术和数字货币,随着相关应用的拓展,一些理论和应用问题开始得到更多的关注.近年来,区块链和比特币的相关概念已经逐渐扩散到其他的学术领域.但是,对区块链和比特币相关主题的知识结构(Intellectual structure),包括知识基础(Intellectual base)和研究前沿(Research front)的探讨较少,定量化研究基本为空白.本文通过对Web of Science数据库收录的相关文献进行计量分析,并结合科学图谱分析工具,以较为直观的方式,部分呈现了区块链与比特币相关主题的知识结构,其中包括以共被引聚类分析呈现的知识基础和以耦合聚类分析和关键词共现分析呈现的研究前沿.对于推进区块链和比特币相关主题的知识扩散,以及对未来区块链和比特币的相关学术研究具有一定的参考价值.
    本文责任编委 袁勇
  • 图  1  区块链和比特币相关主题文献的时间序列分析(1999~2015)

    Fig.  1  The time series of the related literature to blockchain and bitcoin (1999~2015)

    图  2  基于CiteSpace的共被引网络图(中心节点度排序)

    Fig.  2  Co-citation networking based on CiteSpace

    图  3  基于CiteSpace的相关文献耦合聚类分析

    Fig.  3  Bibliographic coupling analysis based on CiteSpace

    图  4  基于CiteSpace的相关文献关键词共现分析(语义相似度分析)

    Fig.  4  Co-occurrence analysis of the relevant literature based on CiteSpace

    表  1  不同组合检索式实验结果一览表

    Table  1  The different experiments of literature retrieving

    序号组合检索式文献数量文献类型分布
    1TS = (“blockchain*”)索引= SCI-EXPANDED, SSCI, CPCI-S,30会议论文: 21
    CPCI-SSH, CCR-EXPANDED, IC时间跨度= 1986~2016期刊论文: 2
    2TS = (“blockchain*”) NOT TS = (“bitcoin*”)索引=4会议论文: 2
    SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,期刊论文: 2
    CCR-EXPANDED, IC时间跨度= 1986~2016
    3TS = (“blockchain*” OR “bitcoin*” OR “proof of work” OR264会议论文: 158
    “Ethereum*” OR “crypto-currenc*” OR “digital currenc*”)期刊论文: 70
    索引= SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,
    CCR-EXPANDED, IC时间跨度= 1986~2016
    4TS = (“bitcoin*” OR “proof of work” OR “Ethereum*”234会议论文: 137
    OR “crypto-currenc*” OR “digital currenc*”)期刊论文: 68
    NOT TS = “blockchain*”
    索引= SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,
    CCR-EXPANDED, IC时间跨度= 1986~2016
    5TS = (“blockchain*” OR ”bitcoin*” OR ”proof of work”221会议论文: 158
    OR “Ethereum*” OR ”crypto-currenc*”期刊论文: 70
    OR “digital currenc*”)
    精炼依据:文献类型: (PROCEEDINGS PAPER OR ARTICLE)
    索引= SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,
    CCR-EXPANDED, IC时间跨度= 1986~2016
    下载: 导出CSV

    表  2  文献占比最高的前5个国家(地区)

    Table  2  Top 5 countries or territories of the literature proportion

    国家论文数量占比(%)4
    美国6328.644
    英国2310.454
    德国219.554
    瑞士104.554
    印度94.094
    中国94.094
    西班牙94.094
    下载: 导出CSV

    表  3  文献占比最高的前10个科目(Category of WOS)

    Table  3  Top 10 categories of WOS ordered by the proportion of literature

    WOS的科目论文数量占比(%)学科方向
    Computer science theory methods11351.36计算机科学
    Computer science information systems9342.27计算机科学
    Computer science interdisciplinary applications3917.73计算机科学
    Engineering electrical electronic2913.18工程(电气)
    Computer science software engineering2812.73工程(软件)
    Computer science hardware architecture2511.36计算机科学
    Economics156.82经济学
    Computer science artificial intelligence125.46计算机科学
    Telecommunications125.46通信
    Business finance115.00金融
    Multidisciplinary sciences94.09综合
    下载: 导出CSV

    表  4  共引网络聚类的文献规模前10的簇

    Table  4  Top 10 clusters ordered by size in co-citation clustering

    ID文献数量轮廓系数主题(Log-likelihood ration, LLR)主题(TF-IDF加权)
    0670.823mining pool; bitcoin ecosystem;rational zero; bitcoins
    bitcoin protocol
    1410.962client puzzle; dos attack;denial; cryptography
    computational power
    2371.000set-up assumption; unified framework;a unified framework for concurrent
    concurrent secure computation-bothsecurity:universal composability
    from stand-alone non-malleability
    3340.999transaction prefixe;the case for public work
    human behaviour offer;
    empirical inquiry
    4320.976storage complexity;difficulty notions;
    constructing peer-to-peer system;storage complexity
    storage-enforcing commitment scheme
    5280.965effective method; rejection notice;spam-combating system
    compromising party
    7240.998hidden internet service;silk road
    silk road; online media
    6240.982potential attack; several month;proof-of-work
    advanced bot
    9230.957transaction prefixe;fairnet -how to counter free riding
    human behaviour offer;in peer-to-peer data structures
    empirical inquiry
    8230.937bread pudding protocol;application; work
    security protocol;
    untrusted computational device
    10221.000business process; security intent;secure business process modelling;
    business process expertSOA system
    11211.000electronic payment system;multi-analyses electronic
    broad classes;payment system
    encryption method
    下载: 导出CSV

    表  5  图 2中共被引频次(Frequency of co-citation)最高的10篇文献

    Table  5  Top 10 articles with high frequency of co-citation in Fig. 2

    序号论文频次
    1Nakamoto S. Bitcoin:a peer-to-peer electronic cash system [Online],62
    available:https: //bitcoin.org/bitcoin.pdf, 2008.
    2Ron D. Shamir A. Quantitative Analysis of the Full Bitcoin Transaction Graph.24
    LNCS, 2013, vol. 7859(3-4): 6-24.
    3Reid F, Harrigan M. An Analysis of Anonymity in the Bitcoin System.23
    IEEE Third International Conference on Privacy, 2013, vol.1, 1318-1326.
    4Barber S, Boyen X, Shi E, et al. Bitter to Better — How to Make Bitcoin a Better23
    Currency, LNCS, 2012, 7397: 399-414.
    5Meiklejohn S, Pomarole M, Jordan G, et al. A fistful of bitcoins:characterizing payments22
    among men with no names. Proceedings of the ACM Conference on Internet Measurement
    Conference, 2013, vol. 1, 127-140.
    6Ober M, Katzenbeisser S, Hamacher K. Structure and Anonymity of the Bitcoin17
    Transaction Graph. Future Internet, 2013, 5(2): 237-250.
    7Androulaki E, Karame G, Roeschlin M, et al. Evaluating User Privacy in Bitcoin.16
    LNCS, 2013, 7859: 34-51.
    8Moore T, Christin N. Beware the Middleman:Empirical Analysis of Bitcoin-Exchange14
    Risk. LNCS, 2013, 7859: 25-33.
    9Miers I, Garman C, Green M, Rubin AD. Zerocoin:Anonymous Distributed E-Cash10
    from Bitcoin. Security and Privacy, 2013: 397-411.
    10Christin N. Traveling the silk road:a measurement analysis of a large anonymous online10
    marketplace. International Conference on World Wide Web, 2012, 2(3): 293-304.
    下载: 导出CSV

    表  6  相关文献的耦合聚类分析结果表(文献规模排名前5)

    Table  6  Top 5 clusters of bibliographic coupling analysis

    ID文献数量轮廓系数主题(Log-likelihood ration, LLR)主题(TF-IDF加权)
    0210.984carbon emission;trading infrastructure model | bitcoins
    cryptocurrency system;
    using p2p network traffic
    1200.991renewable energy;empirical analysis | bitcoin network
    smart grid;
    difficulty control
    2180.97bitcoin-based transaction rating system;weird trick
    peer-to-peer affine commitment;
    algorithmic trading
    3170.935bitcoin ecosystem;empirical analysis | bitcoins
    conjoint analysis;
    future online banking service
    4170.972adaptive identity management;cloudlet-based multi-lateral resource
    certified bitcoin;exchange framework | bitcoin
    making puzzle
    5150.979virtual currencies;denial
    new phenomenon;
    financial market
    下载: 导出CSV

    表  7  图 3中文献节点中心性(Centrality of node)最高的10篇文献

    Table  7  Top 10 articles with high centrality in Fig. 3

    序号论文中心性
    1Donet JAD, Pérez-Solà C, Herrera-Joancomar J. The Bitcoin P2P Network. The Workshop1.12
    on Bitcoin Research, 2014, 8438: 87$-$102.
    2Wang LQ, Liu Y. Exploring Miner Evolution in Bitcoin Network. LNCS, 2015,0.87
    8995:290$-$302.
    3Ron D, Shamir A.How Did Dread Pirate Roberts Acquire and Protect his Bitcoin0.8
    Wealth? LNCS, 2014, 8438:3$-$15.
    4Dev JA. Bitcoin mining acceleration and performance quantification. IEEE 27th Canadian0.6
    Conference on Electrical and Computer Engineering (CCECE), 2014, vol.1, 1$-$6.
    5Bamert T, Decker C, Elsen L, et al. Have a Snack, Pay with Bitcoins. IEEE Thirteenth0.51
    International Conference on Peer-to-peer Computing, 2013, 19(17): 1$-$5.
    6Meiklejohn S, Orlandi C. Privacy-Enhancing Overlays in Bitcoin. LNCS, 2015,0.49
    8976:127$-$141.
    7Herrera-Joancomarti J. Research and Challenges on Bitcoin Anonymity. LNCS, 2015,0.36
    9229:163$-$180.
    8Novak M, Skalak P. Virtual currencies. International Scientific Conference on Knowledge0.34
    for Market Use ---Women in Business in the Past and Present, 2015, vol. 1, 880$-$887.
    9Vasek, Marie, Moore, Tyler. There$'$s No Free Lunch, Even Using Bitcoin:Tracking the0.33
    Popularity and Profits of Virtual Currency Scams. LNCS, 2015, 8975:44$-$61.
    10Sapuric S, Kokkinaki A. Bitcoin Is Volatile! Isn$'$t that Right? Lecture Notes in Business0.19
    Information Processing, 2014, 183:255$-$265.
    下载: 导出CSV

    表  8  共现频次和节点中心性排名前10的关键词

    Table  8  Top 10 keywords ordered by frequency of co-occurrence and centrality

    序号共现频次节点中心性关键词序号节点中心性共现频次关键词
    1750.62bitcoin10.6275bitcoin
    2230.5cryptocurrency20.523cryptocurrency
    3140.38proof-of-work30.4111money
    4130.3security40.3814proof-of-work
    5110.41money50.313security
    6100.22digital; currency60.2210digital currency
    780.1anonymity70.215attack
    870.06blockchain80.162e cash
    870.02virtual; currency90.151financial; investment
    960.12privacy100.143silk road
    960.03cryptography100.141money laundering
    1050.21attack
    下载: 导出CSV
  • [1] Nakamoto S. Bitcoin: a peer-to-peer electronic cash system [Online], available: https://bitcoin.org/bitcoin.pdf, Janurary 3, 2009
    [2] Blockchain (database) [Online], available: https://en.wiki-pedia.org/wiki/Blockchain, June 1, 2017
    [3] 袁勇, 王飞跃.区块链技术发展现状与展望.自动化学报, 2016, 42(4): 481-494 http://www.aas.net.cn/CN/abstract/abstract18837.shtml

    Yuan Yong, Wang Fei-Yue. Blockchain: the state of the art and future trends. Acta Automatica Sinica, 2016, 42(4): 481-494 http://www.aas.net.cn/CN/abstract/abstract18837.shtml
    [4] 张宁, 王毅, 康重庆, 程将南, 贺大玮.能源互联网中的区块链技术:研究框架与典型应用初探.中国电机工程学报, 2016, 36(15): 4011-4022 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGDC201615001.htm

    Zhang Ning, Wang Yi, Kang Chong-Qing, Chen Jiang-Nan, He Da-Wei. Blockchain technique in the energy internet: preliminary research framework and typical applications. Proceedings of the CSEE, 2016, 36(15): 4011-4022 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGDC201615001.htm
    [5] 赵赫, 李晓风, 占礼葵, 吴仲城.基于区块链技术的采样机器人数据保护方法.华中科技大学学报(自然科学版), 2015, 43(S1): 216-219 http://www.cnki.com.cn/Article/CJFDTOTAL-HZLG2015S1052.htm

    Zhao He, Li Xiao-Feng, Zhan Li-Kui, Wu Zhong-Cheng. Data integrity protection method for microorganism sampling robots based on blockchain technology. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2015, 43(S1): 216-219 http://www.cnki.com.cn/Article/CJFDTOTAL-HZLG2015S1052.htm
    [6] 戴金平, 黎艳.货币会消亡吗?—兼论数字货币的未来.南开学报(哲学社会科学版), 2016, (4): 141-149 http://www.cnki.com.cn/Article/CJFDTOTAL-LKXB201604015.htm

    Dai Jin-Ping, Li Yan. Will money finally disappear: the future of digital cash. Nankai Journal (Philosophy, Literature and Social Science Edition), 2016, (4): 141-149 http://www.cnki.com.cn/Article/CJFDTOTAL-LKXB201604015.htm
    [7] Swan M. Blockchain thinking: the brain as a decentralized autonomous corporation. IEEE Technology and Society Magazine, 2015, 34(4): 41-52 doi:  10.1109/MTS.2015.2494358
    [8] Evangelopoulos N, Zhang X N, Prybutok V R. Latent semantic analysis: five methodological recommendations. European Journal of Information Systems, 2012, 21(1): 70-86 doi:  10.1057/ejis.2010.61
    [9] Müller O, Schmiedel T, Gorbacheva E, vom Brocke J. Towards a typology of business process management professionals: identifying patterns of competences through latent semantic analysis. Enterprise Information Systems, 2016, 10(1): 50-80 doi:  10.1080/17517575.2014.923514
    [10] Van Hout M C, Bingham T. "Surfing the silk road": a study of users' experiences. International Journal of Drug Policy, 2013, 24(6): 524-529 doi:  10.1016/j.drugpo.2013.08.011
    [11] Chu J, Nadarajah S, Chan S. Statistical analysis of the exchange rate of bitcoin. PLoS One, 2015, 10(7): e0133678 doi:  10.1371/journal.pone.0133678
    [12] Cheung A, Roca E, Su J J. Crypto-currency bubbles: an application of the Phillips-Shi-Yu (2013) methodology on Mt. Gox bitcoin prices. Applied Economics, 2015, 47(23): 2348-2358 https://espace.curtin.edu.au/bitstream/handle/20.500.11937/45230/227311_227311.pdf?sequence=2
    [13] Böhme R, Christin N, Edelman B, Moore T. Bitcoin: economics, technology, and governance. Journal of Economic Perspectives, 2015, 29(2): 213-238 doi:  10.1257/jep.29.2.213
    [14] Van Alstyne M. Why Bitcoin has value. Communications of the ACM, 2014, 57(5): 30-32 doi:  10.1145/2594413
    [15] Kraft D. Difficulty control for blockchain-based consensus systems. Peer-to-peer Networking and Applications, 2016, 9(2): 397-413 doi:  10.1007/s12083-015-0347-x
    [16] Yan B N, Lee T S, Lee T P. Mapping the intellectual structure of the internet of things (IoT) field (2000-2014): a co-word analysis. Scientometrics, 2015, 105(2): 1285-1300 doi:  10.1007/s11192-015-1740-1
    [17] Liu Z G, Yin Y M, Liu W D, Dunford M. Visualizing the intellectual structure and evolution of innovation systems research: a bibliometric analysis. Scientometrics, 2015, 103(1): 135-158 doi:  10.1007/s11192-014-1517-y
    [18] Li M N, Chu Y Q. Explore the research front of a specific research theme based on a novel technique of enhanced co-word analysis. Journal of Information Science, 2016, DOI:  10.1177/0165551516661914
    [19] Gan Z C, Xu Z L. Efficient implementation of the Barnes-Hut octree algorithm for Monte Carlo simulations of charged systems. Science China Mathematics, 2014, 57(7): 1331-1340 doi:  10.1007/s11425-014-4783-5
    [20] Zhang J C, Behzad B, Snir M. Design of a multithreaded barnes-hut algorithm for multicore clusters. IEEE Transactions on Parallel and Distributed Systems, 2015, 26(7): 1861-1873 doi:  10.1109/TPDS.2014.2331243
    [21] Chen C M. CiteSpace Ⅱ: detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology, 2006, 57(3): 359-377 doi:  10.1002/(ISSN)1532-2890
    [22] Zhang Y, Zhou X, Porter A L. How to combine term clumping and technology roadmapping for newly emerging science and technology competitive intelligence: "problem and solution"pattern based semantic TRIZ tool and case study. Scientometrics, 2014, 101(2): 1375-1389 doi:  10.1007/s11192-014-1262-2
    [23] Li M N. A novel three-dimension perspective to explore technology evolution. Scientometrics, 2015, 105(3): 1679-1697 doi:  10.1007/s11192-015-1591-9
    [24] Al-Salemi B, Ab Aziz M J, Noah S A. LDA-AdaBoost.MH: accelerated adaboost.MH based on latent Dirichlet allocation for text categorization. Journal of Information Science, 2015, 41(1): 27-40 doi:  10.1177/0165551514551496
    [25] Hammarfelt B. Interdisciplinarity and the intellectual base of literature studies: citation analysis of highly cited monographs. Scientometrics, 2011, 86(3): 705-725 doi:  10.1007/s11192-010-0314-5
    [26] Rousseeuw P J. Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 1987, 20: 53-65 doi:  10.1016/0377-0427(87)90125-7
    [27] Zhang Q P, Feng Z, Li X, Zheng X L, Zhang L. 25 years of collaborations in IEEE intelligent systems. IEEE Intelligent Systems, 2010, 25(6): 67-75 doi:  10.1109/MIS.2010.136
    [28] Borgatti S P. Centrality and network flow. Social Networks, 2005, 27(1): 55-71 doi:  10.1016/j.socnet.2004.11.008
    [29] de Amorim R C, Hennig C. Recovering the number of clusters in data sets with noise features using feature rescaling factors. Information Sciences, 2015, 324: 126-145 doi:  10.1016/j.ins.2015.06.039
    [30] Jarneving B. Bibliographic coupling and its application to research-front and other core documents. Journal of Informetrics, 2007, 1(4): 287-307 doi:  10.1016/j.joi.2007.07.004
    [31] 李牧南.基于关联规则挖掘竞争情报研究前沿分析.情报杂志, 2016, 35(3): 54-60 http://www.cnki.com.cn/Article/CJFDTOTAL-QBZZ201603011.htm

    Li Mu-Nan. Probing the research frontiers of competitive intelligence based on the association rules mining. Journal of Intelligence, 2016, 35(3): 54-60 http://www.cnki.com.cn/Article/CJFDTOTAL-QBZZ201603011.htm
    [32] Hu J M, Zhang Y. Research patterns and trends of Recommendation System in China using co-word analysis. Information Processing and Management, 2015, 51(4): 329-339 doi:  10.1016/j.ipm.2015.02.002
    [33] Kostoff R N, Schaller R R. Science and technology roadmaps. IEEE Transactions on Engineering Management, 2001, 48(2): 132-143 doi:  10.1109/17.922473
    [34] Xie P. Study of international anticancer research trends via co-word and document co-citation visualization analysis. Scientometrics, 2015, 105(1): 611-622 doi:  10.1007/s11192-015-1689-0
    [35] Mihaylov M, Jurado S, Avellana N, Van Moffaert K, de Abril I M, Nowe A. NRGcoin: virtual currency for trading of renewable energy in smart grids. In: Proceedings of the 11th International Conference on European Energy Market. Krakow, Poland: IEEE, 2014. 1-6
    [36] Al Kawasmi E, Arnautovic E, Svetinovic D. Bitcoin-based decentralized carbon emissions trading infrastructure model. Systems Engineering, 2015, 18(2): 115-130 doi:  10.1002/sys.v18.2
  • [1] 孟吴同, 张大伟. Hyperledger Fabric共识机制优化方案[J]. 自动化学报, 2020, 46(): 1-14. doi: 10.16383/j.aas.c190516
    [2] 欧阳丽炜, 王帅, 袁勇, 倪晓春, 王飞跃. 智能合约:架构及进展[J]. 自动化学报, 2019, 45(3): 445-457. doi: 10.16383/j.aas.c180586
    [3] 韩璇, 袁勇, 王飞跃. 区块链安全问题:研究现状与展望[J]. 自动化学报, 2019, 45(1): 206-225. doi: 10.16383/j.aas.c180710
    [4] 曾帅, 袁勇, 倪晓春, 王飞跃. 面向比特币的区块链扩容:关键技术, 制约因素与衍生问题[J]. 自动化学报, 2019, 45(6): 1015-1030. doi: 10.16383/j.aas.c180100
    [5] 王飞跃, 张军, 张俊, 王晓. 工业智联网:基本概念、关键技术与核心应用[J]. 自动化学报, 2018, 44(9): 1606-1617. doi: 10.16383/j.aas.2018.y000004
    [6] 王飞跃, 孙奇, 江国进, 谭珂, 张俊, 侯家琛, 熊刚, 朱凤华, 韩双双, 董西松, 王嫘. 核能5.0:智能时代的核电工业新形态与体系架构[J]. 自动化学报, 2018, 44(5): 922-934. doi: 10.16383/j.aas.2018.y000003
    [7] 袁勇, 倪晓春, 曾帅, 王飞跃. 区块链共识算法的发展现状与展望[J]. 自动化学报, 2018, 44(11): 2011-2022. doi: 10.16383/j.aas.2018.c180268
    [8] 王飞跃, 张俊. 智联网:概念、问题和平台[J]. 自动化学报, 2017, 43(12): 2061-2070. doi: 10.16383/j.aas.2017.y000006
    [9] 唐长兵, 杨珍, 郑忠龙, 陈中育, 李翔. PoW共识算法中的博弈困境分析与优化[J]. 自动化学报, 2017, 43(9): 1520-1531. doi: 10.16383/j.aas.2017.c160672
    [10] 张俊, 高文忠, 张应晨, 郑心湖, 杨柳青, 郝君, 戴潇潇. 运行于区块链上的智能分布式电力能源系统:需求、概念、方法以及展望[J]. 自动化学报, 2017, 43(9): 1544-1554. doi: 10.16383/j.aas.2017.c160744
    [11] 袁勇, 王飞跃. 平行区块链:概念、方法与内涵解析[J]. 自动化学报, 2017, 43(10): 1703-1712. doi: 10.16383/j.aas.2017.c170543
    [12] 薛腾飞, 傅群超, 王枞, 王新宴. 基于区块链的医疗数据共享模型研究[J]. 自动化学报, 2017, 43(9): 1555-1562. doi: 10.16383/j.aas.2017.c160661
    [13] 袁勇, 王飞跃. 区块链技术发展现状与展望[J]. 自动化学报, 2016, 42(4): 481-494. doi: 10.16383/j.aas.2016.c160158
    [14] 袁勇, 王飞跃. 区块链技术发展现状与展望[J]. 自动化学报, 2016, 42(4): 481-494.
  • 加载中
图(4) / 表(8)
计量
  • 文章访问数:  932
  • HTML全文浏览量:  306
  • PDF下载量:  1226
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-09-12
  • 录用日期:  2017-02-03
  • 刊出日期:  2017-09-20

区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角

doi: 10.16383/j.aas.2017.c160648
    基金项目:

    国家自然科学基金 71673088

    广东省软科学研究基金 2017A070706003

    作者简介:

    李牧南    华南理工大学工商管理学院副教授, 广东省创新方法与决策管理系统重点实验室副主任, 美国佐治亚理工学院访问学者. 2006年获得华南理工大学计算机应用技术专业博士学位. 2008年从华南理工大学管理科学与工程博士后流动站出站.主要研究方向为文本挖掘与大数据, 新兴技术管理, 信息系统.E-mail:limn@scut.edu.cn

  • 本文责任编委 袁勇

摘要: 区块链与比特币作为当前一种重要的新兴技术和数字货币,随着相关应用的拓展,一些理论和应用问题开始得到更多的关注.近年来,区块链和比特币的相关概念已经逐渐扩散到其他的学术领域.但是,对区块链和比特币相关主题的知识结构(Intellectual structure),包括知识基础(Intellectual base)和研究前沿(Research front)的探讨较少,定量化研究基本为空白.本文通过对Web of Science数据库收录的相关文献进行计量分析,并结合科学图谱分析工具,以较为直观的方式,部分呈现了区块链与比特币相关主题的知识结构,其中包括以共被引聚类分析呈现的知识基础和以耦合聚类分析和关键词共现分析呈现的研究前沿.对于推进区块链和比特币相关主题的知识扩散,以及对未来区块链和比特币的相关学术研究具有一定的参考价值.

本文责任编委 袁勇

English Abstract

李牧南. 区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角. 自动化学报, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
引用本文: 李牧南. 区块链和比特币相关主题的知识结构分析:共被引和耦合聚类分析视角. 自动化学报, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
LI Mu-Nan. Analyzing Intellectual Structure of Related Topics to Blockchain and Bitcoin: From Co-citation Clustering and Bibliographic Coupling Perspectives. ACTA AUTOMATICA SINICA, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
Citation: LI Mu-Nan. Analyzing Intellectual Structure of Related Topics to Blockchain and Bitcoin: From Co-citation Clustering and Bibliographic Coupling Perspectives. ACTA AUTOMATICA SINICA, 2017, 43(9): 1509-1519. doi: 10.16383/j.aas.2017.c160648
  • 2009年1月, 中本聪(Satoshi Nakamoto)发布了全球第一款基于区块链(Blockchain)技术的数字货币---比特币(bitcoin)[1].作为一种分布式数据库技术[2], 区块链在网络加密、数字签名、数字防伪等互联网信息安全领域的优异性能得到了愈发广泛的关注.作为数字或虚拟货币的比特币一度引起了政府机构的高度关注和部分风险投资者的追捧. 2016年6月, 比特币的全球市值超过了100亿美元, 大约占全球所有数字货币(Digital currencies)市场的80 %, 但依然与传统货币的价值规模相去甚远.

    世界各国对待比特币等数字货币的态度并不统一, 存在一定争议.但是近年来, 随着互联网金融、众筹、物联网等新兴概念和应用的兴起, 区块链作为比特币实现的基础技术, 逐渐引起了理论和产业界的高度关注.因此, 针对区块链技术的研究在近年开始从传统的计算机和信息科学领域向经济、金融等领域扩散.作为一种计算机科学的新兴技术, 区块链技术在很多重要的研究领域都处于起步阶段, 因此有必要对其知识结构进行深入分析, 从而发现其知识基础和潜在的研究前沿, 为后续相关研究提供有价值的参考.

    • 区块链技术的最大贡献是在没有第三方机构的情况下, 通过分布式节点的验证和共识机制解决了去中心化系统的双重支付问题[3].由于区块链技术具有典型的去中心化、透明性、公平性和公开性特质, 因此可以推广到能源互联网中; 这是区块链技术走向新兴互联网应用的一个重要方向[4].此外, 研究人员还尝试将区块链技术应用到采样机器人的信息传感过程中[5].区块链技术极大解决了交易的信息不对称问题, 提高了交易效率和降低了交易成本.从货币的基本意义和作用角度看, 数字货币是传统货币在互联网金融风险和交易成本递减双重驱动下的必然趋势[6].与此同时, 区块链不仅仅是一种解决交易信任机制的技术, 更是一种解决争端和达成共识的重要手段, 甚至可以称之为区块链思维[7].

      从专业术语的潜层语义分析(Latent sematic analysis, LSA)角度看[8-9], 比特币和区块链无疑是两个语义高度相关的同义词; 尽管比特币可能更多出现于货币、金融和经济领域的研究文献, 而区块链则更多在计算机科学领域出现.假如把区块链和比特币当成一个整体, 可以认为比特币本质上是区块链技术基础之上的一个重要应用, 而区块链技术本身则具有更广阔的应用前景.当然, 区块链也存在一定的负面影响.搭建在区块链之上的加密货币, 例如比特币就曾经被一些不法使用者用来购买一些违禁药品和毒品, 较早支持比特币在线支付交易的境外著名电子商务网站Silk Road就因为涉嫌非法交易毒品和其他违禁药品被美国联邦调查局查封[10].但是, 由此而将负面影响全部归结为区块链技术和比特币或许还需要进一步探讨.

      无论是加密货币、数字货币或者虚拟货币, 都是互联网经济发展的一个自然衍生物, 并且对传统中心化的记账和信用鉴权体系、交易和支付系统、甚至金融系统都存在一定的颠覆式创新效应.因此, 以比特币为代表的数字货币给传统的金融和货币监管体系带来了新的挑战和新的激励[11].尽管2009年1月中本聪才挖出了第一个比特币, 但是2012年以来, 比特币的数量增长较快, 而且随着投资价值的逐步涌现, 比特币开始吸引一些投机性资金的介入, 并且由于其严格的交易匿名性和网络信息加密机制, 可能也会在一段时期内产生类似金融泡沫的风险[12].

      根据2013年夏天修订的牛津英语大词典, Bitcoin和bitcoin因为首字母的大小写不同而存在显著性差异, 大写字母开头的Bitcoin一般代表一种加密货币的网络协议, 而bitcoin则是加密货币的一个单位, 即一个比特币[13].因此, 比特币既代表典型技术层面的网络协议, 又代表经济和金融领域的数字货币, 具有典型的语义二元性特征.尽管比特币代表一种数字货币或者加密货币协议, 但是目前区块链本身和工作量证明机制也存在一定的局限性, 例如比特币目前的开采(发行)难度呈现出指数级增长, 即当前单个人和单台普通电脑成功挖出比特币的概率几乎为零, 而且随着参与机器数量和计算性能的增加, 最终可能导致开采成本超过比特币本身的价值, 这也是当前比特币和其他替代数字货币面临的挑战[14].此外, 在并行交易量和并行计算吞吐能力方面, 比特币等数字货币尚未具备全球范围内大规模应用的条件.但是, 区块链作为一种重要网络共识系统的原型, 开始得到更多相关研究者的关注, 并且其开采(发行)难度控制机制也得到了进一步的探讨[15].

    • 针对一个新兴研究主题知识结构(Intellectual structure)的分析具有积极意义, 对于该新兴领域或者主题的知识扩散, 促进学科交叉和更多研究者参与相关领域的讨论和研究具有一定的参考价值.一般而言, 传统文献计量方法中的共被引分析(Co-citation), 共词分析(Co-word)和耦合聚类分析(Bibliographic coupling)等都可以用于对某个研究主题的知识结构分析[16-17].严格来说, 知识结构本身也是一个模糊概念, 其内涵和外延依然存在一定的争议, 但是可以认为某个研究主题的知识结构存在多个不同的维度, 因此通过不同的分析视角(维度)都可以部分揭示该主题知识结构, 对于探索该研究主题的研究者而言都具有一定的借鉴和参考意义[18].

      聚类分析是文献计量分析中常见的方法, 主要是由于聚类分析可以采取无监督学习模式, 通过设定一定的距离、相似度公式和聚类迭代阈值, 就可以对文献数据进行分析.一般而言, 共被引聚类分析采用的距离公式有余弦(Cosine)和杰卡德(Jaccard)距离等, 如式(1) 和式(2) 所示.

      \begin{align} &{\rm Cosin}(X, Y)=\frac{\sum\limits_{i=1}^n{(X_i\times Y_i)}} {\sqrt{\sum\limits_{i=1}^n{(X_i)^2}}+\sqrt{\sum\limits_{i=1}^n{(Y_i)^2}}} \end{align} (1)
      \begin{align} &{\rm Jaccard}(X, Y)=\frac{|X\bigcap Y|}{|X\bigcup Y|} \end{align} (2)

      如果说式(1) 和(2) 代表了通用的相似度计算公式, 如何构建两个待比较的文本向量则是文献聚类分析的核心, 经典的算法有TF-IDF (Term frequency-inverse document frequency)及其各类改进和加权算法, 其中TF表示某个具体词或者词组在文献中出现的频率, 如式(3) 所示, 而IDF则可以过滤一些通用词, 如式(4) 所示.

      \begin{align} &{tf}_{i, j}=\frac{n_{i, j}}{\sum\limits_{k=1}^j{n_{k, i}}} \\ \end{align} (3)
      \begin{align} &{ idf}_i=\log\frac{|D|}{1+|\{j: t_i\subseteqq d_j|} \end{align} (4)

      在式(3) 中, $n_{i, j}$表示第i个词(Term)在第j个文档(Document)中出现的频次, $\sum_{k=1}^j{n_{k, i}}$代表第j个文档中所有词出现的频次累计.式(4) 中, $|D|$代表当前语料库中所有文档数量, $|\{j: t_i\subseteqq d_j|$表示包含第i个词的文档数量, 因为$|\{j: t_i\subseteqq d_j|$理论上可能为零, 所以作加1处理.在实际处理过程中, 还需要考虑进行权重, 例如根据应删除(Stopwords)列表对这些词的权重赋零等处理.考虑到共被引网络的节点数和连边数都较多, 导致网络规模较大, 常规的网络拓扑和聚类算法的时间复杂度较高, 因此还可以考虑采用BH (Barnes-hut)多核聚类方法, BH方法的时间复杂度只有O$(n \log n)$[19-20].

      考虑到当前的文献计量工具(例如CiteSpacet和HistCite等软件)均支持较为完善的文献聚类算法和科学图谱功能[21], 因此采用文献计量工具CiteSpace进行相关的辅助分析.然而, 相关文献的检索和数据采集依然需要进行系统化的考虑和进行多次文献检索实验, 以及相关的文献摘要阅读和筛选.

    • 文献检索和数据采集是科学计量的重要基础性工作.理论上说, 随着学科交叉和会聚(Convergence)趋势的出现, 很难有一种基于逻辑运算的组合检索式可以找到相关主题的全部文献[22-23].此外, 基于LDA (Latent dirichlet allocation)为代表的主题(Topic)和关键词(Key words)的概率分布模型也让传统的信息检索面临一定的挑战[24].但是, 传统的组合检索式依然是信息检索领域较为高效的手段和工具之一.一般而言, 基于主题关键词的组合检索式需要征询领域专家的意见, 以及一些定量化的分析手段, 例如采取简单检索方式产生一批样本文献, 然后通过关键词的共现网络分析提取出同义词集合, 同时还要考虑剔除一些通用关键词, 最大程度保留特征词.基于Web of Science数据库, 检索时间为2016年8月31日, 得到如下检索实验结果, 如表 1所示.

      表 1  不同组合检索式实验结果一览表

      Table 1.  The different experiments of literature retrieving

      序号组合检索式文献数量文献类型分布
      1TS = (“blockchain*”)索引= SCI-EXPANDED, SSCI, CPCI-S,30会议论文: 21
      CPCI-SSH, CCR-EXPANDED, IC时间跨度= 1986~2016期刊论文: 2
      2TS = (“blockchain*”) NOT TS = (“bitcoin*”)索引=4会议论文: 2
      SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,期刊论文: 2
      CCR-EXPANDED, IC时间跨度= 1986~2016
      3TS = (“blockchain*” OR “bitcoin*” OR “proof of work” OR264会议论文: 158
      “Ethereum*” OR “crypto-currenc*” OR “digital currenc*”)期刊论文: 70
      索引= SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,
      CCR-EXPANDED, IC时间跨度= 1986~2016
      4TS = (“bitcoin*” OR “proof of work” OR “Ethereum*”234会议论文: 137
      OR “crypto-currenc*” OR “digital currenc*”)期刊论文: 68
      NOT TS = “blockchain*”
      索引= SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,
      CCR-EXPANDED, IC时间跨度= 1986~2016
      5TS = (“blockchain*” OR ”bitcoin*” OR ”proof of work”221会议论文: 158
      OR “Ethereum*” OR ”crypto-currenc*”期刊论文: 70
      OR “digital currenc*”)
      精炼依据:文献类型: (PROCEEDINGS PAPER OR ARTICLE)
      索引= SCI-EXPANDED, SSCI, CPCI-S, CPCI-SSH,
      CCR-EXPANDED, IC时间跨度= 1986~2016

      表 1的检索式主要参考了维基百科, 2013版的牛津英语大词典以及文献[1, 3]的部分表述内容.从表 1的信息检索实验来看, 当前相关文献中, 会议论文比重较大; 考虑到期刊论文出版时间存在滞后, 因此可以预见, 未来2~3年相关研究论文会出现较大增长.在对比了表 1中的5个检索结果, 笔者决定采用第5个文献集作为实证研究的数据基础.通过对第5个文献集221篇文献采取人工摘要阅读的方式进行数据过滤和噪声检测, 最终发现其中有一篇关于Proof of Work的论文实际上是研究职业健康问题, 与区块链和比特币的主题显著不相符, 其他220篇文献全部符合主题, 这也从一个侧面反映了检索实验的准确性.当然, 也不能完全排除由于作者个人阅读偏好和知识背景所带来的判断偏差.

      当然, 对于表 1中列出的5种组合检索式还存在一定的优化空间, 而且随着区块链和比特币相关主题的发展, 也一定会涌现出新的术语和关键词, 但是通过摘要阅读还是基本可以保障所检索文献的相关性, 当然也可能存在个人判断偏好产生的误差.

    • 针对220篇与区块链和比特币高度相关的文献, 可以发现当前主要的研究群体集中在美国和英国(英格兰为主)等欧美发达国家, 如表 2所示, 文献的类型分布则如表 3所示.

      表 2  文献占比最高的前5个国家(地区)

      Table 2.  Top 5 countries or territories of the literature proportion

      国家论文数量占比(%)4
      美国6328.644
      英国2310.454
      德国219.554
      瑞士104.554
      印度94.094
      中国94.094
      西班牙94.094

      表 3  文献占比最高的前10个科目(Category of WOS)

      Table 3.  Top 10 categories of WOS ordered by the proportion of literature

      WOS的科目论文数量占比(%)学科方向
      Computer science theory methods11351.36计算机科学
      Computer science information systems9342.27计算机科学
      Computer science interdisciplinary applications3917.73计算机科学
      Engineering electrical electronic2913.18工程(电气)
      Computer science software engineering2812.73工程(软件)
      Computer science hardware architecture2511.36计算机科学
      Economics156.82经济学
      Computer science artificial intelligence125.46计算机科学
      Telecommunications125.46通信
      Business finance115.00金融
      Multidisciplinary sciences94.09综合

      表 2中可以看到, 美国和英国、德国的发文占比远远高于其他国家, 显示在这三个地区研究区块链和比特币的活动相对更为活跃, 瑞士、印度、中国和西班牙占据了第二梯队, 但是与前三名国家的数量差距显著.

      表 3中可以发现, 在这220篇相关文献中占比最大的是计算机科学相关领域, 其次是工程、经济学、通信和金融领域.因此, 当前有关区块链的研究更多还是基于技术和工程视角, 而作为区块链的一个应用产品---比特币则得到了部分经济和金融领域研究人员的关注.此外, 区块链在商业管理领域有4篇, 运作管理和自动控制系统各只有3篇相关文献; 显然, 当前区块链与运作管理、自动化系统的结合还处于起步阶段, 大部分交叉研究领域基本处于空白.

      此外, 从发文的时间序列看, 2013年是个拐点, 区块链和比特币相关文献自2013年以来呈现出突破式增长, 如图 1所示, 而且2014和2015两年的文献占比接近总文献数的70 %, 达到了153篇.

      图  1  区块链和比特币相关主题文献的时间序列分析(1999~2015)

      Figure 1.  The time series of the related literature to blockchain and bitcoin (1999~2015)

      图 1可以看出, 自从中本聪在2008年11月提出了基于区块链技术的比特币协议, 并且于2009年1月发行第一枚比特币开始, 大约经历了3年的静默期.在2013年迎来了学术界的重视, 并且在2014和2015两年, 相关出版物出现了爆发式增长, 尽管会议论文占比相对较高, 但是可以预见未来几年相关期刊论文也会出现较大幅度增长.

    • 共被引聚类分析主要是针对主要相关文献的引文网络特征进行分析, 通过引入聚类手段可以部分呈现共被引文献的主题, 进一步阅读这些关键文献, 可以大致推断出该主题文献的主要知识基础(Intel-lectual base)[21, 25].通过借助较为流行的文献计量工具CiteSpace, 并选择余弦相似度函数和TF-IDF、极大似然估计等文本处理方法, 得到的共被引网络如图 2所示, 聚类输出的主要簇如表 4所示.

      图  2  基于CiteSpace的共被引网络图(中心节点度排序)

      Figure 2.  Co-citation networking based on CiteSpace

      表 4  共引网络聚类的文献规模前10的簇

      Table 4.  Top 10 clusters ordered by size in co-citation clustering

      ID文献数量轮廓系数主题(Log-likelihood ration, LLR)主题(TF-IDF加权)
      0670.823mining pool; bitcoin ecosystem;rational zero; bitcoins
      bitcoin protocol
      1410.962client puzzle; dos attack;denial; cryptography
      computational power
      2371.000set-up assumption; unified framework;a unified framework for concurrent
      concurrent secure computation-bothsecurity:universal composability
      from stand-alone non-malleability
      3340.999transaction prefixe;the case for public work
      human behaviour offer;
      empirical inquiry
      4320.976storage complexity;difficulty notions;
      constructing peer-to-peer system;storage complexity
      storage-enforcing commitment scheme
      5280.965effective method; rejection notice;spam-combating system
      compromising party
      7240.998hidden internet service;silk road
      silk road; online media
      6240.982potential attack; several month;proof-of-work
      advanced bot
      9230.957transaction prefixe;fairnet -how to counter free riding
      human behaviour offer;in peer-to-peer data structures
      empirical inquiry
      8230.937bread pudding protocol;application; work
      security protocol;
      untrusted computational device
      10221.000business process; security intent;secure business process modelling;
      business process expertSOA system
      11211.000electronic payment system;multi-analyses electronic
      broad classes;payment system
      encryption method

      图 2中采取了基于中心度的排序方法, 主要是为了突出在共被引网络中一些共被引频次较低, 但是可能对网络结构和知识流动较为重要的文献节点.共被引聚类分析在迭代次数30 000次的情况下, 总共得到了34个簇, 表 4列出了文献规模最大的10个共被引簇, 共被引频次前10的论文如表 5所示.

      表 5  图 2中共被引频次(Frequency of co-citation)最高的10篇文献

      Table 5.  Top 10 articles with high frequency of co-citation in Fig. 2

      序号论文频次
      1Nakamoto S. Bitcoin:a peer-to-peer electronic cash system [Online],62
      available:https: //bitcoin.org/bitcoin.pdf, 2008.
      2Ron D. Shamir A. Quantitative Analysis of the Full Bitcoin Transaction Graph.24
      LNCS, 2013, vol. 7859(3-4): 6-24.
      3Reid F, Harrigan M. An Analysis of Anonymity in the Bitcoin System.23
      IEEE Third International Conference on Privacy, 2013, vol.1, 1318-1326.
      4Barber S, Boyen X, Shi E, et al. Bitter to Better — How to Make Bitcoin a Better23
      Currency, LNCS, 2012, 7397: 399-414.
      5Meiklejohn S, Pomarole M, Jordan G, et al. A fistful of bitcoins:characterizing payments22
      among men with no names. Proceedings of the ACM Conference on Internet Measurement
      Conference, 2013, vol. 1, 127-140.
      6Ober M, Katzenbeisser S, Hamacher K. Structure and Anonymity of the Bitcoin17
      Transaction Graph. Future Internet, 2013, 5(2): 237-250.
      7Androulaki E, Karame G, Roeschlin M, et al. Evaluating User Privacy in Bitcoin.16
      LNCS, 2013, 7859: 34-51.
      8Moore T, Christin N. Beware the Middleman:Empirical Analysis of Bitcoin-Exchange14
      Risk. LNCS, 2013, 7859: 25-33.
      9Miers I, Garman C, Green M, Rubin AD. Zerocoin:Anonymous Distributed E-Cash10
      from Bitcoin. Security and Privacy, 2013: 397-411.
      10Christin N. Traveling the silk road:a measurement analysis of a large anonymous online10
      marketplace. International Conference on World Wide Web, 2012, 2(3): 293-304.

      表 4可以看出, 当前与区块链和比特币较为相关的知识基础包括有限理性、比特币协议、信息加密、并发的安全计算、存储复杂性、交易隐匿性、工作量证明机制、拒绝服务攻击和对等网络技术等.其中轮廓系数(Silhouette coefficient)是K-mean和K-medoids等聚类方法常见的评价指标, 其主要工作原理如下:

      给定一个数据集合$DS$, 任意一个数据元素i应该与簇(Cluster)内其他成员的平均距离$a(i)$保持足够小, 而与其他簇内成员的最短平均距离$b(i)$则尽可能大, 如果所有的元素都满足这个要求, 则聚类之间的边界清晰, 聚类效果良好, 而轮廓系数$s(i)$就是用来衡量这种效果的参数, 显然$s(i)$是$a(i)$和$b(i)$的函数, 具体计算为[26]

      \begin{align} S(i)= \begin{cases} 1 - \dfrac{a(i)}{b(i)},&\mbox{若}\ a(i)< b(i) \\[3mm] 0, &\mbox{若}\ a(i)=b(i) \\[3mm] \dfrac {b(i)}{a(i)}-1,&\mbox{若}\ a(i) > b(i) \end{cases} \end{align} (5)

      根据式(5), 轮廓系数的取值范围为$[-1, 1]$, 并且越靠近1, 表明该簇的轮廓更加清晰, 聚类效果显著.此外, 图 2采取了基于中心节点度的排序方式, 主要是为了突出在图 2中具有更加显著意义的研究者.作者共被引网络属于一种典型的社会网络, 在传统的社会网络分析中, 一般认为具有中心性更高的节点往往对于整个社会网络的连通性和知识流动性具有更加重要的作用, 而PageRank排序则可以部分反映该作者在网络中的影响力[27-29].

    • 针对知识结构中研究前沿文献的研究依然是一个存在争议的问题, 因为相对知识基础, 研究前沿(Research front)是一个更加动态的概念.例如, 有部分学者认为文献耦合网络中的中心节点度较高文献属于较为前沿的文献[30].但是, 一些新兴研究, 尤其是一些交叉研究可能并不在网络的主干节点上, 因此基于中心节点度的判断似乎也不够全面.有研究者基于关联规则挖掘, 结合主题关键词和突现词之间的潜在耦合关系, 提出了一种新的研究前沿探测方法[31].

      图 3中, 基于极大似然估计-LLR的主题聚类分析可以看到一些新兴研究领域, 例如基于区块链的碳排放交易策略以及可再生能源交易平台等, 聚类输出的主要簇如表 6所示. 图 3中节点中心度前10的关键文献如表 7所示.

      图  3  基于CiteSpace的相关文献耦合聚类分析

      Figure 3.  Bibliographic coupling analysis based on CiteSpace

      表 6  相关文献的耦合聚类分析结果表(文献规模排名前5)

      Table 6.  Top 5 clusters of bibliographic coupling analysis

      ID文献数量轮廓系数主题(Log-likelihood ration, LLR)主题(TF-IDF加权)
      0210.984carbon emission;trading infrastructure model | bitcoins
      cryptocurrency system;
      using p2p network traffic
      1200.991renewable energy;empirical analysis | bitcoin network
      smart grid;
      difficulty control
      2180.97bitcoin-based transaction rating system;weird trick
      peer-to-peer affine commitment;
      algorithmic trading
      3170.935bitcoin ecosystem;empirical analysis | bitcoins
      conjoint analysis;
      future online banking service
      4170.972adaptive identity management;cloudlet-based multi-lateral resource
      certified bitcoin;exchange framework | bitcoin
      making puzzle
      5150.979virtual currencies;denial
      new phenomenon;
      financial market

      表 7  图 3中文献节点中心性(Centrality of node)最高的10篇文献

      Table 7.  Top 10 articles with high centrality in Fig. 3

      序号论文中心性
      1Donet JAD, Pérez-Solà C, Herrera-Joancomar J. The Bitcoin P2P Network. The Workshop1.12
      on Bitcoin Research, 2014, 8438: 87$-$102.
      2Wang LQ, Liu Y. Exploring Miner Evolution in Bitcoin Network. LNCS, 2015,0.87
      8995:290$-$302.
      3Ron D, Shamir A.How Did Dread Pirate Roberts Acquire and Protect his Bitcoin0.8
      Wealth? LNCS, 2014, 8438:3$-$15.
      4Dev JA. Bitcoin mining acceleration and performance quantification. IEEE 27th Canadian0.6
      Conference on Electrical and Computer Engineering (CCECE), 2014, vol.1, 1$-$6.
      5Bamert T, Decker C, Elsen L, et al. Have a Snack, Pay with Bitcoins. IEEE Thirteenth0.51
      International Conference on Peer-to-peer Computing, 2013, 19(17): 1$-$5.
      6Meiklejohn S, Orlandi C. Privacy-Enhancing Overlays in Bitcoin. LNCS, 2015,0.49
      8976:127$-$141.
      7Herrera-Joancomarti J. Research and Challenges on Bitcoin Anonymity. LNCS, 2015,0.36
      9229:163$-$180.
      8Novak M, Skalak P. Virtual currencies. International Scientific Conference on Knowledge0.34
      for Market Use ---Women in Business in the Past and Present, 2015, vol. 1, 880$-$887.
      9Vasek, Marie, Moore, Tyler. There$'$s No Free Lunch, Even Using Bitcoin:Tracking the0.33
      Popularity and Profits of Virtual Currency Scams. LNCS, 2015, 8975:44$-$61.
      10Sapuric S, Kokkinaki A. Bitcoin Is Volatile! Isn$'$t that Right? Lecture Notes in Business0.19
      Information Processing, 2014, 183:255$-$265.

      表 6的分析结果是传统文献耦合分析基础上的K-mean聚类结果.从轮廓系数看, 聚类的效果较好, 而且规模前5的6个聚类的文献数量达到了总数的49 %, 具有一定的代表性.聚类结果也部分反映出基于区块链和比特币的原始框架已经开始产生一些跨学科的交叉研究, 例如基于区块链的碳排放交易机制和可再生能源交易机制等.这些新兴交叉研究领域的出现也部分显示出区块链架构和比特币协议存在较为广阔的应用前景.而且在碳排放交易和可再生能源市场, 与区块链和比特币相关的研究也只是刚刚起步, 但也指出了一个新的研究方向.

    • 主题词共现分析可以用来对语义相似度进行一定程度的检验[18, 32].引入主题词共现分析的原因有两个: 1) 可以呈现区块链和比特币高度相关的主题词. 2) 可以部分验证本文所采用的检索式是否科学合理, 可以认为是对本文信息检索式的稳健性检验.相关文献关键词的共现分析(Co-occurrence analysis)如图 4所示.

      图  4  基于CiteSpace的相关文献关键词共现分析(语义相似度分析)

      Figure 4.  Co-occurrence analysis of the relevant literature based on CiteSpace

      图 4可以看出, 与区块链和比特语义高度相关的共现词包括加密货币、工作量证明机制、网络安全和虚拟货币等.其中, 关键词共现频次和节点中心性排名前10的关键词如表 8所示.

      表 8  共现频次和节点中心性排名前10的关键词

      Table 8.  Top 10 keywords ordered by frequency of co-occurrence and centrality

      序号共现频次节点中心性关键词序号节点中心性共现频次关键词
      1750.62bitcoin10.6275bitcoin
      2230.5cryptocurrency20.523cryptocurrency
      3140.38proof-of-work30.4111money
      4130.3security40.3814proof-of-work
      5110.41money50.313security
      6100.22digital; currency60.2210digital currency
      780.1anonymity70.215attack
      870.06blockchain80.162e cash
      870.02virtual; currency90.151financial; investment
      960.12privacy100.143silk road
      960.03cryptography100.141money laundering
      1050.21attack

      一般而言, 共词分析中的共现(Co-occurrence)频次可以部分反映出该术语在网络中的影响力(Impact), 中心性指标可以反映出该术语在网络知识共享和流动中的中介作用[33-34].从表 8可以看出, 高频关键词包括加密货币、工作量证明机制、数字货币、隐匿性、虚拟货币、加密理论和网络攻击等; 节点中心性较高的关键词包括电子现金、金融投资、非法药品交易(Silk road)和洗钱等.此外, 关键词的共现分析也可以从一个侧面显示本文所选择的组合检索式, 以及基于语义相似度的信息检索方式基本合理.

    • 区块链和比特币无疑是当前较为热点的研究主题之一.但是, 通过本文的文献计量发现, 在当前的学术研究活动中, 区块链依然是比特币的一个衍生或者关联概念.如果将比特币排除在检索式之外, 在WOS中只能找到4篇相关文献, 即使在SCOPUS数据库中也只能检索不到20篇相关文献.

      通过关键词的共现分析可以看出, 区块链与比特币的文献语义存在高度相关性.当前针对区块链和比特币相关主题的研究文献主要集中在近3年, 而且会议论文占比为72 %, 期刊论文比例相对偏低.通过对WOS数据库中1986年以来的220篇相关文献进行文献计量分析, 可以发现区块链与比特币相关主题研究主要还是集中在计算机科学领域, 而金融和经济领域占比相对较低, 运作管理、自动控制系统、能源与可持续发展等新兴领域目前还处于起步阶段.

      通过共被引聚类分析可以发现:信息加密、并发的安全计算、存储复杂性、交易隐匿性、工作量证明机制、拒绝服务攻击和对等网络等是区块链与比特币相关主题的重要知识基础.而在基于文献耦合聚类分析中, 可以发现当前区块链的概念已经开始扩散到其他学科领域, 并且呈现出较快的文献增长趋势.从表 6的聚类分析结果可以看出, 针对区块链和比特币应用拓展的研究已经成为一个主流方向, 其中区块链和比特币相关概念在碳排放交易和可再生能源市场领域的交叉研究已经形成了一定的局部热点效应, 并且是当前较为新兴的两个主题.这恰恰反映出区块链技术和比特币的概念具有较强的学科渗透性, 甚至可以扩散到可再生能源和碳排放交易领域[35-36].

      本文也存在一定的局限性: 1) 国内外目前针对区块链和比特币的科技文献计量分析基本为空白, 如何选择合适的主题词簇(Term clump)本身就可能存在一定争议; 2) 本文选择的数据集来源于Web of Science, 也可能需要进一步与来自SCOPUS以及谷歌学术的文献数据进行对比分析; 3) 在分析知识网络中的作者影响力方面, 还可以引入节点的Betweenness和PageRank[27]等指标进一步深入分析.

      总体而言, 本文借助文献计量分析的主流方法探讨了区块链和比特币相关主题的知识结构问题, 分别基于共被引聚类分析部分呈现了相关主题的知识基础, 基于耦合聚类分析和关键词共现分析部分捕捉了当前区块链和比特币的研究前沿.但是, 无论是知识结构, 还是知识基础和研究前沿都是一个动态演化的文献计量概念, 都需要在未来一段时间内进行进一步的深入探索.

参考文献 (36)

目录

    /

    返回文章
    返回