论文

大数据时代计算社会科学的机遇与挑战

摘要

随着大数据的兴起以及埋藏在数据矿中的大量信息和知识的积累,使用数据挖掘技术来发掘新颖、有趣、有意义的隐藏于数据中的有规律的模式变得越来越重要。这种与传统方法相辅相成的研究方式影响了所有领域,包括社会科学。大数据的兴起为发现新理论、拓展新知识提供了前所未有的机会和挑战。本文首先探讨大数据的概念,然后阐述大数据研究者面临的一系列复杂问题。计算社会科学是集信息技术、大数据、社会计算和社会科学的一个新的跨学科研究领域,研究人员在社会科学理论的指导下运作,将计算社会科学方法应用于来自自然样本的数据(通常是大数据),发现隐藏于数据中的规律,丰富社会科学经验证据,并为理论创新与知识发现做出贡献。文章最后推荐本期七篇论文,阐述它们作为推广普及大数据计算社会科学的典范及其意义,以及对迎接大数据研究复杂性的挑战的启迪。

作者

舒晓灵 ,加州大学戴维斯分校社会学系教授、东亚研究中心主任,xshu@ucdavis.edu。作者相关最新专著《社会科学中的知识发现:数据挖掘方法》(Knowledge Discovery in the Social Sciences: A Data Mining Approach)由加州大学出版社在2020年出版。
Xiaoling Shu

参考文献 查看全部 ↓
  • 段文杰、李玉梅,2020,《国民获得感:概念、测量与指数构建》,《社会学刊》第3期。
  • 龚为纲、吴天泽、郭明飞,2020,《从大数据看民粹主义在欧美的发展动态及其社会基础——基于全球舆情大数据GDELT和社交媒体大数据Twitter的分析》,《社会学刊》第3期。
  • 郝明松,2020,《因果分析中的倾向值分析和熵平衡法》,《社会学刊》第3期。
  • 秦昆、王其新、李爽、罗萍、徐源泉,2020,《计算社会科学与社会地理计算的空间交互网络分析方法》,《社会学刊》第3期。
  • 舒晓灵、陈晶晶,2017,《重新认识“数据驱动”及因果关系:知识发现图谱中的数据挖掘研究》,中国社会科学院《中国社会科学评价》“社会科学研究方法前沿”第3期。
  • 舒晓灵、朱博文,2016,《知识发现与数据挖掘在计算社会科学中的应用》,《贵州师范大学学报》(社会科学版)第6期。
  • 吴锦峰、黄荣贵、桂勇,2020,《社会公平观的网络镜像——基于2013年和2018年微博博文的语义网分析》,《社会学刊》第3期。
  • 张柏杨、贺光烨、陈云松,2020,《“一带一路”的沿线国家和地区关注度:基于互联网大数据的时空分析和影响机制探讨》,《社会学刊》第3期。
  • 赵金旭、金炜玲、孟天广,2019,《司法大数据视角下的涉性犯罪:类型与演变》,《社会学刊》第3期。
  • Atlantic. 2012. “Everything You Wanted to Know about Data Mining but Were Afraid to Ask.” by Alexander Furnas.Atlantic,April 3. https://www.theatlantic.com/technology/archive/2012/04/everything-you-wanted-to-know-about-data-mining-but-were-afraid-to-ask/255388/.
  • Bankes,Steven C. 2002. “Agent-based Modeling: Revolution?” 99 (S3): 7199-7200.
  • Dumbill,Edd. 2013. “A Revolution That Will Transform How We Live,Work,and Think: An Interview with the Author of Big Data.” 1 (2): 73-77. https://doi.org/10.1089/big.2013.0016.
  • Economist. 2017. “The World's Most Valuable Resource Is No Longer Oil,but Data.” May 6. https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data.
  • Forbes. 2015. “Data Mining Global News for Economic Uncertainty.” December 14.
  • Forbes. 2018. “Data Mining Concepts That Business People Should Know.” by Meta S. Brown. July 31. https://www.forbes.com/sites/metabrown/2018/07/31/basics-of-data-mining-that-business-people-should-know/#74504e89515f.
  • Gilbert,Nigel,Matthijs den Besten,Akos Bontovics,Bart G. W. Craenen,Federico Divina,and A. E. Eiben,Robert Griffioen,Gyorgy Hévízi,Andras Lõrincz,Ben Paechter,Stephan Schuster,Martijn C. Schut,Christian Tzolov,Paul Vogt,and Lu Yang. 2006. “Emerging Artificial Societies through Learning.” 9 (2): 9. http://jasss.soc.surrey.ac.uk/9/2/9.html.
  • Kramer,Adam,D.I.,E. Jamie,Guillory,and Jeffrey T. Hancock. 2014. “Experimental Evidence Massive-Scale Emotional Contagion through Social Networks.” 111 (24): 8788-8790.
  • Laney,Douglas. 2001. “3-D Data Management: Controlling Data Volume,Velocity and Variety.” ,6.
  • Lazer,David,Alex Pentland,Lada Adamic,Sinan Aral,Albert-László Barabási,Devon Brewer,Nicholas Christakis,Noshir Contractor,James Fowler,Myron Gutmann,Tony Jebara,Gary King,Michael Macy,Deb Roy,and Marshall Van Alstyne. 2009. “Computational Social Science.” 323 (5915): 721-723.
  • Manyika,J.,Chui M.,Brown B.,et al. 2011. McKinsey Global Institute.
  • Mason,Winter,Jennifer Wortman Vaughan,and Hanna Wallach. 2014. “Computational Social Science and Social Computing.” 95 (3): 257-260.
  • Mauro,Andrea De,Marco Greco,and Michele Grimaldi. 2016. “A Formal Definition of Big Data Based on Its Essential Features.” 65 (3): 122-135. DOI:10.1108/LR-06-2015-0061.
  • Michel,Jean-Baptiste,Yuan Kui Shen,Aviva Presser Aiden,Adain Veres,Matthew K. Gray,The Google Books Team,Joseph P. Pickett,Dale Hoiberg,Dan Clancy,Peter Norvig,Jon Orwant,Steven Pinker,Martin A Nowak,and Erez Lieberman Aiden. 2011. “Quantitative Analysis of Culture using Millions of Digitized Books.” 331: 176.
  • National Public Radio. 2016. “Big Data Coming in Faster than Biomedical Researchers Can Process It.” by Richard Harris. November 28. http://www.npr.org/sections/health-shots/2016/11/28/503035862/big-data-coming-in-faster-than-biomedical-researchers-can-process-it.
  • Shah,Nihar,B.,Sivaraman Balakrishnan,Adityanand Guntuboyina,and Martin J. Wainwright. 2017. “Stochastically Transitive Models for Pairwise Comparisons: Statistical and Computational Issues.” 63 (2): 934-959.
  • Shu,Xiaoling. 2020. . University of California Press.
  • Watts,Duncan J.2013. “Computational Social Science: Exciting Progress and Future Directions.” 43 (4): 5-10.

大数据时代计算社会科学的机遇与挑战

可试读20%内容 PDF阅读 阅读器阅览

试读已结束,剩余80%未读

¥9.26 查看全文 >

VIP免费

论文目录

  • 一 大数据时代
  • 二 大数据的复杂性与挑战性
    1. (一)理论与数据的辩证关系
    2. (二)伦理规范与个人隐私
    3. (三)数据样本
    4. (四)文本数据
  • 三 大数据时代的计算社会科学

查看更多>>>