医学与社会
2020年10月号
医学进展

Facebook、Twitter等数据信息 如何彻底改变社会科学?

作者:房南京

Elizaveta Sivak花了近十年时间成为一名社会学家,然而在研究项目中途她意识到自己还要回到学校去。

Elizaveta Sivak在俄罗斯国家研究型高等经济大学研究家庭和童年。2015年,她在一系列访谈中要求青少年讲述他们过去五天中去过的十个地方,以此来研究青少年的活动。一年以后,她分析了这些数据,但当她看到同事交给她的一篇关于哥本哈根网络研究数据的论文时,她感到非常沮丧。她知道要转变自己的研究领域了。“我意识到这些数据将永久地改变社会科学。”她说,“而且我认为这很酷。”

于是,Sivak决定学习编程,并加入这场变革中。现在,她和其他计算科学家们正在研究大量不规则的数据集,从社会数字痕迹中寻找意义。他们追踪人们的网络行为、调查数字化书籍和历史文档、解读可穿戴设备中的数据、进行在线调查和实验收集数百万个数据点,以及探索只有借助复杂数据分析才能得出有关社会秘密的庞大的数据库。

过去十年,研究人员应用这些技术挑选出社会科学家已经追逐了一个多世纪的话题:从人类道德的心理基础,到错误信息的影响,再到一些艺术家比另一些艺术家更成功的原因。一项研究揭示了为医疗信息提供决策的算法中普遍存在种族主义。另一个研究则利用移动手机数据绘制卢旺达贫困地区地图。

“最大的成就是将数字行为数据视为一种有趣和有用的信息来源。”德国科隆莱布尼茨社会科学研究所计算社会科学家Markus Strohmaier说。

并不是每一个人都接受这样的转变。一些社会科学家担心那些怀着像庞大数据集一样的雄心壮志进入这一领域的人对之前的研究还不太熟悉。另一个抱怨是一些研究人员只研究模型,不考虑原因,或者他们从不完整和混乱的数据中得出有份量的结论,这些数据通常来自社交媒体平台和缺乏数据卫生的其他来源。

不仅如此,一些来自物理和工程等领域的计算社会科学家认为,许多社会科学理论过于模糊或定义不清,无法进行测试。

这一切都相当于“社会-科学阵营内部的权力斗争”,瑞典林克平大学分析社会学家Marc Keuschnigg说,“谁最终成功了,谁都会被贴上社会科学的标签。”

但是这两大阵营开始合并。面对期刊、会议和研究项目的蓬勃发展,Keuschnigg表示,“计算社会科学与传统社会科学的交叉越来越多,并且它们之间的相互尊重也在增加。”

计算革命

2007年,一群有抱负的科学家开会讨论社会科学数据处理的新兴艺术。他们想运用自己的技能来改变世界。会议上,哈佛大学政治科学家Gary King表示,数字信息泛滥“将使人们能够更多地了解社会,并最终解决影响人类福祉的重要问题”。

到那时,少量的计算社会科学研究将会出版。2006年,有研究通过创建一个有14341人使用的人工在线音乐市场,研究社会影响对音乐流行的作用。参与者选择歌曲下载,他们有时知道有时不知道这些歌曲在其他市场用户中的流行程度。研究发现一首歌曲受欢迎程度受他人行为的影响越大就越难预测,这解释了为什么很难预测意外的成功。

两年后,一项研究分析了10万名手机用户在6个月内的活动情况,发现人们以简单重复的方式出行。研究人员可以计算在任何特定地点找到一个人的可能性,了解人们社区内出行的相似性有助于城市规划,了解疾病传播或为紧急情况做好准备。

同年,美国《连线》杂志(Wired)发表了一篇文章,认为大数据时代将意味着整个科学理论的终结。尽管被广泛批评为过于简单化,但这篇文章触动了人们的神经:十多年后,社会科学家反复引用《连线》的文章,作为社会科学理论关联性受到攻击的信号。

但大数据只会继续保持其优势。对于宾西法尼亚大学社会学家Duncan Watt来说,社会科学的变化让人想起了上世纪90年代发生在生物学领域的变革,即高通量测序技术可以产生大量有关DNA序列和基因表达的数据信息。“新的数据出现了雪崩,需要用一种非常不同的方式来思考数据。”他说。

但是,许多传统社会科学家对革命初期的成果不以为然,并且发现其中一些方法有问题。怀疑论者把对社交媒体的研究视为对数千名不知情、不自主的参与者进行的实验。2018年,有消息称,英国咨询公司Cambridge Analytica在未经其所有者同意的情况下,从数百万Facebook帐户中收集数据。丑闻的余波继续给社交媒体研究带来更多的审查和怀疑,随着平台制定新的隐私政策,一些科学家的项目受到阻碍。

社交尴尬

这一领域也被早期关于“玩具”问题的论文所玷污。这些问题可以从数据中找到答案,但没有涉及社会科学中长期存在的基本问题,例如如何解决不平等问题或影响公众舆论。

“一开始有很多关于Twitter的研究,我认为社会科学家对此并不十分兴奋。”德国科隆莱布尼茨社会科学研究所另一位计算社会科学家Claudia Wagner说。

有人认为,“玩具”问题的出现至少在一定程度上是一个年轻领域站稳脚跟的产物。 Strohmaier说,随着分析变得越来越复杂,数据来源也越来越多样化,该领域已经开始着手处理更重要的问题,例如歧视、不平等和激进的根源。他说:“直到现在,我们才获得了让我们能够审视重大问题的数据。”

去年,例如,公共卫生和行为经济学的研究人员利用美国医疗系统中5万多名患者的医疗记录分析了一种常用的算法,该算法建议对具有复杂医疗需求的人进行额外监管和健康干预。

研究小组使用模型来表明,该算法系统地歧视黑人——可能影响数百万人的护理。然后,研究人员利用美国医疗保健差异的知识来追踪这种偏见的来源,并提出消除这种偏见的方法。例如,算法不应该假设花费在个人医疗保健上的金额可以很好地代表他们需要多少护理:由于获得医疗保健的机会不平等,即使黑人有同样的医疗需求,照顾黑人的钱通常也比白人少。

但访问良好的数据并不是唯一的挑战:从物理学或计算科学转过来的科学家被指责未能检验社会科学家用来解释人类行为的理论。一位受过哲学家训练,现在是意大利国家研究委员会下属的认知科学与技术研究所的计算社会科学家Giulia Andrighetto说,“他们倾向于寻找模式,但通常情况下,他们不寻找产生这些行为的机制。”

要做到这一点,需要对社会科学理论有坚定的把握。随着计算社会科学运动的兴起,位于卡塔尔多哈的哈马德·本·哈利法大学的计算社会科学家Jisun An于2010年开始攻读计算机科学博士学位,研究社交媒体上的新闻分享。

一开始,她只和其他的计算科学家合作,他们很难将心思放在不同的社会科学理论上。现在,她与政治科学家合作,研究媒体对舆论的影响(反之亦然),以及如何鼓励人们提升其新闻来源的多样性。“随着时间的推移,双方在语言和方法上相互理解。”An说。

社交聚会

这两种方法的结合可能是强大的。西雅图华盛顿大学的数据科学家Joshua Blumenstock和他的同事利用卢旺达数百万人的手机数据推断他们的社会经济状况,然后通过将这些数据与传统调查收集到的数据进行比较来确认他们的结果。例如,决策者利用这些方法可以针对性帮助国家贫困地区,或监测已颁布政策的效果。

但缺乏沟通仍然是显而易见的。哈佛大学的社会科学家Joan Donovan指出,去年发表的一项研究中,研究人员在Facebook和VKontakte平台上绘制了一个网上仇恨组织网络,并展示了网络结构如何随时间变化。她说,进行这项研究的物理学家和计算科学家没有在他们的工作中引用关键的社会科学研究,因此,他们对自身发现并没有尽可能丰富的解释。他们调查很少的社交媒体平台,因为过去的研究显示,仇恨组织在许多领域都追随着有魅力的领导者。研究小组得出了她认为危险的结论:社交媒体平台可能试图引导仇恨群体讨论,例如通过创建虚假账户或在仇恨群体间进行内斗。她说,这可能会适得其反,因为这会增加小组讨论的数量,并提高其在搜索算法上的排名。她认为,一个更好的策略是让搜索引擎限制这类群体的可见性,从而遏制仇恨信息的传播。

仇恨研究的主要作者、乔治华盛顿大学物理学家Neil Johnson已经习惯了来自社会科学家的批评。他说自己引用了最相关的参考文献。至于搜索算法,社交媒体公司有权操纵它们,他说“就像他们现在压制反疫苗和Covid-19错误信息页面和群组那样”。他研究了错误信息、冲突和极端主义,并说每次发表一篇高调的论文时,他都会被投诉。但他的工作引起了决策者的共鸣:由于喜欢他的工作的定量性质和模型干预措施可能产生什么影响的能力,有些组织经常会请他做咨询。“我们可以用我认为他们在与其他学者的互动中没有经历过的方式来看待具体问题。”他说。Johnson则担心,太多的社会科学家在没有经过适当训练的情况下就匆忙地进入计算方法。

Johnson不是唯一一个怀疑理论对他们项目的重要性的科学家。Giangiacomo Bravo接受过社会经济学家培训,现在是瑞典林奈大学的计算社会科学家,他说,许多社会科学理论过于模糊,无法用大数据进行检验。例如,社会资本的概念有时被定义为一个社会中允许个人共同工作的共识和价值观。他说:“社会资本这个概念最初的表述过于模糊,无法检验。”

然而,有些理论更为具体。研究社会规范的Andrighetto说,研究人员花了10年时间为这个主题拼凑出清晰的定义和理论。例如,该理论认为,当社会规范发生变化时将促使人们改变对特定情况的反应。社会规范也被认为是缓慢的,并且通过密集的社会互动过程来改变。这让Andrighetto将计算工作与社会科学理论结合起来:她使用在线实验来测试模拟的社会规范变化是否会影响行为。

她并不是唯一一个想利用社会科学来改变世界的人。Watts说,他和其他学术研究人员经常追求发表文章,而不是现实世界的解决方案。“我觉得我的工作在论文发表的那一刻就完成了。”Watts说,“我的工作是把这些想法公之于众,而其他人的工作则是找出如何将它们转化为现实世界中有意义的干预措施。”

Watts说,要实现这种转变,两大阵营的研究人员必须保持合作的势头。有些人已经感觉到了。“随着时间的推移,传统社会科学和计算社会科学实际上正变得越来越接近。”Wagner说,“20年后,不会再有分歧。”(编译:房南京)

参考文献:Nature 582:328-330

Copyright 1994-2015 Cinkate.com.cn All Rights Reserved 沪ICP备10014127号-5