早在1969年,就有心理语言学家提出了波丽安娜假说,该假说认为人类在交际过程中,普遍更喜欢使用积极的词汇。然而,以往的研究都没能对此进行有力证明。佛蒙特大学的Peter Sheridan Dodds等人利用大数据分析,对这一假说进行了更深层次的探究。
一项对不同起
源和文化背景的10种人类语言的大数据分析表明,这些语言的常用词汇中,都是正面词汇更多,并且这种现象不受词汇使用频率的影响。研究者首先选取了起源和
文化背景不同的10种语言,包括英语、西班牙语、法语、德语、葡萄牙语、韩语、汉语(简体中文)、俄语、印尼语及阿拉伯语。在这些语言中,研究者重点关注
了那些使用频率最高的词汇。研究共使用了24个语料库,来源包括书籍、新闻报道、社交媒体、网络、电视剧和电影字幕以及歌词。分析结果显示,所有语料库中
都是积极词汇较多。
研究人员进一
步将10种语言两两配对(共45对),利用谷歌翻译找出其中意思相同的词汇,并对它们的正面程度得分进行比较。结果显示,在不同语言中,表达同一意思的词
汇得分也很一致。也就是说,对于那些研究中没有涉及的语言,可以通过参考语言中某个词汇在其他语言中对应词汇的正面程度,做出大致估计。不过,不同语言中
词汇的正面程度分布之间还是存在一些微小差异。每个词汇的正面程度得分与该词汇的使用频率无关。研究人员以语料库中使用频率排名连续的500个词汇为区
间,发现各个区间内得分的十分位数基本一致,并未受到使用频率的影响。
研究发现,拉丁美洲的语料库中(西班牙语、葡萄牙语),快乐程度的中值和其变化幅度(方差)都较大。在快乐程度的方差上,4个英语语料库都排得很靠前,而中文和俄文词语的方差则较小。(作者:李秋实)
参考文献:Proceedings of the National Academy of Sciences 2015;112:2389-2394