Nature子刊:自适应信息动力学揭示信息茧房涌现机理
Nov 21, 2023
清华大学电子系与公管学院跨学科合作,通过大规模实证研究与信息动力学理论建模,首次揭示了信息媒体上信息茧房涌现的内在机理与相变边界,为理解当下智能社会中人-智交互复杂社会系统提供了全新思路。
新一代信息与智能技术的迅猛发展推动着人类逐步迈入智能社会。在数字技术和智能推荐算法的加持下,媒体和平台总是能最快最准地契合人们的个性化偏好和需求。然而,与此同时,智能精准推荐致使信息茧房现象不断发酵,观点相似的人群在网络空间组成团体,特定价值偏好在群体中汇集放大,逐渐形成极端的观点。针对名人或社会事件的每一种极端观点都能够被利用成为意识形态渗透和影响的工具,在网络空间和现实世界中推波助澜,掀起“汹汹民意”。
然而,即便如此,我们对于信息茧房仍所知甚少:真实线上系统中的信息茧房究竟有多严重——缺乏大规模实证研究;信息茧房的形成机理是什么——缺乏基础理论支撑;如何解决信息茧房问题——缺乏行之有效的手段。
研究团队聚焦于新闻与视频两个典型场景,通过分析5.7亿用户行为数据和使用信息熵度量信息茧房严重程度,发现在一年交互后,超过57%的活跃用户均经历了不同程度的信息熵下降,并指出了其影响因素。该实证研究首次量化了真实大规模在线信息系统中信息茧房的严重程度。
(a-c)聚焦于新闻与视频两个典型场景,量化真实世界信息茧房严重程度;(d-f)相似度匹配强度、正负反馈是影响信息茧房形成的重要因素;(g)基于实证发现与推荐算法领域实践,结合随机热力学理论,提出人-智自适应信息动力学模型
研究团队基于实证结论与推荐算法领域实践,结合随机热力学理论,创造性地提出了人-智自适应信息动力学模型。该模型采用信息熵来表示用户所接触信息的多样性,并使用系统信息熵分布来表示系统所处状态。与依靠数以亿计参数的深度学习模型不同,所提出的模型仅依靠基于相似度匹配与用户反馈两个基本机制,机理性地建模了人类与推荐算法之间的关键反馈回路,并使用随机动力学方程刻画人-智复杂动力学交互过程。
系统相变图,(a-b)基于视频与新闻场景数据的三维系统相变图,(c-e)基于视频场景数据的二维系统相变图,(f-h)基于新闻场景数据的二维系统相变图
通过大规模仿真实验与理论分析,研究团队揭示了该人-智交互复杂社会系统存在多样化、部分信息茧房与深度信息茧房三种状态,并给出了系统在基于相似度推荐强度、正负反馈利用率以及自由探索强度四个关键参数驱动下的相变过程及相变边界。研究成果不仅为负责任的推荐算法设计指明了实际方向,而且为理解人-智交互复杂社会系统提供了理论工具。
该研究成果近日以“人-智自适应动力学驱动信息茧房涌现”(Human–AI adaptive dynamics drives the emergence of information cocoons)为题发表在《自然·机器智能》(Nature Machine Intelligence)上。
清华大学电子系城市科学与计算研究中心博士生朴景华与博士后刘家臻为论文共同第一作者,李勇副教授为通信作者;清华公管学院张芳助理教授、苏竣教授为共同作者。该研究得到科技创新2030-“新一代人工智能”重大项目与自然科学基金项目的支持。
论文链接:
https://www.nature.com/articles/s42256-023-00731-4