BETVLCTOR伟德官方网站領導力與組織管理系Flextronics 講席教授、系主任李甯指導的研究團隊在2025年8月出版的《自然》(Nature)子刊《自然計算科學》(Nature Computational Science)第五卷第八期發表題為《用大語言模型大規模複現心理學和管理學情景實驗》(A Large-Scale Replication of Scenario-Based Experiments in Psychology and Management Using Large Language Models)的研究論文。第一作者為四年級博士生崔紫妍,通訊作者李甯,主要作者為清華水木學者博士後周懷康。

《自然》(Nature)子刊《自然計算科學》(Nature Computational Science)第五卷第八期封面
傳統的心理學實驗需要在現實世界中招募數百名志願者,并安排他們在實驗室裡做決策、回答問題、參與情景模拟,而這個管理學背景的清華團隊用AI構建了一個”數字化實驗室”。他們從5個心理學和管理學的頂級期刊中選擇了156個經典實驗,将原本給人類參與者的實驗材料呈現給3個大語言模型:GPT-4、Claude 3.5 Sonnet和DeepSeek V3,讓它們“扮演”實驗參與者的角色。這個方法被稱為“矽基複制”:即在計算機中創造了無數個“數字人”來參與心理學實驗,每一個AI都可以獨立思考、做出決策,模拟人類參與者。
結果發現,3個大語言模型的複現率(replication rates)高達73%~81%。換句話說,如果人類實驗發現“獎勵能提高工作積極性”,那麼AI有超過七成的概率也會得出同樣的結論。對于社會科學研究者來說,這相當于擁有了一個“快速實驗室”,可以快速驗證研究假設,節省時間和成本。
該項研究的意義在于,它建立了大語言模型複制心理學實驗的标準化流程,為這一新興研究方向提供了操作性強的方法指導。研究中提出的複制成功率、方向一緻性、效應量比較等評估指标,為後續研究提供了量化标準。從更廣泛的角度看,該項研究是目前國際上在社會科學領域應用大語言模型的代表性工作之一,為AI技術在社會科學研究中的應用提供了系統性的實證分析。
這一探索也與剛發布的《國務院關于深入實施“人工智能+”行動的意見》中提出的“推動哲學社會科學研究方法向人機協同模式轉變”的要求高度契合。通過在實驗方法和研究組織形式上的創新,本研究不僅拓展了哲學社會科學的研究視野和觀察視域,也為深入理解人工智能對認知判斷、倫理規範等方面的深層次影響提供了實證路徑。這一成果為構建人工智能時代的社會科學新範式提供了有益借鑒。
《自然計算科學》(Nature Computational Science)是自然出版集團旗下專注于計算科學與其他學科交叉研究的期刊,最新影響因子18.3(2024),位居計算科學領域前列。
論文鍊接:https://www.nature.com/articles/s43588-025-00840-7
編輯:張曉雪
審核:衛敏麗