2026年3月16日,suncitygroup太阳集团数字经济专硕课程《网络与平台经济学》,特邀爱丁堡大学商学院副教授汪通老师开展题为《当大语言模型遇见经济学:原理与应用》的实务课程。汪通老师授课深入浅出、语言生动,内容兼具理论深度与实践导向,为同学们系统理解人工智能与经济学的交叉领域提供了清晰框架。

文本如何成为数据:大语言模型的底层逻辑
讲座伊始,汪老师以“如何向一个从未见过披萨的人介绍披萨”为例,引出理解人工智能的两种路径:描述性理解与还原论分析,并指出:真正把握大语言模型,需要回到其底层机制进行拆解。
在原理部分,汪老师指出,大语言模型本质上是基于统计模式进行预测的概率系统,其核心问题在于如何将文本转化为可计算的数据结构。围绕这一问题,课程系统梳理了自然语言处理的发展路径:从One-hot编码、Bag-of-Words、TF-IDF等早期方法,到Word2Vec实现语义空间映射,再到Transformer模型通过自注意力机制实现对上下文关系的建模。结合金融文本情绪识别的案例,汪老师进一步说明了传统方法在处理语境和语义时的局限性,以及Transformer如何通过“全局注意”机制实现对文本含义的精确把握。
在此基础上,课程对当前主流模型路径进行了比较:以BERT为代表的编码模型强调双向理解,而以GPT为代表的生成模型通过单向预测实现文本生成。汪老师指出,尽管BERT在信息利用上更充分,但GPT路径在信息受限条件下进行预测,反而推动了模型能力的精细化与规模化发展,从机制上解释了当前大模型技术路线的演进方向。
如何与大语言模型有效对话:Prompt与推理能力
在第二部分,课程转向大语言模型的使用方法。汪老师强调,大语言模型并不能替代思考,其输出质量高度依赖于输入的清晰程度。如果研究者自身问题模糊,那么模型也难以生成高质量答案。
围绕这一点,课程系统讲解了高质量Prompt的构成要素,包括角色(role)、背景(context)、任务(task)、输入(input)与输出格式(format)。通过具体案例,汪老师展示了零样本(zero-shot)、少样本(few-shot)以及链式思维(Chain-of-Thought)等不同提示策略在复杂任务中的表现差异,并指出,在涉及多步推理的问题中,引入中间推理过程可以显著提升模型的准确性。
同时,课程还介绍了temperature与top-p等参数如何通过调节概率分布来控制模型输出的确定性与创造性,并分析了大语言模型“幻觉”现象产生的根本原因,即模型输出来源于概率分布而非真实世界的唯一答案。这一部分内容帮助同学们从机制层面理解模型输出的不确定性及其应用边界。

从对话到执行:AI智能体与工作流构建
在课程的最后部分,汪老师将视角拓展至人工智能的应用生态,提出以大语言模型为核心的“智能体”(Agent)范式。课程指出,大模型本身仅具备文本生成能力,但通过与外部工具接口(如MCP)结合,可以实现数据检索、代码执行与多步骤任务协同,从而构建自动化的研究工作流。
在这一框架下,汪老师介绍了“Vibe Coding”等新型开发方式,即通过自然语言描述需求,由AI完成技术实现,人类则负责目标设定与结果验证。课程进一步指出,在人工智能不断发展的背景下,经济学研究的分工结构正在发生变化:研究者的核心能力将从“如何实现”转向“提出什么问题、如何解释结果”,从而对组织结构与劳动分工产生深远影响。

讲座最后,汪老师强调,大语言模型为经济学研究提供了前所未有的工具,但其价值的发挥仍依赖于研究者自身的洞察力与问题意识。在人工智能快速发展的背景下,经济学学习者不仅需要掌握工具,更需要提升对问题的理解能力与批判性思维,以在技术浪潮中形成真正的研究优势。

本次讲座内容丰富、逻辑清晰,不仅加深了同学们对大语言模型原理的理解,也为其在经济学研究中的应用提供了可操作的路径,具有重要的启发意义。
撰稿人:宋思瑶
审核人:李婷,王贞