2025年11月1日,由中国人民大学中华文明研究院、中国人民大学历史学院、中国人民大学数字人文研究院联合主办,中国人民大学民国史研究院、中国人民大学数字清史实验室协办的“智识重构:AI驱动下的数字人文与中国近现代史研究新范式”学术研讨会在中国人民大学通州校区举行。来自国内各大高校、科研院所、博物学界、出版界、期刊界及有关科技企业的70余位专家学者与会,围绕数字人文及中国近代史研究新范式展开深入探讨。
主题演讲环节由三个部分组成。主题演讲第一部分聚焦“智能体与中国近现代史研究”,由王涛(南京大学历史学院)主持。
朱本军(北京大学图书馆)介绍了“晚清民国书报刊整理OCR模型”,提出构建AI驱动下的“汉语文献统一智慧整理平台”,以赋能历史文献整理、推动范式革新。马思宇(南京大学历史学院)通过阐释中共党史研究中智能体的构建逻辑和实际应用,详细介绍了现阶段智能体开发的具体功能与成效。金伯文(南京大学历史学院)围绕大语言模型在历史研究的应用,介绍“南京大学数智文献处理平台”的开发思路与实践进展。张光伟(陕西师范大学历史文化学院)以“《盛宣怀档案》智能分析系统”为例,深入探讨AI时代历史语料库的范式转型及历史学家的角色升级。张明月(抖音集团企业社会责任部)介绍“识典古籍”数字化平台在古籍保护与活化工作中所做的努力,进而提出“实体保护、数字化、活化”的古籍保护理念。王娟(腾讯云计算(北京)有限责任公司)从AI甲骨文、云游敦煌、数字人技术等案例出发,阐释了大语言模型在人文研究中的应用场景与前景。

主题发言
主题演讲第二部分着眼于“新一代中国近现代历史文献数据库开发”,由梁继红(中国人民大学信息资源管理学院)主持。
罗敏(北京大学历史学系)介绍了“抗战文献数据平台”的缘起与现状,并对AI时代抗战文献数据平台的发展方向提出展望。朱翠萍(中华书局古联公司)分享“《复兴文库》数据库”以民族复兴为主题,以思想史为线索,坚守零差错整理原则和多维度的史学价值。杨敏(上海图书馆)重点展示了“《全国报刊索引》数据库”借助大模型技术推出智能助手、提升读者搜索效率与阅览体验的创新实践。王涛(国家图书馆出版社)介绍“中国历史文献总库”的发展情况,提出以“开放、融合、智能”的核心理念,助力构建可持续扩展的历史文献共享平台。周月峰(四川大学历史文化学院)汇报“近现代日记数据库”的建设成果,并对数据库未来的发展进行展望。贾翠玲(延安大学图书馆)介绍“新民主主义革命时期中共中央机关报数字化”在思政教育、学科建设等方面的价值。杨建梁(中国人民大学信息资源管理学院)介绍中国人民大学“中国红色文献档案资源库”的项目进展,详细阐述特色资源建设与“燎原大模型”智能工具的协同架构。张燚明(中国人民大学历史学院)论述建设“文史资料全文数据库”的必要性,并展望了该数据库的实践路径。
主题演讲第三部分围绕“数字人文的教学实践”展开,由张燚明(中国人民大学历史学院)主持。
王龙飞(华中师范大学历史文化学院)提出将华中师范大学数字史学中心打造为推动历史学研究与教学范式革新的学科交叉平台。许可(华东师范大学中文系)从华东师范大学古文字强基班的教学实践着手,进一步说明如何利用数据库、虚拟平台等新技术推动“冷门绝学”代有传承。

会议现场
本次会议共设置六场分组讨论,23篇论文依次报告。
首场分组讨论由袁晓如(北京大学智能学院)主持,严程(清华大学人文学院)、战蓓蓓(湖南大学岳麓书院)等担任与谈人。
陈镱文(西北大学科学史高等研究院)系统介绍“近代东亚数学知识传播数据库”,强调数据集构建需紧密结合历史语境。邱伟云(南京大学历史学院暨学衡研究院)将稀疏自编码器(SAE)引入中国近代概念史研究,以《新青年》中“个人”概念为例演示人机互释的实现路径。林莹(同济大学人文学院)依托机器学习技术比对古典小说图像特征,进一步推断《三国演义》《西游记》在东南亚的版本流变与传播路径。袁晓如(北京大学智能学院)、严程(清华大学人文学院)、战蓓蓓(湖南大学岳麓书院)等学者对上述报告的研究方法提出完善建议,并共同探讨了数字人文学科的发展方向。
第二场讨论由刘越(《中国社会科学报》)主持,林展(中国人民大学清史研究所)点评。
赵崧杰与叶阳(华东师范大学历史学系)从《澳门档案》的整理研究切入,由澳门历史研究中的多语种文献现状入手,分析基于BERT模型的历史文献人工智能解决方案。陈俊(中国人民大学清史研究所)详细梳理《中枢备览》的史料价值,量化分析清代绿营与八旗武官的任职差异。杨泽坤与陈超(中国人民大学信息资源管理学院)选取清代松江府女性作家为研究对象,构建时间序列计量模型验证棉业镇市对清代女性文学发展的正向影响。高帅奇(华中师范大学中国近代史研究所)运用“缙绅录数据库”考察清代河道官员迁转路径,进而反思清代国家治理的局限。评议人林展(中国人民大学清史研究所)在肯定上述报告学术价值的同时,从技术方法优化、研究内容拓展与跨学科融合等角度提出针对性建议。
第三场讨论由吴文浩(武汉大学历史学院)主持,薛勤(华中师范大学马克思主义学院)点评。
岳文玉(中共福建省委党校)基于党史知识图谱的创新探索,为党史研究的数字化转型提供重要参考。孙雅馨(北京大学图书馆)以北京大学图书馆特藏文献为例,提出革命文献智能化建设的开放设想。李磊(南京大学历史学院)讨论数智时代对党史研究范式、方法与史料处理方式的系统性重塑,强调“数字认知”与“历史认知”双向验证的必要性。刘俊晖(中国人民大学历史学院)运用社会网络方法分析蒋介石电报文书,有效揭示了其政治网络的特征。评议人薛勤(华中师范大学马克思主义学院)在总结报告亮点的基础上,为各研究进一步深化指明了方向。

分组讨论
第四场讨论由朱本军(北京大学图书馆)主持,徐碧姗(《数字人文研究》)点评。
郑宇熹(北京大学中国语言文学系)介绍了“北京大学汉语史标注语料库”以知识库和语料库为基石、以人机协同为抓手、以实现范式革新为目标,系统推进多典籍标注与检索平台建设的实践。张梅宇(陕西师范大学西北历史环境与经济社会发展研究院)与翁业鹏(中国科学院大学)通过分析近现代史大语言数据集建设难题,提出五大评测任务以推动质量提升、赋能历史研究。王刚与刘权兴(西南大学历史学院、民族学院)以“东亚同文会对华调查活动专题数据库”为例,论述AI赋能近代史料整理的六大阶段与四大问题,继而展望大模型在多语种、手写体混合识别中的应用前景。安高怡(华中师范大学历史文化学院)阐明基于Obsidian构建的本地全文数据库在知识图谱生成及多端协同等方面的优势。评议人徐碧姗(《数字人文研究》)指出,学者应以需求为驱动、用技术解决问题,完整展现数字环境下的学术工作流程。
第五场讨论由王富聪(《团结报》)主持,严程(清华大学人文学院)点评。
王晓园与肖文莉(湘潭大学公共管理学院)以《谭延闿日记》为核心史料,借助数字人文工具考察谭延闿的身份转型、人际关系转变与民国政治文化变迁的关联。余睿(华东师范大学人文社会科学学院)通过量化分析《胡适留学日记》,从阅读史角度为“文学革命”的发生与发展提供新证据。罗睿与丁赛(中国社会科学院大学社会与民族学院)运用“历时话语分析”研究三七自16世纪末期至今的传播状况,构建中药材跨文化传播的解释框架。杨洵奕(武汉大学历史学院)以湖南为例,在整合多源史料的基础上尝试为识别近代中国市镇和判定市场层级提供新的标准。评议人严程(清华大学人文学院)肯定上述研究在方法应用、问题解决、范式创新等维度的价值,同时从史料补充、命题聚焦、研究广度、分析深度等方面提出改进建议。
第六场讨论由战蓓蓓(湖南大学岳麓书院)主持,桑海(《澳门理工大学学报》)点评。
唐丽娜、吴翔宇(中国人民大学社会学院)、吴亚聪、刘洁(中国人民大学国家治理大数据和人工智能创新平台)梳理数字史料结构化的现实意义和学术价值。刘昊(中共北京市委党史研究室)提出以“人机协同”为特征、以“计算性历史思辨”为内核的新研究方法,反思历史学从阐释到预测的范式转变。周维煦(电子科技大学马克思主义学院)关注B站爆款历史视频及其“弹幕”内容,挖掘新媒体环境下青年人历史认知的形成机制。苗祎琦(中国社会科学出版社)通过分析“国家社会科学基金后期资助暨优秀博士学位论文出版项目”的立项情况,深入探讨AI时代人文社科知识生产的新趋势。评议人桑海(《澳门理工大学学报》)对研究的学术价值表示肯定,并针对各项报告提出改进意见。
圆桌讨论环节,学者们高度评价本次会议的前沿性与启发性,并围绕数字人文与史学研究融合、人才培养与学科建设等议题展开深入交流。王涛(南京大学历史学院)充分肯定会议在推动历史研究与数字技术深度融合方面取得的成果,鼓励青年学者在AI时代积极运用新技术赋能研究,在打破专业壁垒的同时坚守人文学术的本位与初心。严程(清华大学人文学院)指出会议不仅呈现了数字人文研究的新范式,也为人才培养注入了新思路,促进了学界与企业的跨界协作,有助于构建开放共融的人文发展生态。向静(中国社会科学院大学)认为会议展现了人文学科与数字技术结合的丰硕成果,为技术与人文学者搭建了高质量对话平台,具有重要的示范意义。梁继红(中国人民大学信息资源管理学院)指出会议涌现多项创新性研究,展现出史学在数智时代的新气象,反映了信息技术正深刻推动史学研究的范式变革。袁晓如(北京大学智能学院)建议设立数字人文研究基准以促进跨学科需求对接,推动更实质性的协同创新。杨敏(上海图书馆)高度赞扬学生参与数字人文研究的热情,强调应持续夯实数据库等数智技术基础设施建设,为人文学术创新提供坚实支撑。朱翠萍(中华书局古联公司)期待与智能体研究学者深化合作,共同构建高质量数据库,赋能中国近现代史研究。战蓓蓓(湖南大学岳麓书院)关注数字人文与人才培养之间的良性互动,鼓励学生主动学习相关技术,并肯定会议为师生共建共享提供了交流平台。刘俊晖(中国人民大学历史学院强基计划本科生)表示会议增强了自己对数字人文前景的信心,呼吁历史学专业学生应拓宽视野,主动拥抱数智技术。
胡恒(中国人民大学历史学院)在闭幕致辞中表示,数字人文的实践已开始深入到具体的研究场景中。人工智能时代的到来,正推动中国近现代史研究经历一场从方法论到认识论的“智识重构”,数字人文的发展也正为学科建设与人才培养注入全新动能。他进一步指出,在人文社会学科遭遇变革与挑战的背景下,更需要推动人文传统与现代技术相结合,以数字人文激发其内在创造力,推动人类知识回归整全性。

胡恒教授总结
回望2025,我们欣喜地看到,在具有完整自主知识产权的国产大语言模型为代表的人工智能技术实现历史性突破的今天,一系列中国近现代史研究智能体得以构建,促使一批跨学科、跨媒介、跨领域的研究成果问世,为传统史学研究注入了新的生命力,更为技术发展锚定了人文坐标。本次研讨会正逢其时,成功搭建了高水平的跨学科学术交流平台,清晰勾勒出AI驱动下中国近现代史研究的崭新图景。虽然,目前的探索成果还是初步的,但我们坚信,今天的探索必将有力深化数字人文研究的理论创新,促进中国近现代史研究的范式转型,并将在可预见的未来,为加快中国历史学自主知识体系的构建、培养近现代史研究高层次人才提供更为坚实的支撑与保障。

