2024年11月9日,外国语学院孙媛博士参加河南师范大学举办的“语料库与人工智能前沿论坛”。本次论坛聚焦“语料库研究与人工智能”,汇聚了语料库语言学和人工智能方向众多专家学者的群体智慧,是一场高层次的跨学科对话。论坛以主旨报告方式进行。梁茂成、卫乃兴、李文忠、钱毓芳、刘泽权等多位专家学者从不同视角,围绕“语言数据与智慧教育”“新型语料库技术开发与应用”等议题,畅所欲言,深度解读人工智能大背景下语料库技术迅猛发展的科技形势,为推动语言数据科学应用把脉问诊、建言献策。
梁茂成作了题为“大语言模型驱动的语料库语言学专业知识图谱构建”的主旨发言。他指出由于具有强大的推理能力和文本理解能力,大语言模型在语言研究和语言教学领域具有广阔应用前景。大语言模型可以对用户提供的文本进行优化,进而自动提取实体和关系,构建语料库语言学知识图谱,对各类专业知识图谱构建具有重要启示。
卫乃兴作了题为“Convergences and Divergences of Construction Grammar, Pattern Grammar and Local Grammar”的主旨发言。他分别阐述了构式语法、模式语法及局部语法3种语言研究方法的基本特征,区别了三者之间的趋同和歧异。针对这3种研究方法存在的局限性,为了促进三者在语言研究和教学过程中的汇融和协同,他提出了基于语料库的“意义模式组合”法,指出了该方法在未来可能的研究趋势。
李文中的发题目为“Analyzing the Text and Discourse in the Discourse”,他强调任何文本和话语都不是孤立存在的,任何人都存在于话语中间,因此非常有必要的探索文本之间的复杂关系以及追踪话语中各个节点之间的联系。他主张对个别文本、话语事件或对象进行全面检查,包括对相关历史文本的细致审查,重点关注数据源的广度和声音的多样性。他使用文本挖掘技术,对特定文本进行互文分析,阐释了作者如何通过权威和可信度的主张来传达他们的意图和态度。最后,他明确指出话语研究者不可能脱离文本的主题性,并会陷入并成为正在考察话语的一部分。
刘泽权作了“数智时代人工翻译何为?——人工与机器、智能学术外译文本对比考察”主旨发言。他认为,自ChatGPT问世以来,较多学者关注到人工智能工具和大语言模型给外语学习、写作、翻译等带来的挑战和机遇,鲜有研究以富有创意和情感的文学文本或蕴含文化和价值观念(意识形态)的政论、历史等人文学术类文本的翻译为对象,系统全面对比传统人工翻译与机器智能翻译的优劣。他以自己的翻译实践中华学术外译项目《中华文明的起源》为例,分别运用WordSmith、BLEU、TER等量化方法和语篇调整、特色文化词语范畴化等定性方法,对比人工翻译与ChatGPT、Google、DeepL、有道、文心一言等机器智能翻译的异同得失,以期为数智时代对外做好中国翻译实践和培养高端翻译人才提供借鉴。
此次论坛专家学者们畅所欲言,气氛热烈,达到了思想碰撞和互学互鉴的效果,并在此过程中增进了友谊和共识,与会者收获颇丰。论坛有效促进了语料库研究与人工智能的交叉融合,为国家发展新质生产力培养创新型外语人才汇聚了新动能、激发了新活力。(图文:孙媛审核:石皓召)