中国AI科研成果持续创新高，多篇论文入选国际计算语言学年会ACL2024

来源：中国日报网 2024-08-13 17:59

分享到微信

当地时间8月11日至16日，为期6天的国际计算语言学年会（ACL2024）在泰国曼谷举办。ACL是计算语言学和自然语言处理领域国际排名第一的顶级学术会议，由国际计算语言学协会组织，每年召开一次，2024年是第62届会议。

清华大学、浙江大学、西安电子科技大学、蚂蚁集团、小米等国内院校及互联网企业均有论文被ACL2024收录。比如蚂蚁集团有14篇论文被收录，研究课题涉及自然语言处理、知识推理、大模型、知识图谱等领域，自然其中5篇被主会（Main）收录。

被主会（Main）收录的论文“分解与蒸馏大语言模型用于语义搜索”，提出了一种混合型语义搜索模型D2LLM，通过分解大语言模型和从大语言模型中蒸馏知识，实现了双编码器的运行效率与交叉编码器的理解准确性的折中。实验数据显示，D2LLM在三项任务的指标上超过了五个领先的基准模型，特别是在自然语言推理（NLI）任务的性能至少提高了6.45%。

另一篇被被主会（Main）收录的论文“构建大规模schema约束的信息抽取语料库”，提出了一个叫IEPILE的中英双语IE指令语料库，它包含约0.32B的tokens。这一研究通过收集和清洗33个现有IE数据集构建了IEPILE，并引入基于schema模式的指令生成，构建出大规模的语料库。实验结果表明，使用IEPILE可提升LLMs在IE任务中，尤其在零样本泛化抽取上的性能。

蚂蚁另外两篇被ACL2024主会收录的论文，取得的研究成果分别是，降低了大模型的幻觉；以及提高了大模型的注意力，增强了大模型长下文的外推能力。

据了解，2024年，蚂蚁集团有近百篇AI学术论文被全球各顶级会议收录，研究成果主要用于优化大模型训练的性能，提高大模型的可靠性与可信度，持续降低AI训练成本，以推动大模型在各行业，尤其严谨行业中得以规模化落地应用。如这与蚂蚁“让AI像扫码支付一样便利每个人的生活”的技术主张亦有直接关系。

《2023年中国科技论文统计报告》显示，中国发表的高水平国际期刊论文数量和被引用次数均排在世界第一。2024年，乔治城大学安全与新兴技术中心（CSET）的最新数据显示，在人工智能最热门的领域中，中国在一半以上的研究领域领先美国。这些数据表明，中国高校和企业的科研产出在数量和质量上都在稳步提升，在全球科研领域中占据越来越重要位置。

【责任编辑：韩鹤】

专题

推荐阅读

人类命运共同体研究中心

关于我们 | 联系我们

中国日报网版权说明：凡注明来源为“中国日报网：XXX（署名）”，除与中国日报网签署内容授权协议的网站外，其他任何网站或单位未经允许禁止转载、使用，违者必究。如需使用，请与010-84883777联系；凡本网注明“来源：XXX（非中国日报网）”的作品，均转载自其它媒体，目的在于传播更多信息，其他媒体如需转载，请与稿件来源方联系，如产生任何问题与本网无关。

版权保护：本网登载的内容（包括文字、图片、多媒体资讯等）版权属中国日报网（中报国际文化传媒（北京）有限公司）独家所有使用。未经中国日报网事先协议授权，禁止转载使用。给中国日报网提意见：rx@chinadaily.com.cn

C财经客户端

扫码下载