蚁天鉴2.0发布:打造“测评智能体”,产品走向商业化

蚁天鉴2.0发布:打造“测评智能体”,产品走向商业化

来源:中国日报网 2024-07-05 17:06
  • weixin
  • weibo
  • qqzone
分享到微信

7月5日,蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。蚁天鉴2.0新增AI鉴真功能,支持图像、视频等多模态内容真实性及深度伪造检测;并在测评功能上持续升级,打造了大模型安全测评“智能体”,并新增大模型X光、大模型基础设施测评两大测评功能。据了解,蚁天鉴去年7月首次对外发布,历时1年升级到2.0版。2024年,蚁天鉴商业化迈出重要一步,通过蚂蚁数科开始服务广泛的外部客户。

记者注意到,作为蚂蚁集团科技商业化的重要板块,蚂蚁数科自今年3月份独立化运营以来,悄然推进AItoB战略,SOFAStack、蚁盾等多个代表性产品均发布了大模型相关服务,积极借助AI技术助力产业智能化升级。

据记者从WAIC现场了解,蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。

在测评端,蚁天鉴2.0研发了业内首个“测评智能体”。该测评智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,可扩展测评垂类大模型、多模态大模型及Agent智能体,并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例,保障测评效果和效率。目前,蚁天鉴2.0有超300万高质量测评题库,支持最高50万/日的饱和式攻击和逐级诱导深度攻击,并实现了1工作日内完成测评,全流程自动化率>99%。

与此同时,该智能体也增加了两项新功能。一是「大模型X-ray」。即大模型X光,可针对大模型的内在神经元进行X光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。二是「大模型基础设施测评」。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发,深入扫描模型算法组件及软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。

同时,蚁天鉴2.0防御端新增「AI鉴真」功能。支持多模态内容真实性及深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪,图像识别准确率99.9%达到行业最高优秀级(信通院测评)。目前,蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集,覆盖主流生成方案,有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。

【责任编辑:高琳琳】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn
C财经客户端 扫码下载
Chinadaily-cn 中文网微信