8月28日,在国家数据局主办的2025中国国际大数据产业博览会上,国家数据局发布了首批高质量数据集建设先行先试工作名单。众数信科“文鳐船舶与海洋工程行业垂直大模型高质量数据集”经厦门数据管理局推荐、国家数据局历经层层严格的选拔,成功入选智慧海洋领域数据建设试点。
众数信科上榜我国首批高质量数据集建设先行先试工作名单
众数信科上榜我国首批高质量数据集建设先行先试工作名单“文鳐”大模型高质量数据集
基于跨源融合与动态治理理念,构建“开源数据+企业专业知识+产学研项目”的多源数据体系,基于国际海事公约、船舶法规、船级社规范、港航气象服务、船舶技术手册等7大类跨学科知识,联合厦门理工学院、福船集团、中船九院等企业构建含20多万专业术语的垂直知识库。
采用混合扩散模型+机器视觉技术对海事法规文件、航运管理文件、技术说明文件等等据统一标注,建立自动化清洗流程消除规范矛盾条款,与气象等单位实时对接更新航运气象数据,动态校准灾害预警阈值,形成“数据采集-清洗-标注-更新”的全流程治理体系,为模型训练提供高质量多模态数据支撑。
众数信科凭借在船舶与海洋工程领域深厚的数据治理能力与行业大模型实践经验,获得国家层面认可。以此为契机,公司将通过技术验证、场景拓展、标准构建与机制创新,持续推动高质量数据资源建设与人工智能应用深度融合,为行业数据治理与价值挖掘提供可复制、可推广的路径参考。
免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。