在工业和信息化部科技司的指导下,由中国工业互联网研究院牵头成立的通用人工智能与工业融合创新中心6月28日发布大模型工业知识问答测试结果,旨在助力人工智能深度赋能制造业,推动工业经济高质量发展。
(资料图片)
图:6月2日,中国工业互联网研究院牵头成立通用人工智能与工业融合创新中心,以上为相关领导、专家、企业家代表出席通用人工智能与工业融合创新中心成立仪式。
参与报告论证的包括:中国工程院院士唐立新、王国栋,外籍院士焦礼成、张大庆、刘江川,ACMIEEE Fellow 刘云浩、刘劼、张燕咏、杨铮等,共13位业界顶级专家。该报告针对包括电子设备制造、装备制造、钢铁等八个细分行业,通过设置主观、客观、自主认知和悖论等多方面问题,进行大模型测试。
图:五位中外院士、八位ACMIEEE Fellow、13位业界顶级专家联合论证。
报告总体显示,通用大模型在工业知识问答领域整体处于探索阶段,GPT4表现最为优异。头部国产大模型表现亮眼,整体水平与持平,多措并举或可实现赶超。
图:大模型工业领域知识问答测评综合结果
大模型对八个细分行业的知识问答能力呈现出明显差异性,其中,电子、装备、钢铁和石化相对较好,采矿、电力、建材和纺织相对不足。
图:大模型在电子、装备、钢铁、采矿行业表现。
具体到国产大模型,文心一言、ChatGLM、360智脑在电子行业中表现优异;文心一言、360智脑、ChatGLM在装备行业评分领先;文心一言、ChatGLM、星火大模型在钢铁行业成绩突出;文心一言、360智脑、星火大模型在采矿行业名列前茅。
图: 大模型电力、石化、建材、纺织行业表现。
在电力行业,文心一言、ChatGLM、天工大模型居于前列;在石化行业文心一言、360智脑、从容大模型处于领先;在建材行业,文心一言、星火、ChatGLM评分较高;纺织行业ChatGLM、文心一言、360智脑优势明显。
图: 大模型自我知识盲区鉴别能力
图: 大模型对输入内容的合理性判断能力
报告显示,在模型自我知识盲区鉴别能力与抗污染问题分析能力方面,GPT4表现出较高的水平,能够自己主动承认不理解的问题以及识别出大部分的逻辑谬误。相较而言,国产大模型提升空间较大。
下一步,通用人工智能与工业融合创新中心将在工业与信息化部科技司的指导下,周期性围绕大模型知识能力、鲁棒性、安全性等专题开展后续评估工作,为政府提供决策依据,为产业提供赋能导向,为企业提供转型方法,为用户提供应用参考,助力构建通用人工智能赋能制造业新优势。
(文章来源:新华财经)
上一篇:韩政府多名正副部级官员换人
下一篇:最后一页
在工业和信息化部科技司的指导下,由中国工业互联网研究院牵头成立的通
韩国总统尹锡悦29日提名诚信女子大学政治外交系教授金暎浩为新任统一部
周天成面对普兰诺伊,首局比赛关键时刻掉链子,17比21,周天成遗憾倒下
为扎实做好暑期校园安全生产工作,6月28日上午,菏泽医学专科学校副校
供应商:北京牌照业务10年口碑商家手机号:17301222931(24小时在线)
据证券时报,尽管国安府二期等豪宅拥有高人气,但自4月底以来,北京楼
1、青春痘的治疗通常需要几个月的时间,即使青春痘消退了,仍然需要维
中新社北京6月28日电(记者高凯)又是一年高考志愿填报季,中国全国各地
全民集结,为荣誉而战!《口袋征服》全新版本来袭,首届跨服战旗争霸赛
近年来,民营经济发展持续向好,为经济社会发展注入了动力。民营企业生