电子邮箱

密码

注册 忘记密码?
科大讯飞刘庆峰:中美AI,差距多大?
来源:正和岛 | 作者:proac3c72 | 发布时间 :2025-07-04 | 15 次浏览: | 分享到:

627日,正和岛2025案例共学年会暨AI+先行者创新大集在合肥继续进行,本次大会以向新力为主题,千余位企业家共同探讨AI时代下的组织变革与商业格局。


在大会上,科大讯飞董事长刘庆峰以《解放生产力 释放想象力——通用人工智能技术进展及典型应用》为题,做了一场精彩的演讲。


在分享中,刘庆峰预判今年是全民AI和全行业AI的元年。面对美国对中国高端算力芯片的限制,中美在本轮大模型竞争中差距缩短至36个月,不会再形成代差。他认为国产自主可控比以往任何时候都更加迫切,我们必须坚定地在国产化平台上发展通用人工智能。


以下是刘庆峰在正和岛案例共学年会上的演讲全文,以飨读者,内容有删减。




口 述:刘庆峰 科大讯飞董事长



中美AI大模型差距,缩短至36个月


中国的高考只是观察人工智能发展的一个切面。在国际上,如国外的奥数等赛事中,人工智能的应用也十分广泛。不过,从整体技术发展情况来看,在本轮以GPT框架预训练到强化学习为代表的大模型竞争中,中美之间的差距正在不断缩短。


美国如OpenAIAnthropic等头部公司慢慢聚焦,把那些数学、物理等领域的天才们,培养成人工智能研究专家,所以在科学模型的构建上,美国独树一帜。


中国也挺卷,“百模大战”卷到头部企业最多只剩下5~10家。去年913日,OpenAI推出深度思考模型,在做数学、深度推理上大幅度提升。今年1月,我们推出非常小的13B深度推理模型,由于算力限制,我们必须研发很小的模型,国产算力才能支撑得住。


此后,DeepSeek、豆包、阿里等企业一路你追我赶,在通用大模型这一波竞争中,中美两国的实力已经非常接近,差距仅在36个月之间,绝对不会再形成代差。



在此背景下,美国对我们限制了什么?当DeepSeek一出来,美国非常震惊。因为此前他们集体对中国大模型和科技创新能力有误判,突然看到,中国发展速度离美国这么近,所以美国进一步加大对算力的限制。


2022107日起,美国对支撑我们大模型和人工智能芯片限高限宽。限高是指单芯片算力不能超过312T;限宽是指大模型数据交换带宽不能超过400G。后来,美国又进一步宣布全面禁售,连阉割版的芯片都不给了。


今年美国的新规定是,所有出口管制扩展到了三星、台积电等芯片代工厂十几纳米芯片的出口管控,之前我们可以用堆叠工艺变成7纳米,现在这些路径全部被堵死了。


在这样的限制下,中国大模型和人工智能基础设施上,与美国差距仅在36个月之间,但我们的算力支撑到底怎样?我想告诉大家,刚才说到的高考语文、英语和数学的主流模型中,只有讯飞一家是基于国产算力训练的。而DeepSeek和豆包等企业全是基于英伟达芯片训练的,国产算力训练大模型压力非常大。


20221130ChatGPT推出时,美国对中国的芯片限制已经限高限宽,华为的910B芯片算力为113T,与美国的基本一致,带宽规定不能超过400G,而中国实际为392G


理论上,中国应该能达到A100A800芯片80%90%的性能。可那时候,同样的硬件技术下,我们在训练大模型的效率上只有30%


任正非在华为组建了有史以来最高规格的特战队,到202310月,我们联手把训练效率做到95%。因此,2024130日,我们推出了第一个基于国产算力训练的中国千亿大模型——讯飞星火3.5,为国家兜了底。


去年913日,DeepSeek R1深度思考模型的技术很出圈,由于我们有很多积累和基础,仅用一个月时间,我们就复现了所有技术。


但当我们使用国产算力训练时,原本在原有算法中达到95%的效率却降到了25%,我们又花了三个多月的时间,将效率提升到了73%。在高考中,这一技术得到了验证。今天中国的大模型训练一定是在全国产算力的基础上,用更少的算力、更小的模型参数,训练出与全球对标的技术,我们才有可持续发展的底气。


为什么能做到?我们的模型是70B,如果一个岛亲机构要用满血版的R1,需要两张卡,而如果要深度训练,R1无法做到,你要自己用开源模型训练,这可能需要512张卡。而我们使用星火X132张卡就可以了。OpenAI O1的规模更大,可能要上万张卡。能做到这一点,是因为中国有自己的算法创新。


快思考是迅速给出答案,而慢思考通过深度推理反复验算,给出最好的模型。但V3R1是分别单独训练的,一个企业要安装两套系统。我们在国内率先使用一个框架,企业装一套系统,可以自由切换快思考和慢思考模式,想用快的用快的,想用慢的用慢的。


正因为有这些技术创新,才使我们能够在自主可控的通用底座上快速训练出行业模型,从而进入到企业场景。通常,一个新技术的规模化应用的技术门槛要达到89%90%的准确率。


例如,手写识别在摩托罗拉做到89%后,所有人开始用手写识别;语音识别在手机上的识别准确率达到90%后,用户数量从几十万增长到上亿,如今其准确率已达到98%





大模型的典型应用场景


今天,通用大模型在初步使用中常出现幻觉问题,有很多“讨好型人格”特征,平均准确率约78%左右。相比之下,行业模型经过精准训练后,准确率可达80%以上,场景定义清晰,准确率能达到95%


这个基本框架下,前提是什么?我们是否有全自助可控的平台上训练出自己的底座模型。比如教育,因为有自主可控的模型,可以把机器的思维链转化为教师的教学思维链,以问题导向,打造中小学教师助手,这些性能指标明显优于GPT4.5


在医疗领域,我们的大模型已通过国家职业医师资格考试,超过了99%的考试学生,我们与葛均波院士合作的心内科应用,以及与安徽医科大学校长翁建平教授合作的糖尿病专业应用,均已达到超越主治医师水平的成效。随着深度推理技术的出现,今年的大模型在多个专科领域实现了顶级水平的突破,就是因为有了一种快速的行业训练工具链。


今年两会后,最高人民检察院引入人工智能技术,用大模型来推动司法的公正,做类案推送、法条对应、辅助量刑和文书生成等十项能力,我们用专业模型,准确率能提升到83%,很多领域超过90%。前两天,工信部在能源领域的碳排放评估测试中,大模型在48名考生中位列第五,跻身前20%


这些技术进步推动了大模型在多个领域的广泛应用。


在教育领域,大模型可担任口语、科学、编程教师及心理辅导员。在医疗领域,已支持近4亿次电子病历和10亿次辅助诊断,纠正了170万次不合理诊断和9000多万次不合理处方,并致力于个人健康助手的开发。在翻译领域,大模型在大学六级考试中超越99%的考生,其应用场景从旅游扩展到商务谈判和合同签订支持,尤其在抗噪、远距离交互、离线翻译和专业领域表现出色。


此外,我们还开发了图片文案生成和视频制作工具,支持多国语言,助力农产品和工业产品出海。


与岛亲出海相关的,比如在翻译领域,大模型在大学六级考试中超越99%的考生,今天翻译机主要变化是,不再是出国旅游、聊天、点菜之类的,还支持商务谈判和合同签订,离线状态下,英语、俄罗斯语、法语、德语等都有。


一个增长较快的场景是,中国企业出海建厂,在工厂有噪声环境下可以抗噪,并支持远距离交互,这是非常大的突破。此外,我们还开发了一些工具,无论是农产品出海,还是工业产品出海,给出几张图片、一个要求,可以直接生成文案或视频,同时配上所需要的任何国家的语言。


我们发布了业界第一个同传大模型,自己录一段中文,可以自动生成各国语言,且跟视频文本、手势都要对齐。今年,东盟博览会上正式发布面向东盟电商的自动翻译支持平台。


在办公领域,打造每个人的办公助手。今天会议,如果拿着讯飞办公本,可以全程录音,并自动转写成文字,自动生成会议纪要和代办事项。这个软件到了什么程度?今年总用户数过了9000万。即便是三五个人的小型会议,用手机录到后台,也能马上提炼每个人的观点,并形成综合结论。


此外,我们与中国移动合作,大家经常在开车或走路时,接到领导的工作电话,申请这个功能后,电话一挂断,会议纪要就出来了,这些功能大家都很欢迎。


在工业领域,今天大模型能支持研产供销服管几乎每个环节,我们通过前端的麦克风阵列和语音芯片、视频芯片,让所有设备“能听会说、能看会认”,再结合后端的大模型,实现设备“能理解、会思考”


在家电领域,第一个大模型招标的是海尔,我们中标了,其后又与TCL、美的等家电企业积极合作。2022年,我们在家电行业的芯片出货量达到1300多万片,2024年增至4000多万片,预计今年将突破6000万片。


人机物万物智能互联时代正在到来。在这个基础上,无论是产业数字化还是数字产业化,其实都需要用代码来连接现实世界和虚拟世界,今天用软件来大幅提效,已经成为行业共识。


今年计算机和软件专业首次出现就业率和工资下滑的情况,OpenAIChatGPT已经通过了Google二级程序员测试,这个岗位年薪18万美金,这是代码的进步。


再举几个例子,讯飞内部的智慧黑板、智慧课堂产品,从Windows系统迁移到Linux系统需要三个月的开发周期,现在一个月就搞定了。


这种效率的提升,不仅加快了软件开发的速度,还降低了技术门槛,使得每一个不会用编程、不懂技术的员工,只需要洞察岗位需求,直接下指令,能让模型帮你完成相应的工作,从而创造一个又一个智能体,极大地丰富了创新创造的可能性,不再受限于技术门槛,关键在于我们是否有想象力。


在招投标系统中,利用人工智能技术,不再只是简单写一篇文章,好玩有趣,还可以精准解读非常严肃的标书,读懂标书的关键要求和评标方法,然后自动检测标书是否存在造假或雷同问题,并提出自动替换建议、查找预警信息,甚至生成砍价建议。最近国家发改委决定全国推广,在合肥市招投标中心的实践中,大模型将专家评审一致性从75%提升到95%


今天,大模型的应用场景非常多,然而,最重要的是要将通用大模型成功转化为行业模型并实现落地,需要解决一系列关键问题。


例如,一定要知道怎么建算力,是利用国产平台又或是结合国产和英伟达的混合算力调度平台。又怎么整理数据,用自动化工具,效率提升至24倍。怎么训模型,企业是用一个小的几千万参数的模型,还是要用大模型上千亿参数,这要根据实际情况做专门的对应,落到场景里,保证安全。最后,用看得见、摸得着的场景和统计数据,证明大模型应用的实际效果。



我们只要告诉智能体一段话或一句话,智能体会把这个事情分解成多个任务,找到需要调用的工具,并查找所需内容,然后把每一个完成的任务完串在一起,最终完成整体目标,这叫智能体。


以中石油为例,5000多名员工参与岗位提升大赛,1000多支队伍开发了2000多个智能体,其中100多个获奖。目前,这些智能体在中石油的100多个办公应用和300多个生产和销售过程中产生了实实在在的效果。


今天大模型时代,绝不是单个企业的竞争,而是整个生态体系的繁荣,要让我们的技术给到更多的企业应用,要让更多的创新者去开发。


在讯飞人工智能平台上,去年一年新增了170万开发者团队,做出来100万新应用。这中间最大特点是,以前的应用大部分是以社交、娱乐为主的APP,现在54%的应用与工业相关。


中国大模型在这一波红利中,与美国的差距已缩小至36个月,在行业应用的红利,中国一定会更率先拿到。


作为产业的开发者和创新者,我们需关注源头技术创新,与美国的差距越来越近更理性地看,这是原创与追赶的差距,我们在学习它,它是原创。如果我们不能从源头基础上对人工智能进行更长远的布局,未来很难最终胜出。


前天我们在讨论合肥这座城市的特点,这座城市正在布局GPT框架人工智能计算方法,怎么与量子计算深度结合,从而彻底解决算力焦虑问题。又怎么利用人工智能助力可控核聚变技术,将原本需要10天的模拟试验缩短至1天,准确率从93%提升至97%。如果可控核聚变技术,能输入1度电产生超过1度电,实现能量正输出时,将彻底解决能源问题。


我们期待跟大家一道,在正和岛年度大会上深入交流,共同面向未来,解放生产力,释放想象力。谢谢大家!


扫描下方二维码,关注浅说艺术

关注公众号


即时获知最新推送

休闲时刻


陶冶艺术情操

Copyright ©  2015  Science And Technology Investment Network.All Rights Reserved    版权所有:数智化网

地址:北京市海淀区翠微中里14号楼   

京公网安备11010802045648号           ICP备案号:京ICP备15022117号