4月22日第三十一届中国国际广播电视信息网络展览会(CCBN 2025)在北京开幕。中国科学院院士、北京航空航天大学人工智能研究院院长郑志明在开幕式上表示:“人工智能(AI)正在引发产业格局的深刻变革。人工智能技术在有限组合优化领域展现出了强大的搜素与泛化能力,但‘复杂高精产业+人工智能大模型’仍面临应用困局,行业大模型在定制过程中也存在三个亟待突破的科学问题。”
当前,随着数智化时代的到来,人工智能正在重塑多个行业,行业大模型市场规模逐年增加,大模型深度赋能智能媒体创新。郑志明表示,在人工智能重塑产业生态的背景下,广电等行业正在迈向智能化、融合化新趋势。但需要看到的是,大语言模型的性能取决于计算量、数据量和参数量的规模。随着传统大模型参数规模的不断扩展,计算资源和资金投入训练成本也呈现指数级增长,高门槛算力资源已经成为制约我国大模型快速发展的关键因素之一。
在此背景下,DeepSeek的出现让“算力壁垒”得以破局。郑志明表示,DeepSeek的高效优化方法大幅降低了大模型的训练和推理成本,实现了模型计算的参数脱敏,显著降低了对国外特定硬件的依赖。

郑志明在谈及人工智能技术应用的范式领域—有限组合优化问题时表示,当前的人工智能技术虽然在有限组合优化领域展现了强大的搜素与泛化能力,但新一代人工智能的发展重点是决策能力,即需要人工智能大模型具备处理颗粒度较细系统的能力。当前,大模型在垂直领域的应用存在决策能力不足问题,“高精产业+人工智能大模型”仍面临应用的两大困局。
第一大困局是人工智能大模型在复杂场景和跨域领域应用的泛化能力不足,强泛化性与精准性的缺失极大制约了人工智能技术跃迁及赋能社会经济。工业控制、广播电视等复杂场景和高精度领域需要人工智能模型具备精准、可解释和强泛化能力,但目前由于人工智能大模型缺乏统一的理论框架和可验证边界,“灾难性遗忘”问题严重,原有知识和能力显著衰退。具体来看,这是因为人工智能大模型的设计和训练缺少可解释性理论支持,持续学习能力不足,影响了多任务协同性能;人工智能大模型的泛化边界不清晰,难以预测其在新任务中的表现,新任务训练往往会损害大模型处理旧任务的能力。对此,需要采取结构稳定性理论,支撑人工智能模型的实际部署与强泛化应用。
第二大困局是人工智能大模型在高精场景的广泛应用缺乏精准可解释性,大模型由于缺乏直观解释和严格验证,难以应用于广播电视等高精领域。比如,知识边界的模糊会导致高风险模型幻觉。
对此,他建议应采用跨尺度智能理论--精准智能,促进人工智能大模型在高精场景的深度应用。具体而言,即:通过设计内嵌数学原理的新型算法框架,提高人工智能大模型决策的鲁棒性,使决策过程更透明、更易于理解;通过强化人工智能大模型决策验证机制(包括更严格的测试和评估标准),确保系统在极端情况下也能作出准确可靠的决策。
在行业大模型的定制过程中,行业大模型亟须突破偏离、边界、孤岛等关键科学问题。郑志明指出,这主要可概括为三大亟待突破的科学问题。
一是理论缺乏,训练成本高昂。由于现有模型训练普遍采用随机穷举遍历,导致训练成本高昂,训练过程不可控。此外,模型学习新知识时可能会遗忘旧知识,使得原有通用性能受到影响。
二是技术黑箱,可解释性不足。大模型由于注意力机制固有的偏差,导致生成过程很容易出现“胡言乱语”的幻觉问题。另外,大模型的黑箱特性难以满足垂直领域应用的可解释需求。
三是信息闭塞,缺乏开源生态。这具体表现在:大模型缺乏统一的开发规范;缺乏参与方治理机制;缺乏体系化系统支撑;缺乏应用场景实践。
针对以上人工智能在垂直领域的两大困局和三大问题,郑志明提出了一个基本研究思路:通过内嵌复杂系统数学理论,构建新一代可解释高精度行业大模型,推动大模型实现从稳态域到认知域,再到生态域的系统性跃迁。
具体来看,在稳态域方面,构建通专知识融合的数智媒体大模型微调框架,利用结构稳定性理论建模稳态域的能力边界,缓解大模型的“灾难性遗忘”问题,提升模型在专业领域的泛化能力;在认知域方面,开发幻觉抑制的数智媒体大模型,利用跨尺度智能理论构建认知域的推理边界,抑制大模型的幻觉输出,提升其智能决策的精准性和可解释性;在生态域方面,构建全方位量化评价的评估体系与验证体系,实现生态域的开源协同与模型共享,推动行业级AI解决方案的适配与规模化落地。
记者 张依依