普及化应用元年,三大难题掣肘AI大模型落地

中国电子报
当前,我国正值人工智能发展关键战略机遇期,亟需从技术攻关、行业适配、风险预警三方面入手,构建AI大模型应用良好发展环境,在新一轮科技革命和产业变革中下好先手棋、赢得主动权。

DeepSeek横空出世,因其成本低、性能好、生态开放等优势,掀起个人、企业乃至政府争相应用的热潮,推动开启AI大模型普及化应用的元年。赛迪研究院分析认为,AI大模型大规模应用对于我国AI大模型快速迭代发展意义重大,但亟需同步解决好底层框架稳定性不高、跨行业融合存壁垒、生态支撑有限等三大问题。当前,我国正值人工智能发展关键战略机遇期,亟需从技术攻关、行业适配、风险预警三方面入手,构建AI大模型应用良好发展环境,在新一轮科技革命和产业变革中下好先手棋、赢得主动权。

深度求索的DeepSeek-V3和R1大模型发布以来,以开源和高性价比的特点以及支持免费使用、任意修改和衍生开发,大大降低使用门槛,带来大模型部署热潮,云服务厂商、科技企业、垂直领域行业企业甚至地方政府等纷纷接入DeepSeek,针对具体需求定制化开发产品与服务,推动AI应用生态的繁荣发展。但同时,AI大模型在具体行业的推广应用仍面临可靠性与稳定性难题、深度应用的成本高企及生态支撑相对薄弱等系列瓶颈。

底层架构“黑箱”效应等难题尚未破解,适应行业深度应用的可信产品供给较为匮乏。随着AI模型训练数据量和参数规模呈现指数级增长,算法架构也趋于复杂,导致模型缺乏可解释性和透明性,特别是深度神经网络模型的“黑箱”特性使得在更加关注推理、决策和运行过程的具体行业应用中尤为棘手。同时,大模型在面对新场景和处理复杂任务时也常因缺乏行业知识而输出与现实不符的“幻觉”或不可靠结论,难以确保行业应用中的可靠性与稳定性。例如,尽管大模型处理复杂数学运算能力突出,但却无法普通确保运算的正确率,据报道ChatGPT-4处理简单加法和字谜时错误率甚至比部分小模型高出15%,而Meta旗下大模型LLaMA在简单两位数任务上的正确率竟未超过60%。同时,据Vectara测试团队发布的LLM大语言模型“幻觉”排行榜,ChatGPT-4、OpenAI-o1、阿里Qwen2.5-Max和DeepSeek-V3的幻觉率分别为1.8%、2.4%、2.9%和3.9%,而DeepSeek-R1和Google PaLM-2幻觉率均超过14%,且不管模型先进与否均无法完全避免幻觉问题。此外,尽管AI大模型在通用领域展现出强大能力,但具体产业场景的复杂性和专业性使其实际落地时面临显著的适配难题。特别是制造业领域数据的多模态特性要求模型具备跨模态融合能力,而现有大模型对时序数据、高精度物理参数的解析准确率还普遍偏低,且训练数据不能完全代表现实产业的复杂性,难以满足制造业产线稳定和高效运行的严格要求。由于输出结果的潜在不准确性,企业在广泛深入应用大模型时趋于谨慎,直接阻碍AI大模型行业落地。

海量产业链上下游主体分散式接入大模型,长期“单兵作战”恐增加后期协同成本。当前,各行业主体积极接入大模型端口,虽短期大幅提升自身运营效率,但却忽视长期产业链上下游协同应用的重要性,特别是厂商在基于DeepSeek R1模型提供服务时算力成本高企,MaaS(模型即服务)价格并未降低。以满血版DeepSeek R1每百万token(输出)收费16元计算,如果每日输出1000亿token,基于DeepSeek的服务每月的机器成本是4.5亿元,即亏损4亿元。经某长三角新能源汽车产业集群统计,内部约38%的零部件供应商未接入Deepseek系统,导致数据交互环节的传统ERP(企业资源计划)系统生成计划需延长72小时,经人工翻译适配主机厂大模型智能排产系统;成本核算环节的手工填报数据与主机厂DeepSeek动态成本模型产生15%误差,造成季度供应链金融授信额度误判1.2亿元;质量追溯环节的缺陷零件追溯时长从行业平均4.2小时激增至27小时。由于前期大模型接入步伐不一致,主体应用间基础能力呈现明显差距,而产业链任一环节的数字化断点都将放大整体协同成本。据湖南磐云数据基于DeepSeek开发的供应链协同平台数据显示,全链条接入可使订单响应速度提升300%,异常事件处理效率提高420%。随着AI大模型迅速渗透并赋能行业发展,后发企业的追赶成本将呈指数级增长,难以跨越基础能力鸿沟差距,进而限制AI大模型应用推广。

AI大模型推广应用的生态环境尚不健全,数据、标准、伦理等基础条件相对薄弱。高质量训练数据样本稀缺且割裂,长期将从源头掣肘我AI大模型推广应用。如,医疗等垂直领域数据开放率不足,医疗影像大模型训练需10万+标注样本,但三甲医院数据因隐私保护难以共享,误诊率高居不下。据麦肯锡2024年报告显示,欧盟GDPR等法规使跨境数据成本激增,企业合规支出占AI项目预算30%以上,后续难以适应复杂多元的AI大模型推广应用需求。AI大模型应用范围和深度的持续拓展,取决于其面对复杂多变市场需求的应对能力,但当前AI大模型在处理与道德、法律、安全、隐私和社会影响等相关问题时,标准体系水平短板较为突出。根据欧盟AI监管草案,甚至全球主流十大AI模型均未达到标准,Aleph Alpha、Anthropic等产品得分低于25%,主要问题集中在版权责任不明确、能源使用报告不均衡、风险缓解披露不充分等方面。随着我国DeepSeek大模型迭代周期缩短至45天,传统的规则制定模式难以为继,政策出台大大滞后于技术创新和商业模式更迭进程,非法收集、泄露国家安全及个人隐私数据风险高企。若不能及时在上述数据、标准、伦理等领域建立保障体系,将面临推广隐患大,不推广就落后的窘境。

请扫码关注数字化经济观察网
责编:左右
参与评论
文明上网,理性发言!请遵守新闻评论服务协议
0/200