大模型热下的冷思考:DeepSeek技术在银行业应用趋势分析
银行业是对金融数据和信息进行加工处理的行业,大模型有着非常广阔的应用空间。本文分析了银行业应关注的2025大模型技术应用趋势,对DeepSeek在银行业的落地场景及核心挑战进行了探讨。2025年的大模型技术既是银行业的“试金石”,也是“加速器”,希望本文能为广大同业提供参考,也希望更多同行分享大模型应用的观察与落地实践。
【作者】邓俊峰,某银行研发中心AI经理,拥有10多年金融行业算法研究及应用经验,熟悉大数据、人工智能领域技术及其应用场景,在金融AI领域发表多篇发明专利。紧密跟踪大模型技术,拥有大模型微调训练和推理经验,曾在天池竞赛、kaggle竞赛等比赛中获得奖项。
一、银行业应关注的2025大模型技术应用趋势
1.推理大模型:破解复杂场景的“逻辑引擎”,将显著提升金融场景中的决策效率
从机器学习、深度学习、生成式大模型,人工智能经历了感知到语言文字认知的智能涌现。到2025年1月,由杭州深度求索公司推出的DeepSeek R1,凭借“推理时计算”深度思考、逻辑推理能力大涨、提示词简化、展示思考过程、开源及免费等众多优势,迅速引起全民关注。以DeepSeek R1为代表的推理大模型,通过强化逻辑分析、数学运算和代码生成能力,已不再局限于文本理解生成等自然语言处理任务,这种从“生成”到“推理”带来的跃变,开启了“深度思考”的应用快车道,显著提升了金融场景中的决策效率。
2.智能体应用:从“小作坊”到“流水线”,将提高银行的应用创新速度及改变成本结构
英伟达创始人黄仁勋在AI盛会2025 GTC上提出的“智能体式AI(Agentic AI)”,能独立完成从任务规划到操作落地的闭环,使智能体应用引起了大众的广泛关注。智能体(Agent)技术其实不是个新概念,从经典的意义来看,智能体是多种技术的组合运用,主打的能力是能够精确理解人类指令,自主分解任务,调用工具并交付成果。
最近以Manus和Deep Research等智能体创新应用,被称为“数字打工人”,可能会彻底改变人机协作的模式。这些智能体应用被广泛验证后,发现对任务规划的准确度、泛化性及稳定性还不足以应付企业复杂场景。因此,目前更可行的做法是基于统一的智能体平台框架,用编排模式开发出相对固化的智能体流程,由大模型判断意图、提取信息、生成回答内容等,而不是完全由大模型自动规划和完成执行任务的整个闭环。企业基于平台研发智能体应用,无需开发人员从零部署大模型及构建底层架构,可以大大提高银行的应用创新速度与优化成本结构。
二、银行业DeepSeek应用分析:从“效率工具”到“战略资产”
1、大模型能力应用解构:识别DeepSeek的能与不能
过去传统大模型的优势领域在基于文本的信息抽取、文本生成、创意写作、多轮对话,或音频图像视频的多模态理解和生成,而在复杂金融场景中常因理解和推理能力弱、逻辑断层“卡壳”而效果不佳。而在DeepSeek R1火爆之后,广大用户最关注的问题之一就是大模型擅长完成什么任务,又不适合执行什么任务。
随着大模型能力的不断加速迭代提升,所谓的“推理大模型”也只是中间过渡的一种状态,其能力范围越来越广,擅长执行的任务越来越多。譬如过去大家普遍任务短期内,大模型不擅长数值计算类型的任务,然而,在强化学习和MOE(Mixture of Experts)专家混合模型的加持下,该能力已经大幅提升,大模型已能在MATH与GPQA等博士或研究生水平的基准测试题目数据集上获得高分。
1)大模型擅长的任务,目前能力已经接近甚至超越人类平均水平,可以直接使用到业务场景的能力。
语言翻译、阅读理解、文本生成、文案创作等
知识存储、检索问答、信息提取、多轮对话等
声音/图像/视频理解和生成
2)大模型擅长但存在限制的任务,需要其他技术手段辅助使用的场景。其能力还在不断学习进化中,不久将来还会迅速增强。
辅助决策:逻辑推理、数据分析、方案规划等
科技研发:编写代码、开发设计文档编写、测试方案和案例等
3)大模型不擅长的任务,但可以技术上弥补
需要私域数据和知识的任务,由于缺乏个性化知识和经验,无法像对应岗位人员一样完成工作任务。技术上的方法可通过企业知识库提供数据参考,或者通过微调及蒸馏等手段学习企业私域知识。
对实时性高的新闻时事,模型训练数据缺失,并不掌握相关信息,容易产生幻觉。技术上的方法可通过互联网搜索引擎获取补充实时数据,清洗后存入向量数据库经检索增强生成(RAG)处理后据此信息进行回答。
2、大模型在银行业的应用趋势
银行业是对金融数据和信息进行加工处理的信息处理行业,大模型有着非常广阔的应用空间。有14家国内银行在2024年报中披露,在金融市场、交易银行、公司金融等对公业务层面结合大模型与小模型能力,实现综合化的智能应用,已实现落地应用的成熟场景主要是智能编码研发、智能营销、智能客服、智能风控、合规内审、消费者权益保护,以及日常经营管理流程等等。
将来大模型技术对银行业带来的影响将继续加速,有以下几方面:
1)银行服务模式将更加个性化:基于大模型的生成和对话能力,能做到千人千面的营销,同时改变过去全靠人工对客户沟通对接的方式,提供以客户为中心的更自动化、拟人化、有温度的高效沟通。
2)银行工作模式形成人类和数字员工高效协同:通过大小模型协同大大提升原有重复性工作的自动化程度,譬如用小模型对各类凭证表单的识别和录入实现自动处理,用推理大模型推理生成较复杂业务规则业务的审核意见或分析报告。
3)银行服务中人机交互方式变的更加自然:在移动互联网时代,银行通过手机APP文字和图形化的交互方式给客户提供大部分服务。在大模型语言交互接口的影响下以精准理解人类输入语言文字,转换为自动执行多种指令并自动完成服务。这种方式可大大提升咨询业务、寻找入口、输入信息、点击完成服务的客户体验。
三、DeepSeek在银行业的落地场景及核心挑战
1、积极推动“人工智能+”赋能银行AI助手
银行是数字化、智能化走的比较快的行业,通过在领域内积极探索,不少银行已在机器学习、自然语言处理(NLP)、智能图像视频处理(CV)、机器人流程自动化(RPA)等技术领域有成熟的平台及应用建设,从短文本、语音、图像、视频等方面的感知和简单识别,实现多业务领域的感知智能应用。
在DeepSeek大模型火爆出圈的情况下,银行应不断夯实大模型基础能力,逐步实现规模化的“AI+银行”应用建设,扩展到主要业务领域和业务流程,通过办公助手及岗位助手为全体员工提效赋能,通过优化产品和业务流程改进客户服务体验。
DeepSeek的出现,使大模型从“应答机”升级到具备认知智能的“全能顾问”,从“辅助工具”向企业“核心生产力”的跃迁。大模型赋能的AI助手不再是被动响应指令的工具,而是能主动规划任务的“数字员工”,结合使用多模态、推理大模型、多智能体等技术,去实现岗位工作的多任务、全流程、端到端覆盖。最终,大模型应该覆盖各部门各条线岗位,既有覆盖全员的通用办公助手,也有从信贷管理、营销市场、客群服务、风险管控、研发运维等一系列角色角色出发设计的岗位助手。在大零售业务领域,可实现客服坐席助手或智能客服、拟人化信用卡逾期催收助手等应用;在对公业务领域,可实现对公产品营销助手,在行内办公实现制度问答和办公智能体等场景,在科技研发领域实现研发代码辅助。
2、打造智能体平台:AI助手的“生产流水线”
不少银行正在大力打造智能体平台,形成便捷易用的大模型应用开发平台,从而加快AI+银行应用场景落地。智能体平台可集成提示词、RAG、工作流、插件库、应用接口等功能模块,以低代码、拖拉拽的形式,使研发和业务人员都能快速上手,像“流水线”一样快速孵化新智能应用,满足业务个性化和长尾场景的应用。
智能体平台的价值不仅仅在于其快捷易用,更在于其能力的可扩展性和泛化性。随着多智能体系统(MAS)和端到端训练等新架构和新算法的提出,不断增强规划决策、感知洞察、长短记忆、工具调用能力,相信智能体应用不再依赖预设工作流,而是能够利用新获得的知识来分析和实施更广泛任务,并动态调整策略的更高级应用,成为人工智能应用落地的主要形式。
3、大模型技术狂欢下的冷思考:
1)幻觉问题:多种方式提高稳定性
虽然DeepSeek R1的各方面能力已经大幅提升,大模型的“幻觉”现象和稳定性不足,仍是应用落地的瓶颈,也是在扩展业务应用范围、直接对客服务方面最大的顾虑。譬如,银行尝试用大模型生成信贷风险评估报告时,如果因模型过度“脑补”数据细节,将导致结论偏离实际而造成损失。对客服务过程中,大模型说的每一句话中,如果有一些条款或信息错误,也可能会造成客户投诉,从应用“试水”到“远航”之路还是非常漫长。
基于企业应用落地的有多种方式规避,一是在设计应用流程时,要提前设定好业务流程的关键节点,由模型执行特定擅长任务,人工把关审核,并且要对结果负责和兜底,确保生成结果效果良好及风险可控。二是打造好企业级知识库,除了能为员工提供专业的专家知识服务,不同业务条线积累的知识能够在不同的业务场景中为大模型提供更多的知识参考,降低幻觉的概率和风险。
2)企业垂直大模型建设:通用能力与垂直场景的平衡术
过去两年,多家企业开展大模型训练事业投入百模大战,一些行业头部企业也曾热衷于训练行业专属模型。但头部的通用开源大模型的能力发展更快,尤其在DeepSeek R1推出之后,其开源和各种特性能以低成本接入先进大模型技术,广大企业如今更倾向于拥抱通用大模型。
根据应用研发和业务评测积累下来的经验,我们认为不断进化的通用大模型如同“瑞士军刀”,虽非专为银行场景设计和训练,但其不断升级的智能足以应对多数场景,粗略估算能解决70%的应用需求。另外还有20%多的企业私域场景,需要了解大量的企业业务知识和私域数据才能准确决策,因此仍然需要通过微调(Fine-tuning)注入私域数据,或通过蒸馏生成轻量化模型。
3)算力基础设施:消耗水涨船高和精细化管理
OpenAI提出的模型性能随规模增长的规律(Scaling Law)概念当前依然有效,企业使用大模型的参数从十亿到百亿甚至千亿不断加码,用户请求的输入内容也从10K到10M越来越长,对计算量和算力的需求必然大幅增长。即便部署DeepSeek R1蒸馏版32B Qwen大模型,也需要消耗一至两张高端算力卡,更不用提部署使用671B DeepSeek满血版动辄几百万的品硬件资源投入。因此,智能算力的高昂投入,对所有企业来说可以算是一个奢侈品般的投入和享受。
随着业务需求场景增长,企业规模化应用的话,算力资源还是会抓襟见肘,必会是一大瓶颈。一是要加大算力采购力度,二是要通过训推平台,使算力以集约化、灵活调度的方式统筹分配,三是要形成算力申请和分配的规范,做好推理集群资源精细化管理。
四、银行业大模型应用展望:在不确定中寻找确定性,在技术浪潮中锚定航向
2025年的大模型技术既是银行业的“试金石”,也是“加速器”。前两年大部分银行都是在做小范围技术和应用的验证试点,而在今年DeepSeek的助推下,看到更广阔的应用空间,也愿意加大投入进行规模化的推广建设,寻求对企业业务带来更大的效益。技术和业务革新之路,要求我们守正创新,既不断探索突破,又坚守务实。未来的赢家,必是那些能将技术浪潮转化为业务领先的企业,正如航海者利用风浪前行,而非被其吞噬。
