AI大模型Deepseek的面世,正悄然影响银行的金融大模型研发应用策略。

一位股份行IT部门人士向记者透露,2月5日,他们内部已着手对Deepseek进行初步测试,观察它在智能客服、内部办公等业务场景,相比其他大模型是否产生更强的降本增效作用。

“围绕大模型在金融场景中的应用,我们做过不少尝试,包括购买GPU卡自研金融大模型,以及在其他通用大模型的基础上研发金融小模型,但这两种方式都花费不少。”他告诉记者。如今Deepseek在数据训练方面的较低操作成本,让他们看到金融大模型研发应用方面的投入产出比有望进一步上升。

一位城商行银行IT部门人士向记者透露,春节期间,他们IT团队已讨论在Deepseek开源大模型基础上研发自己的金融大模型。

他透露,由于中小银行在金融大模型研发方面的投入不高,数据训练成本相对更低的Deepseek反而是中小银行自研金融大模型的新突破口,一旦Deepseek在数据训练成本、生成式内容准确性、投入产出比等方面具有更好效果,他们将重点围绕Deepseek研发自己的金融大模型。

在这位城商行银行IT部门人士看来,Deepseek的面世,有望缩小众多中小银行与少数大型银行在金融大模型研发应用方面的“鸿沟”。

上海交通大学上海高级金融学院副院长李峰此前接受记者采访时表示,随着AI大模型在金融业务场景的应用日益广泛,它能否真正推动金融行业高质量发展,关键在于它能否给金融机构带来实质的降本增效。

前述股份行IT部门人士向记者透露,为了自研金融大模型,前些年银行花费不少资金购买GPU卡搭建较高算力,导致金融大模型研发的实际投入成本较高。若Deepseek应用能令银行在金融大模型研发过程的算力投入明显减少,他们也乐意围绕Deepseek研发金融大模型。

“尤其是AI Agent(智能体)正日益在更多金融场景得到应用,银行正面临更大的算力瓶颈,Deepseek对算力消耗的较低要求,无形间解决了银行在AI Agent研发应用过程中的算力问题。”他告诉记者。这无形间将加快银行推进AI Agent的研发应用。

投入产出比“提升” 中小银行有底气自研金融大模型

近年,AI大模型技术在银行业务场景的应用日益广泛。无论是普惠金融、风控、客户营销、支付,还是函证、跨境金融、票据融资、供应链金融等场景,都能看到AI大模型的身影。

在客服环节,AI大模型正帮助众多银行提升坐席人员工作效率——通过AI大模型的赋能,坐席人员能更精准地了解用户意图,迅速响应用户的各种金融服务需求。

在信贷风控环节,AI大模型正推动银行更高效精准地开展大数据分析,持续优化信贷风控引擎,快速给出更科学的信贷决策。尤其是在AI大模型支持下,部分中小银行有底气在客户数据相对较少的情况下启动新信贷业务,有效抵御黑灰产组织的攻击。

在财富管理环节,AI大模型协助银行客户经理全面分析用户以往的资产配置状况,并结合用户最新需求,给予更科学的财富管理解决方案,进一步提升财富管理的用户满意度。

为了进一步提升AI大模型应用成效与扩大应用场景,越来越多银行纷纷根据自身业务特色自研金融大模型,进一步提升各项业务操作效率。

与此同时,银行一面积极拥抱金融大模型,一面也面临投入产出比的挑战。

李峰向记者透露,AI大模型的研发成本相当高,进行一次数据训练的费用或达到千万美元。因此,相比大型金融机构拥有足够财力支撑金融大模型自研应用,众多中小金融机构往往会选择成本更低的金融大模型研发路径。

他透露,基于成本控制考虑,中小金融机构研发金融大模型主要采取三种路径,一是与外部大模型服务商合作,借助后者的大模型技术,再结合自身的私域数据进行微调,形成适合自己业务场景的AI小模型,二是采取抱团取暖策略,即多家中小金融机构合作研发金融大模型,但数据的跨公司交流面临较大的合规风险;三是通过行业性的公共平台布局研发AI大模型技术。

上述股份制银行IT部门人士告诉记者,这些年银行自研金融大模型的投入不菲——除了花费不菲资金采购GPU卡,还需重金聘请熟谙大模型研发的专业人才。此外,即便金融大模型的数据训练规模参数小于通用大模型,但每次数据训练的实际耗费也超过百万元。

“前些年大模型比较看重数据规模参数大小期间,我们额外增加了预算购买GPU卡,为了满足百亿级数据参数的金融大模型数据训练。”他告诉记者,如此高的投入,也令银行内部一直在讨论金融大模型自研的投入产出比。毕竟,金融大模型在不同业务场景的使用成效不一,比如在智能客服、内部办公等方面的应用效果相对较好,但在普惠金融、信贷风控、跨境业务等场景,由于涉及客户数据信息保护等合规操作要求,其只能作为业务操作辅助工具,大量工作仍需人工完成。

在他看来,若Deepseek较低的算力投入要求与数据训练成本能显著降低银行研发金融大模型的投入,并产生与其他大模型技术相当的AI生成式内容效果,它将对银行大模型应用产生三大影响,一是Deepseek将成为中小银行使用较低成本自研金融大模型的新突破口,令大型银行与中小银行在大模型应用的“差距”明显缩小;二是越来越多银行将倾向自研金融大模型,以往依托外部通用大模型进行私域数据微调研发金融小模型的做法或明显减少;三是基于Deepseek大模型的开源特点,部分银行大模型研发团队有望结合自身的业务特点与业务创新需要,自研更契合银行自身业务需求的专属金融大模型。

清华大学金融科技研究院副院长薛正华此前表示,随着大模型在银行等金融场景的应用日益广泛,金融机构对大模型能力的要求日益增加,具体表现在金融信息分类、抽取、计算、逻辑推理、图文生成以及编程等能力,尤其是银行在一些大模型高阶领域,比如多轮分析推理、业务领域思维链、业务预测推演准确度、效率、投产比等方面的要求也在持续提升。

在他看来,针对严苛的金融业务合规操作要求,采用MoE混合专家模型或许是一条比较有效的金融大模型发展路径,每个子领域或场景都有专业的Expert,负责做细、做深、做精、做准,达到或超过人类专家水平。对于综合性问题,发挥MoE多专家协同的方式解决,效果往往更好。例如针对具体场景的客服、客户营销等,AI生成结果的颗粒度越细、越快、越专业、越精准,效果越好;针对综合贷款方案设计、综合理财方案等多场景融合业务,多模型协同往往带来更好效果。

这位股份制银行IT部门人士告诉记者,Deepseek的一项特点,是它通过算法优化,在使用很低的算力计算资源情况下充分调动混合专家MoE模型架构与AI深度学习能力,给出精准专业的AI生成式内容。这同样契合银行研发金融大模型的发展方向。

“目前,我们内部发起了一个工作组,复刻Deepseek开源大模型并进行数据训练与金融场景应用测试,检测其AI生成式内容效果是否与其他大模型相当,以及数据训练成本是否明显降低。”他告诉记者,若Deepseek的降本增效作用明显增强,不排除他们会更多使用Deepseek研发自己的金融大模型,并应用在更多业务场景。

李峰表示,即便是大型金融机构自研大模型,由于AI大模型技术迭代需要耗费大量GPU卡,因此大型金融机构一面需注意GPU卡的较大损耗成本,一面要关注大模型技术的创新发展趋势,通过“与时俱进”部署前沿AI科技,确保自身的金融大模型技术处于领跑地位。

算力瓶颈“解决” 银行加快推进AI Agent研发应用

随着AI大模型技术快速迭代升级,如今AI Agent(智能体)在银行业务场景的应用日益增多。

相比传统AI大模型,AI Agent能自主感知环境,并开展自主决策、执行动作、反馈效果与迭代优化,令金融机构的运营效率与业务风险识别防范能力“更上一层楼”。

目前,部分欧美大型银行机构已尝试使用AI Agent,自主回复用户的各种金融业务疑问,进一步提升智能客服响应效率与降低坐席人工成本。

奇富科技CEO吴海生此前接受记者专访时表示,已有金融机构尝试在某些金融业务场景使用AI Agent。但它仍需具备三大条件:首先,金融机构的AI Agent底层技术需发展得足够好;其次,金融机构需要找到适合AI Agent的业务场景,并形成相应的产品服务;第三,这项基于AI Agent的金融服务体验是否足够无感与优雅,让用户喜欢这个“小助手”。

上述城商行IT部门人士向记者透露,此前他们曾尝试引入AI Agent技术应用在客服、内部办公、客户营销等场景,但他们很快发现,算力瓶颈是制约国内中小银行布局AI Agent技术的一大挑战。相比AI大模型,由于AI Agent强调自主感知与自主决策,需要更多算力开展数据训练与算法优化,从而确保AI Agent在用户个性化金融服务需求面前做出准确专业的决策。这意味着银行需要购买更多GPU卡以支持AI Agent研发应用。

“鉴于Deepseek的算力消耗要求与数据训练成本较低,我们正考虑能否通过Deepseek训练AI Agent。”他告诉记者。

记者多方了解到,尽管Deepseek有助于降低银行研发AI Agent的算力束缚,但AI Agent能否快速应用在银行部分业务场景,仍存在一定变数。究其原因,是相比开源的LLM大语言模型技术既可以在本地环境进行部署且能更好控制与管理数据以满足监管要求,AI Agent技术尚未完全成熟,银行如何做好数据隐私保护、数据加密和访问控制等合规操作要求,仍需相关部门出台具体细则。因此AI Agent主要在银行内部某些基础、简单、通用、不涉及用户数据外泄风险的业务场景使用。

李峰此前接受记者专访时透露,尽管AI Agent发展速度相当快,但由于金融机构属于强监管行业,相关部门是否允许AI大模型自主开展金融业务决策,仍是未知数。金融机构在使用AI Agent时,仍需高度关注合规操作风险。

上述股份制银行IT部门人士告诉记者,随着AI Agent技术日益成熟,加之数据加密调取技术持续进步、金融机构尝试将AI Agent应用在部分金融业务场景,将是一种趋势。毕竟,AI Agent能发挥更强的智能化服务与降本增效作用。但这项趋势能否落地的一大前提,是银行能否有效解决AI Agent等前沿大模型技术自身存在的风险,比如技术风险、运营风险、道德风险,以及对客户隐私数据的保护风险等。

ad1 webp
ad2 webp
ad1 webp
ad2 webp