马上消费金融CIO蒋宁：拨云见日，金融行业大模型落地三大真核技术

本文主要是介绍马上消费金融CIO蒋宁：拨云见日，金融行业大模型落地三大真核技术，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

“大模型”不是新东西。

在这波大模型热潮之前，工业界便已存在各种规模的模型。但由于工业领域大多涉及关键决策，实际应用时较为慎重。

有了大模型的加持，工业界的人工智能应用，迎来了全新的契机。但在这个群“模”乱舞的时代，大模型离工业界大规模应用还有多远？有哪些亟待突破的真正的核心技术？

带着这些问题，我们希望借WAIC 2023 全球人工智能大会举办的机会，找到一家一线的工业界实践者，探寻其中的答案。马上消费金融进入了我们的视线。

据马上消费金融副总经理兼首席信息官（CIO）蒋宁介绍，马上消费金融成立于2015年，目前约有3000名员工，其中2000+人是研发，而且大部分都是人工智能和大数据方向，坚持自主研发不外包，截至2023年6月底，1315件发明专利申请，已公开983件，消金行业占比52.9%，位居行业第一，妥妥的一家科技驱动的金融机构。公司目前有10万+个风险特征变量，100+个细分迭代模型，2000+个风险策略、决策及数据模型算法，实现了92.4%的智能客服分流率、100%的智能质检覆盖率、98.6%的客户综合满意度。

马上消费金融副总经理兼首席信息官蒋宁

四大挑战，拷问金融行业大模型应用痛点

作为科技赋能业务的先行者，金融行业历来是新技术应用实践的风向标。新技术在金融行业用得如何，一直备受关注。大模型当然也不例外。

在蒋宁看来，当前，金融行业大模型应用面临四个挑战。

一是关键任务和动态适应性。关键任务往往关系到生命或重大资产，比如自动驾驶、银行存款，人工智能要做到100%的准确，并不容易。而生成式模型，目前与工业界的判别式模型相结合的化学反应尚无明显效果。同时，与AlphaGo的封闭系统不同，大模型要想做到越来越聪明，就要想办法在开放的体系里让群体力量贡献给模型，让尽量多的用户参与反馈，形成生态。

二是个性化要求和隐私保护。摒弃千篇一律的教条式服务，做到千人千面，大模型在为用户提供个性化体验的同时，又能确保用户隐私，这也是一个需要解决的问题。

三是群体智能与安全可控。一方面，中国的移动互联网与PC互联网是割裂的，导致可用数据有限；另一方面，行业领域的数据往往是封闭的，很难共享。如何设计一个跨行业、组织的数据共享、权益共享且安全可控的机制，同样面临巨大挑战。

四是基础设施能力。GPU、网络、机房等基础环境要针对大模型训练、推理等方面的需求，做出相应的改造，才能发挥最大的效能。这个挑战有望最先得到解决。

三大技术，解码金融行业大模型技术前进方向

针对上面的前三个挑战，蒋宁给出了他所理解的大模型的三个真正核心的技术。

一是持续学习。这是大模型带来的最大变革，是大模型成功与否的关键。不管是千模还是万模，最核心的不是模型参数，而是大模型是否具备了生态能力，让尽量多的人使用，变得越用越聪明，具备持续学习能力，并进行正向反馈。

二是鲁棒性决策。在工业界，包括自动驾驶、医疗、金融等，虽然人工智能有99%是正确的，但只要有1%是错误的，在工业界就无法使用，因为它涉及到人命关天的重大决策。因此，要帮助大模型排除噪音、干扰，在突发、不可预期的情况下，保持决策的稳定、安全合规。

三是组合式AI。工业界之前有很多模型，大模型出现后，利用大模型的泛化能力把工作拆解，使得生成式模型可以与原先工业界的判别式模型有效结合，让两种模型的优势各自能发挥更好的价值，实现自动化GPT。

“形成真正的工业界可落地的持续学习的、解决鲁棒性的、组合式的新型AI系统，这是我们未来构建可在工业界有效使用的大模型的方向。”蒋宁如是说。

三纵三横，马上消费金融的AI实践

在蒋宁看来，马上消费金融作为AI驱动的金融科技公司，要帮助解决金融行业的三个通用问题。

一是个性化的服务和极致用户体验。金融业务有高价值、低频的特点，很难提供个性化的体验。传统的做法是分层打标签，提供不同的产品，但标签是动态变化的，因此如何自动化地决策为客户提供自动化的体验，就需要产品与众不同。

二是高效的价值传递效率。虽然金融是技术密集型、数据密集型行业，但目前线下网点还是为数不少，因为人工智能尚不能做到不出错，很多工作还要高度依赖人工操作。

三是合规安全的决策智能，这与鲁棒性相关。

基于这三方面考虑，以及上万台的服务器，近千张的GPU卡，40PB的文字、声音、图片、视频等形式的数据，马上消费金融实现了算力、算法、数据以及场景的闭环，并由此打造了“三纵三横”的AI战略。

马上消费金融的“三纵三横”战略

三纵

实时人机决策：解决工业界的鲁棒性问题，让人接手人工智能解决不了的1%的问题。
多模态大模型：积累了海量的语言、文字、图片等素材，并围绕其进行了大量的训练，形成了一套完整的多模态的资产。
数据智能：构建了2000+个模型，为2亿多用户自动化的营销、风控等服务，这本身就是稀缺的场景和资源。

三横

持续学习：确保做的事情不是一次性的，越用越聪明。
模型控制：解决鲁棒性、突发、不可预期的问题，让模型有稳定的输出，自动化找到噪音，有效排处有害的违反社会道德的数据。
组合式AI：多种模型组合应用，解决问题。

目前，马上消费金融的AI主要应用在三大场景：一是金融智能对话，实现实时人机协作、持续学习、可信安全合规；二是金融数字人，通过大模型+组合式AI多模态能力，实现有温度的数字人；三是金融服务的AI心里引擎，通过大模型的大脑与心理学的有机结合，实现有情感的人机体验。

“垂直领域的判别式模型与生成式模型等多种模型组合，构筑一个开放的持续学习、具备鲁棒性、合规安全的体系，才是大模型的真正落地，而不是一个模型靠几千亿参数去落地。我们将为之而努力。”蒋宁总结道。

这篇关于马上消费金融CIO蒋宁：拨云见日，金融行业大模型落地三大真核技术的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

马上消费金融CIO蒋宁：拨云见日，金融行业大模型落地三大真核技术

四大挑战，拷问金融行业大模型应用痛点

三大技术，解码金融行业大模型技术前进方向

三纵三横，马上消费金融的AI实践

相关文章

Java的IO模型、Netty原理解析

基于Flask框架添加多个AI模型的API并进行交互

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

SpringBoot快速接入OpenAI大模型的方法(JDK8)

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

Spring AI Alibaba接入大模型时的依赖问题小结

如何在本地部署 DeepSeek Janus Pro 文生图大模型

本地私有化部署DeepSeek模型的详细教程

DeepSeek模型本地部署的详细教程