马上消费金融CIO蒋宁:拨云见日,金融行业大模型落地三大真核技术

本文主要是介绍马上消费金融CIO蒋宁:拨云见日,金融行业大模型落地三大真核技术,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

“大模型”不是新东西。

在这波大模型热潮之前,工业界便已存在各种规模的模型。但由于工业领域大多涉及关键决策,实际应用时较为慎重。

有了大模型的加持,工业界的人工智能应用,迎来了全新的契机。但在这个群“模”乱舞的时代,大模型离工业界大规模应用还有多远?有哪些亟待突破的真正的核心技术?

带着这些问题,我们希望借WAIC 2023 全球人工智能大会举办的机会,找到一家一线的工业界实践者,探寻其中的答案。马上消费金融进入了我们的视线。

据马上消费金融副总经理兼首席信息官(CIO)蒋宁介绍,马上消费金融成立于2015年,目前约有3000名员工,其中2000+人是研发,而且大部分都是人工智能和大数据方向,坚持自主研发不外包,截至2023年6月底,1315件发明专利申请,已公开983件,消金行业占比52.9%,位居行业第一,妥妥的一家科技驱动的金融机构。公司目前有10万+个风险特征变量,100+个细分迭代模型,2000+个风险策略、决策及数据模型算法,实现了92.4%的智能客服分流率、100%的智能质检覆盖率、98.6%的客户综合满意度。

马上消费金融副总经理兼首席信息官 蒋宁

四大挑战拷问金融行业大模型应用痛点

作为科技赋能业务的先行者,金融行业历来是新技术应用实践的风向标。新技术在金融行业用得如何,一直备受关注。大模型当然也不例外。

在蒋宁看来,当前,金融行业大模型应用面临四个挑战。

一是关键任务和动态适应性。关键任务往往关系到生命或重大资产,比如自动驾驶、银行存款,人工智能要做到100%的准确,并不容易。而生成式模型,目前与工业界的判别式模型相结合的化学反应尚无明显效果。同时,与AlphaGo的封闭系统不同,大模型要想做到越来越聪明,就要想办法在开放的体系里让群体力量贡献给模型,让尽量多的用户参与反馈,形成生态。

二是个性化要求和隐私保护。摒弃千篇一律的教条式服务,做到千人千面,大模型在为用户提供个性化体验的同时,又能确保用户隐私,这也是一个需要解决的问题。

三是群体智能与安全可控。一方面,中国的移动互联网与PC互联网是割裂的,导致可用数据有限;另一方面,行业领域的数据往往是封闭的,很难共享。如何设计一个跨行业、组织的数据共享、权益共享且安全可控的机制,同样面临巨大挑战。

四是基础设施能力。GPU、网络、机房等基础环境要针对大模型训练、推理等方面的需求,做出相应的改造,才能发挥最大的效能。这个挑战有望最先得到解决。

三大技术解码金融行业大模型技术前进方向

针对上面的前三个挑战,蒋宁给出了他所理解的大模型的三个真正核心的技术。

一是持续学习。这是大模型带来的最大变革,是大模型成功与否的关键。不管是千模还是万模,最核心的不是模型参数,而是大模型是否具备了生态能力,让尽量多的人使用,变得越用越聪明,具备持续学习能力,并进行正向反馈。

二是鲁棒性决策。在工业界,包括自动驾驶、医疗、金融等,虽然人工智能有99%是正确的,但只要有1%是错误的,在工业界就无法使用,因为它涉及到人命关天的重大决策。因此,要帮助大模型排除噪音、干扰,在突发、不可预期的情况下,保持决策的稳定、安全合规。

三是组合式AI。工业界之前有很多模型,大模型出现后,利用大模型的泛化能力把工作拆解,使得生成式模型可以与原先工业界的判别式模型有效结合,让两种模型的优势各自能发挥更好的价值,实现自动化GPT。

“形成真正的工业界可落地的持续学习的、解决鲁棒性的、组合式的新型AI系统,这是我们未来构建可在工业界有效使用的大模型的方向。”蒋宁如是说。

三纵三横马上消费金融的AI实践

在蒋宁看来,马上消费金融作为AI驱动的金融科技公司,要帮助解决金融行业的三个通用问题。

一是个性化的服务和极致用户体验。金融业务有高价值、低频的特点,很难提供个性化的体验。传统的做法是分层打标签,提供不同的产品,但标签是动态变化的,因此如何自动化地决策为客户提供自动化的体验,就需要产品与众不同。

二是高效的价值传递效率。虽然金融是技术密集型、数据密集型行业,但目前线下网点还是为数不少,因为人工智能尚不能做到不出错,很多工作还要高度依赖人工操作。

三是合规安全的决策智能,这与鲁棒性相关。

基于这三方面考虑,以及上万台的服务器,近千张的GPU卡,40PB的文字、声音、图片、视频等形式的数据,马上消费金融实现了算力、算法、数据以及场景的闭环,并由此打造了“三纵三横”的AI战略。

马上消费金融的“三纵三横”战略

三纵

  1. 实时人机决策解决工业界的鲁棒性问题,让人接手人工智能解决不了的1%的问题。
  2. 多模态大模型积累了海量的语言、文字、图片等素材,并围绕其进行了大量的训练,形成了一套完整的多模态的资产。
  3. 数据智能:构建了2000+个模型,为2亿多用户自动化的营销、风控等服务,这本身就是稀缺的场景和资源。

三横

  1. 持续学习:确保做的事情不是一次性的,越用越聪明。
  2. 模型控制:解决鲁棒性、突发、不可预期的问题,让模型有稳定的输出,自动化找到噪音,有效排处有害的违反社会道德的数据。
  3. 组合式AI多种模型组合应用,解决问题。

目前,马上消费金融的AI主要应用在三大场景:一是金融智能对话,实现实时人机协作、持续学习、可信安全合规;二是金融数字人,通过大模型+组合式AI多模态能力,实现有温度的数字人;三是金融服务的AI心里引擎,通过大模型的大脑与心理学的有机结合,实现有情感的人机体验。

“垂直领域的判别式模型与生成式模型等多种模型组合,构筑一个开放的持续学习、具备鲁棒性、合规安全的体系,才是大模型的真正落地,而不是一个模型靠几千亿参数去落地。我们将为之而努力。”蒋宁总结道。

这篇关于马上消费金融CIO蒋宁:拨云见日,金融行业大模型落地三大真核技术的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/160910

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者