支持处理30万中文汉字的超长文本大模型——“国产大模型五虎”之零一万物

本文主要是介绍支持处理30万中文汉字的超长文本大模型——“国产大模型五虎”之零一万物,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:

在前面的四篇文章中,我们分别介绍了KimiChat,MiniMax,智谱AI以及百川智能四个国产大模型,他们都被称之为“国产大模型五虎”。今天来到了这个系列的最后一章:零一万物,至此,大模型五虎全部集齐。


在介绍零一万物之前,我们先来看一组数据

这是截止到今年2月份, 中文大模型基准SuperCLUE统计的关于“国内外大模型发展趋势”的数据,其中的数值代表了发展的水平,我们可以清晰的看到虽然GPT一直是处于领先地位,但是国内的大模型已经实现了代际赶超的奇迹,远超GPT3.5的水平,无限接近GPT4.0的能力。

由此可知,尽管国内大模型发展起步的晚,但是在发展规模和发展潜力上却有着显著的优势。同样的,今天我们介绍的大模型,也是起步虽晚,但目前已经在超长文本处理领域取得了领先的地位。

下面我们就来一探究竟,看看这最后“一虎”,到底有何能力受诸多资方的青睐

提到李开复,相信大家都不陌生吧,曾在微软,谷歌等企业任职,后来创立了创新工场,一直活跃在AI领域。

零一万物则是由他带领一众全球顶尖科技公司的专业人才创立的一家AI大模型创业公司,专注于AI 2.0平台和应用的研发。

零一万物最新发布的大模型是“Yi”系列,包括Yi-6B和Yi-34B两个版本,

Yi-34B是一个具有340亿参数的基础模型,而Yi-6B的参数规模为60亿

这两个模型都是中英双语开源大模型

Yi-34B在关键指标上胜过市场上已有的领先开源模型,包括Meta的Llama 2,并在Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单中爬升到第一位,成为全球开源大模型“双料冠军”

Yi-34B拥有全球大模型中最长的200K上下文窗口,可以处理约40万字的文本(官网公布的数据,实际上属于是反向虚标了,值得表扬),相当于他可以阅读理解超1000页PPT,一次性读完两本《三体》

既然说到这了,那我们就来实测一下看看它超长文本处理的能力到底是不是浪得虚名

我节选了《平凡的世界》的其中部分文字约25万字(原文100W字),来测试一下它的阅读能力

一共问了5个问题,从最基本的阅读,再到理解 ,和发表自己的看法,零一万物都给出了比较满意的答案。

不亏是霸榜SuperCLUE-256k的唯一大模型

超长文本能力确实吊,那我们再试试它的其它能力

老规矩,放上一个数学题让它解一下看看

我向它提问:565547854121的平方是多少

这就尴尬了不是,后面给我打了无数个9

又试了一下角色扮演能力,中规中矩,跟其它几个大模型表现的水平差不多


简单总结一下,Yi-34B确实有自己的过人之处,被称之为AI独角兽确实当之无愧,但是在一些方面还是距ChatGPT有不小的差距。

最后附上一张当前最新的国内外大模型能力总排行榜单

这篇关于支持处理30万中文汉字的超长文本大模型——“国产大模型五虎”之零一万物的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/911194

相关文章

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

Springboot处理跨域的实现方式(附Demo)

《Springboot处理跨域的实现方式(附Demo)》:本文主要介绍Springboot处理跨域的实现方式(附Demo),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录Springboot处理跨域的方式1. 基本知识2. @CrossOrigin3. 全局跨域设置4.

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Python实现自动化接收与处理手机验证码

《Python实现自动化接收与处理手机验证码》在移动互联网时代,短信验证码已成为身份验证、账号注册等环节的重要安全手段,本文将介绍如何利用Python实现验证码的自动接收,识别与转发,需要的可以参考下... 目录引言一、准备工作1.1 硬件与软件需求1.2 环境配置二、核心功能实现2.1 短信监听与获取2.

Python使用date模块进行日期处理的终极指南

《Python使用date模块进行日期处理的终极指南》在处理与时间相关的数据时,Python的date模块是开发者最趁手的工具之一,本文将用通俗的语言,结合真实案例,带您掌握date模块的六大核心功能... 目录引言一、date模块的核心功能1.1 日期表示1.2 日期计算1.3 日期比较二、六大常用方法详

使用Python实现文本转语音(TTS)并播放音频

《使用Python实现文本转语音(TTS)并播放音频》在开发涉及语音交互或需要语音提示的应用时,文本转语音(TTS)技术是一个非常实用的工具,下面我们来看看如何使用gTTS和playsound库将文本... 目录什么是 gTTS 和 playsound安装依赖库实现步骤 1. 导入库2. 定义文本和语言 3

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

Python实现常用文本内容提取

《Python实现常用文本内容提取》在日常工作和学习中,我们经常需要从PDF、Word文档中提取文本,本文将介绍如何使用Python编写一个文本内容提取工具,有需要的小伙伴可以参考下... 目录一、引言二、文本内容提取的原理三、文本内容提取的设计四、文本内容提取的实现五、完整代码示例一、引言在日常工作和学