【生成式AI】ChatGPT原理解析(1/3)- 对ChatGPT的常见误解

2024-02-26 20:20

本文主要是介绍【生成式AI】ChatGPT原理解析(1/3)- 对ChatGPT的常见误解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Hung-yi Lee 课件整理

文章目录

      • 误解1
      • 误解2
      • ChatGPT真正在做的事情-文字接龙


ChatGPT是在2022年12月7日上线的。
当时试用的感觉十分震撼。

误解1

请添加图片描述
我们想让chatGPT讲个笑话,可能会以为它是在一个笑话的集合里面随机地找一个笑话出来。
我们做一个测试就知道不是这样的了。
请添加图片描述
读完这个笑话,显然不是人讲出来的笑话,是机器生成的。

请添加图片描述
还有这样的,他还要解释一下这个笑话的笑点在哪里。

请添加图片描述
这个笑话更神奇。

这显然不是人想出来的笑话,笑点很奇怪。

误解2

请添加图片描述
当我们问chatGPT “什么是Diffusion Model”的时候,可能会以为它是在网络上搜索了很多相关的文章,然后整理重组出来的。

实际上多数ChatGPT的答案在网络上都找不到一模一样的句子,甚至有很多感觉是幻想出来的。
请添加图片描述
举一个例子,让ChatGPT展示“念能力”的网页,它理解成了念书,而且生成的这些链接都是无效链接,看着像模像样,结果是它幻想出来的。

请添加图片描述
这个是来自OpenAI的官方澄清,讲到ChatGPT是没有联网的,而且信息来自2021年之前,真假需要自己判断。
这句话的意思是它的生成内容不是来源于某一篇特定的文章,是它自己学习到的,自己生成的。

ChatGPT真正在做的事情-文字接龙

请添加图片描述
我们把ChatGPT看作一个函数,它的输入是一个句子,输出这个句子后面应该接的词汇的概率。
但是这样它也只能产生词,而不是句子。
实际上它会把产生的第一个词加到原来的句子后面再重新输入给这个函数,看看这时候概率最大的词是什么,这时候“机”的后面概率最大的可能就是“器”。
然后把“器”作为输入丢给函数,这样反复下去。
在它输出的所有符号里面会有一个代表结束的符号。
当sample出的符号是结束符号,这个回答就结束了。


请添加图片描述
它是怎么考虑过去的历史对话记录呢?
原理是一样的。
同一个对话里面的所有信息都会输入给这个函数,让这个函数决定下一步接哪一个词汇。
这个函数显然十分复杂,可能有1700亿个参数,GPT-3有1700亿个参数,ChatGPT的参数应该不会比它少。

当我们说ChatGPT是语言模型的时候实际上就是在说它是一个文字接龙的模型。


请添加图片描述

接下来要说的是这个神奇又复杂的函数是怎么被找出来的?
我们说它是通过人类老师和网上大量的资料找出来的。
当这个函数被找出来的时候就不需要网络资料了。

这篇关于【生成式AI】ChatGPT原理解析(1/3)- 对ChatGPT的常见误解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/750056

相关文章

嵌入式软件常见的笔试题(c)

找工作的事情告一段落,现在把一些公司常见的笔试题型整理一下,本人主要是找嵌入式软件方面的工作,笔试的也主要是C语言、数据结构,大体上都比较基础,但是得早作准备,才会占得先机。   1:整型数求反 2:字符串求反,字符串加密,越界问题 3:字符串逆序,两端对调;字符串逆序,指针法 4:递归求n! 5:不用库函数,比较两个字符串的大小 6:求0-3000中含有9和2的全部数之和 7

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

解析 XML 和 INI

XML 1.TinyXML库 TinyXML是一个C++的XML解析库  使用介绍: https://www.cnblogs.com/mythou/archive/2011/11/27/2265169.html    使用的时候,只要把 tinyxml.h、tinystr.h、tinystr.cpp、tinyxml.cpp、tinyxmlerror.cpp、tinyxmlparser.

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

tf.split()函数解析

API原型(TensorFlow 1.8.0): tf.split(     value,     num_or_size_splits,     axis=0,     num=None,     name='split' ) 这个函数是用来切割张量的。输入切割的张量和参数,返回切割的结果。  value传入的就是需要切割的张量。  这个函数有两种切割的方式: 以三个维度的张量为例,比如说一

数据库原理与安全复习笔记(未完待续)

1 概念 产生与发展:人工管理阶段 → \to → 文件系统阶段 → \to → 数据库系统阶段。 数据库系统特点:数据的管理者(DBMS);数据结构化;数据共享性高,冗余度低,易于扩充;数据独立性高。DBMS 对数据的控制功能:数据的安全性保护;数据的完整性检查;并发控制;数据库恢复。 数据库技术研究领域:数据库管理系统软件的研发;数据库设计;数据库理论。数据模型要素 数据结构:描述数据库