【生成式AI】ChatGPT原理解析（1/3）- 对ChatGPT的常见误解

本文主要是介绍【生成式AI】ChatGPT原理解析（1/3）- 对ChatGPT的常见误解，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Hung-yi Lee 课件整理

文章目录

- - 误解1
  - 误解2
  - ChatGPT真正在做的事情-文字接龙

ChatGPT是在2022年12月7日上线的。
当时试用的感觉十分震撼。

误解1

请添加图片描述
我们想让chatGPT讲个笑话，可能会以为它是在一个笑话的集合里面随机地找一个笑话出来。
我们做一个测试就知道不是这样的了。

读完这个笑话，显然不是人讲出来的笑话，是机器生成的。

请添加图片描述
还有这样的，他还要解释一下这个笑话的笑点在哪里。

请添加图片描述
这个笑话更神奇。

这显然不是人想出来的笑话，笑点很奇怪。

误解2

请添加图片描述
当我们问chatGPT “什么是Diffusion Model”的时候，可能会以为它是在网络上搜索了很多相关的文章，然后整理重组出来的。

实际上多数ChatGPT的答案在网络上都找不到一模一样的句子，甚至有很多感觉是幻想出来的。
请添加图片描述
举一个例子，让ChatGPT展示“念能力”的网页，它理解成了念书，而且生成的这些链接都是无效链接，看着像模像样，结果是它幻想出来的。

请添加图片描述
这个是来自OpenAI的官方澄清，讲到ChatGPT是没有联网的，而且信息来自2021年之前，真假需要自己判断。
这句话的意思是它的生成内容不是来源于某一篇特定的文章，是它自己学习到的，自己生成的。

ChatGPT真正在做的事情-文字接龙

请添加图片描述
我们把ChatGPT看作一个函数，它的输入是一个句子，输出这个句子后面应该接的词汇的概率。
但是这样它也只能产生词，而不是句子。
实际上它会把产生的第一个词加到原来的句子后面再重新输入给这个函数，看看这时候概率最大的词是什么，这时候“机”的后面概率最大的可能就是“器”。
然后把“器”作为输入丢给函数，这样反复下去。
在它输出的所有符号里面会有一个代表结束的符号。
当sample出的符号是结束符号，这个回答就结束了。