我用大模型校稿出书的经验心得

2024-06-01 08:44

本文主要是介绍我用大模型校稿出书的经验心得,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


1. 第一本AI校稿的书

我的新书《云计算行业进阶指南》已经出版,本书使用了大模型进行AI校对书稿。

在本文稿发布前,我问了好几个AI,AI都说“还没有出版书籍宣称自己使用了AI校稿”,因此我可以说:

  • 本书是第一本公开宣称使用AI校稿的书籍,

  • 我是第一个公开宣布使用了AI校对稿件的作者。

我AI校稿的工作在2023年就完成了,这篇文章也早就写好了,但必须等书籍正式出版,我才能向各位做分享介绍。

我的用词很严谨,因为是出版社给我提出使用AI校稿的工作建议,我估计有很多编辑已经在使用AI校稿了,所以说这是第一本“作者公开使用AI校稿”的书籍。

ab75e846d80997ce1296c2723f46401e.jpeg


2. AI协作后,我证明人依旧有价值

我很讨厌某些人只知道跟AI表演贫嘴胡扯,然后就一惊一乍的宣传AI会取代人类的工作。这些肤浅的人日常就是“职场投机者”,他们看到AI可以比他们更滑、更快、更无底限的说“车轱辘套话”、“快速生成报告总结”,他们以为自己的各种扯淡、抢功和甩锅行为,就是人类的工作价值。而他们孱弱的思考能力根本守不住AI的攻击,AI确实会让这些肤浅的人失业。

在我使用AI校稿之前,我就尊重自己的同事和供应商。我会思考如何同向协作方解释真实需求,我会评估协作方的能力极限,我验证协作方的工作结果,最终我本人承担总结和判断的责任。就算AI的智商就算超越了自然人,我过去和自然人怎么协作分工,现在就能和AI如何分工协作。

在我使用AI校稿之后,我更验证了自己的观点:

  • AI像一个勤奋认真,但对现场环境和工作目标一无所知的新员工。

  • AI可以提高我的工作效率,是个很称职的助手和工具,但AI不会取代我(以及和我类似的劳动者)独有的工作价值。

1db80b4135a8b919ce933759ca506e18.png


3. 我为什么需要AI校稿

我找AI校稿并不是让AI替我写稿,而是替我校对修改书稿中过于口语化的部分,并给出书面化的修改建议。

我写好、提交给编辑的只是书籍的原稿,出版社会对原稿进行书面化、出版口吻的校对修改。编辑和作者不可能面对面核对原稿,而是每周一两万字的文档沟通。编辑堆积修改的内容越多,越容易误解作者原稿的意思,进而导致二次三次修改。

为了减少自己提交原稿的错误概率,我使用腾讯的混元大模型(混元助手)帮我校对稿件。在保留作者原意、兼顾书面语规范的前提下,我每次给AI提交几百字的稿件,AI可以立刻反馈给我校准后的内容,这比我和编辑按照每周沟通一次、每次沟通上万字的效率高得多。

博文视点的总编张春雨表示:“相比作者手写的原稿,AI校对过的稿件能减少编辑们50%的校对工作量”。他的评价,实现了我用AI校稿的工作目的。

我随机选择了书稿中的四段文字,说明口语化原文和AI校稿后的区别:

这是我手写书稿中的四条原始文稿:

  1. ARM处理器相对X86处理器的特点是“便宜高效但专用”。

  2. 因为裸金属产品……,所以裸金属产品……。

  3. 根据……,网络应用防火墙(简称WAF)属于……。

  4. PaaS云产品一般不会向中小客户披露群集的性能和承载能力。

这是AI校稿后输出的文稿:

  1. ARM处理器相对于X86处理器的特性可以概括为“成本较低但适用范围窄”。

  2. 由于裸金属产品……,因此裸金属产品……。

  3. 参照……,Web应用防火墙属于……。

  4. PaaS云产品通常不会向中小客户公开集群的性能和承载能力。

这些对话式AI服务都是在线服务,其文字矫正结果会有动态的变化,我在今年3月份特地将对话输出过程做了几份截图留念,但这些截图的篇幅过长,放在本文的结尾处了。

403ead49d25ff62c757f06da05f80750.png


4. 粗放校稿变成了儿戏

最初,我听出版社给了个“用AI校对稿件”的粗糙建议,我就随便找了一些AI碰运气,让第一次AI校稿的工作变成了儿戏。

我当时没给AI做角色定义,也没给出合适的提示词,只是跟AI吼了一嗓子“我要改个书稿,你帮我看看”,然后就发给AI两千字的书稿。

  • 我的这种工作逻辑,很像那种一股脑把需求甩给同事、一问三不知、甩手当掌柜、就知道诈唬方案的职场投机分子们。

  • AI就像刚办完入职手续,就立刻扛起重任的新员工一样,陷入了“努力的茫然”之中。但我敢跟AI(新员工)偷懒比烂,AI(新员工)就能比我更狠更烂。我发给AI的两千字,AI确实给我校对了两千字,但回复的内容99%和原文相同。

这种粗放校稿的结果,就是我无法评估和验收协作者的工作成果。因为笼统来看,我找不出AI修改了哪些内容,但我仔细核对又发现AI确实修改了1%的内容,而且修改的方向还不一定是对的。这就导致我要逐字细看AI的回复,眼睛都快累花了,简直就是在玩文字游戏“找不同”。

有人会提醒我,可以让AI帮我给两段基本雷同的文字找差异。兄弟们,相信我,这些方法我都试过,工作量只会更大……只要我还需要承担总结和判断的责任,AI给出答案我都要做结果校验。

cf8b09e018083fa3579e841f351b64bb.png


5. 摆正心态和AI合作

经过上述碰壁,我开始自我反思:我找一个新入职同事帮忙干活,也得说明工作目标和现有环境状态。如果我想让AI把活干好,那就要给AI预设好角色,告诉AI我具体要改什么内容,给AI提供明确的提示词。

为了让AI进入图书编辑的角色,让书稿改到符合出版规范,我和出版社编辑们多次沟通后,终于写出了下列很合理的提示词,并将这一长串儿提示词应用到和混元大模型的对话之中:

  • 假设你是在一个出版社的图书编辑,对一篇云计算相关的书稿进行内容编辑加工,现在需要你修正我的稿件,直至符合中国出版行业的文字规范要求。

  • 该稿件需要参照下列标准进行加工:

  • 1.遵守简体中文语法规则,修改书稿中存在的语病,使词语的搭配准确、得当。

  • 2.遵守现代汉语要求,修改书稿中的错别字和拼写错误,修改标点符号的使用错误。

  • 3.遵守中国出版图书的语法规则,避免口语化表达,尽量使用更正式、更优雅的书面表达,但是不能改变文稿原有的叙述目的。

  • 4. 提交的稿件内容属于一本云计算书籍的“(本部分仅为举例,会经常更换内容:序言/云磁盘超卖复用/VPC产品功能/裸金属产品优势)”部分的章节,根据需要修改的内容所在的云计算和IT技术专业领域,准确地使用相关技术和服务术语,并保证术语的一致性。

  • 5.如果待编辑的书稿不存在上述4个方面的问题,请不要对书稿做修改,保留原文内容。

  • 6.我后续所有的沟通都是书稿内容,请你将修改完成后的文稿,直接回复到此文本框。

  • 如果你明白我的意思,请回复“明白”,并保持静默。

通过提供这些提示词,我每次会AI提交几百字,AI会立刻回复校验完毕的内容。我并不是盲目使用AI校稿的返利内容,而是对比原稿和AI修改稿件后,采信了AI校稿大约70%的内容,这个繁忙的过程持续了一个月。我将AI校对过的书稿发给出版社以后,编辑感觉到书稿质量有明显的提升。

除了文稿以外,我还使用AI生成很多炫酷的抽象配图。用户与其费力琢磨这些抽象图的提示词,还不如随便说一下自己的感想,让AI生成几十张图片,然后自己选感觉最好的配图。但本书书中的精确表格我没使用AI生成,因为向AI解释我要怎么绘制表格了,还不如自己用办公软件截图。就此来看,我们和AI的协作过程,很像老板和平面设计师的沟通过程。

6197c31c42c4b6bccb59d687890e935d.png


6. AI校对后仍然是我的稿子

在经过AI校稿以后,自然就会引来一个新问题,这稿子到底还是不是我的,会不会有版权问题?我并不是法律专家,但我也为此做了一些准备。

  • 首先,本书的内容并不限于简单总结罗列已有知识,更不是抖机灵说废话,本书有我原创的观点和论证过程。只有我有与本书相配套的成长经历,只有我能写出这种内容,不仅AI写不出来,其他云计算从业者也写不出来。

  • 其次,从出版社编辑的角度看,我用AI校稿后,我提供的稿件更易读了,降低了大家为细枝末节错别字沟通和误解的成本,编辑仍然会对稿件做人工校对修改。

  • 第三,我也怕遇到无理搅三分的欧美讼棍。大家闲聊可以高唱外国月亮大又圆,但这是涉及到切身利益的的严肃选择,我肯定优选国产AI。国内至少不会像欧美那样,让资本和讼棍一手遮天。

下文是无声配图:我才是主角啊。

3ae1d7f645c97a85387cc9dff7f4f4a2.gif


结束语

用AI校稿是一次奇妙的经历,在实际应用AI以后,我很有信心得到这个结论:

  • AI只是我的工具、助手和协作者,它的初始工作能力就像是一个有知识但无经验,不了解具体工作环境、不了解具体工作目标的新员工。

  • AI这个工具能切实提高了我的工作效率,和AI协作的过程,就像是驱动一个真诚、干练但不了解需求的新员工工作。

  • 我依旧拥有AI难以替代的思考价值,我也依旧能为AI处理过的数据负责。


附录-混元大模型实操截图

因为混元大模型是一个在线业务,读者们做同样的尝试,可能会出现不同的结果。我在2023年10月完成的AI校稿工作,我在2024年3月,又将本文中提及的四处修改样例,在混元大模型上实验了一次:

这些测试截图太长了,加在前文不易阅读,所以都摆放在文末了:

首先简单回顾我用AI对文稿修改的样例总结:

四条原始文稿:

  1. ARM处理器相对X86处理器的特点是“便宜高效但专用”。

  2. 因为裸金属产品……,所以裸金属产品……。

  3. 根据……,网络应用防火墙(简称WAF)属于……。

  4. PaaS云产品一般不会向中小客户披露群集的性能和承载能力。

混元大模型AI校稿后输出的文本:

  1. ARM处理器相对于X86处理器的特性可以概括为“成本较低但适用范围窄”。

  2. 由于裸金属产品……,因此裸金属产品……。

  3. 参照……,Web应用防火墙属于……。

  4. PaaS云产品通常不会向中小客户公开集群的性能和承载能力。

当我重复了和本文相同的提示词以后,第一、第二、第四实验结果和我当初校稿的结果基本相同,第三次实验结果发生了很有趣的变异。AI大模型都是越变越聪明的,相信大家在试用时,会发现更大的模型进步。

第一个例句实测截图见下文:

1fe3de4f08d8d19eafcf8715af95a4b9.png

第二个例句实测截图见下文:

5782dc0099d6d0089e4856e67b26ed3e.png

第三个例句实测截图见下文:

d2f374cd40525fbaa5556589e8475539.png

第四个例句实测截图见下文:

38d0ffc1799c45d906d926c9a1a8ec04.jpeg

这篇关于我用大模型校稿出书的经验心得的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1020527

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号