科技部出手!科研人员的 AIGC 使用手册来了,学术界开始防范 AI 枪手

本文主要是介绍科技部出手!科研人员的 AIGC 使用手册来了,学术界开始防范 AI 枪手,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

篡改实验数据、实验图片造假、论文不当署名、教材编写抄袭……1 月 16 日下午,华中农业大学的 11 名学生「一纸诉状」,以一份 125 页的举报材料实名举报该校黄姓教授存在学术不端行为。一时间,舆论迅速发酵,「赌上前程捍卫学术清白」、「人人都是学术造假受害者」等相关内容在各大平台引发热烈讨论。

有网友由此联想到了此前的阿尔兹海默症开山论文造假事件,这篇被引用 2300 余次的 Nature 论文误导了全球阿尔茨海默病研究长达 16 年。

心无旁骛求是真,艺不精深未可言。过去的百余年间,学术清正之风、造福人类的崇高信仰,是指引莘莘学子在科研道路上步履不停的明灯,但如今却掺杂了越来越多的名利诱惑,致使学术造假屡禁不止。尤其是在 AI、大模型等技术的快速发展之下,新兴技术却成为了科研作弊的「帮凶」,不仅对坚持研学的科研人员不公,虚假研究数据还可能造成严重后果。

所以,在严查学术造假的同时,规范 AI 等技术在科研中的应用也十分重要。

划清边界,依规合理使用生成式人工智能

学术论文造假由来已久,除了抄袭,编造数据等常规手段,花钱请写手、 「论文工厂」代写、炮制论文等行为也是屡见不鲜。

如今,以 ChatGPT 为代表的生成式人工智能技术 (AIGC) 横空出世,人们写论文提供了新帮手。从选题筛选到文稿润色、从统计分析到图表制作……其功能之强大,几乎覆盖了学术论文写作过程的方方面面,的确可以帮助科研人员快速完成文献检索、数据处理、翻译润色等工作。

但凡事都有双面性,如果研究人员将 AIGC 生成的文本当作自己的创作,很大程度上会产生毫无价值的「学术泡沫」。此外,过度依赖 AIGC 产生不可靠的研究成果,将导致科学研究的可信度大打折扣。

2023 年 12 月 21 日,科技部监督司发布《负责任研究行为规范指引(2023)》(以下简称《指引》),针对社会关注的人工智能、重大成果发布等热点问题,旗帜鲜明地划定了红线。

在这里插入图片描述

《指引》在研究选题与实施部分指出:科研人员研究项目的申报材料应真实、准确、客观。不得使用相同或相似研究内容重复申报,未经同意不得将他人列为研究团队成员。不得抄袭、买卖、代写申报材料,不得使用生成式人工智能直接生成申报材料

应遵循相关法律法规及学术规范,依规合理使用生成式人工智能处理文字、数据或学术图像,防范伪造、篡改数据等风险。

在这里插入图片描述

在文献引用上,《指引》也明确规定了:使用生成式人工智能生成的内容,特别是涉及事实和观点等关键内容的,应明确标注并说明其生成过程,确保真实准确和尊重他人知识产权。对其他作者已标注为人工智能生成内容的,一般不应作为原始文献引用,确需引用的应加以说明。不得直接使用未经核实的由生成式人工智能生成的参考文献

《指引》从研究实施、数据管理、成果署名与发表、文献引用等方面明确了合理使用生成式人工智能的边界,对于保护科学研究的可信度和伦理原则具有重要意义,有助于防止不负责任地使用生成式 AI 及相关技术。

国内外知名期刊对 AI 生成论文进行规范

学术论文造假是一个全球性的问题,生成式 AI 的出现在一定程度上降低了造假门槛,ChatGPT 等聊天机器人「一本正经说瞎话且能自圆其说」的能力更是为这些人提供了便利。但随着 AIGC 的使用边界不断清晰,除了明确法规规范外,国内外也有越来越多的学术机构已经达成共识,开始正视并规范 AI 的使用。

国内多家期刊发表声明,对投稿人在论文写作过程中的各种 AI 使用途径加以限制。如《暨南学报》《文献与数据学报》《中国科技期刊研究》《智库理论与实践》《图书情报工作》等期刊均发表声明称,如果论文主要内容是利用 AI 工具生成,一旦发现,以学术不端行为处理

国外学术期刊也纷纷对 AI 在论文写作中的应用进行规范。据不完全统计,Nature(自然)、Cell(细胞)、The Lancet(柳叶刀)、JAMA(美国医学会杂志)等顶级期刊均发表声明称,人工智能不具有作者资格,使用人工智能的研究人员应在稿件中进行说明

用 AI 打败 AI ,揪出论文「枪手」

推动 AI 向善发展,需要借助行之有效的技术手段。值得注意的是,在当前的技术水平下,AI 生成的论文在形式上与原创论文相似,传统的文本相似度比对工具可能无法准确检测出它们。因此,国内外都在探索研发专门针对 AIGC 的检测工具。

「AI 生成内容识别器的核心思想是首先构建一个训练数据集,包含真实的内容和 AI 生成的内容,然后训练一个分类器来区别这两类内容。」MILA 研究院知名华人学者唐建在接受媒体采访时解释道。

具体而言,人工智能语言模型通过一次预测和生成一个单词来工作。生成一个词后,水印算法将语言模型的词汇随机分为「绿名单」和「红名单」,然后提示模型选择「绿名单」上的词。一篇文章中列入「绿名单」的词越多,该文本就越有可能是由机器生成的,人类写的文本往往包含更随机的单词组合。

简单来说,AIGC 检测技术是在「用 AI 打败 AI 」,依托海量的文本和数据样本,识别出人类和 AIGC 工具在平均句子长度、词汇多样性和文本长度等方面的不同点,从而揪出 AI 论文「枪手」。

但这背后存在一些技术难点,比如语言模型经过人类创作文本训练,参数量越大,越接近人类创作,越难以区分;另外,检测还受限于文本长度,文本长度足够长,检测的准确率才有保障。

科研中合理使用 AI,不可因噎废食

AI for Science 的成功应用,在一定程度上将科研人员从文本、数据的处理工作中「解救」出来,使其能够更加专注于研究本身,可以在一定程度上提升效率,加快科学研究的进度。此外,在完成一些深度、复杂科研内容的探索上,人工智能也毫不逊色。

比如近年来医学研究领域备受重视的预测模型,让有些科研新人抓耳挠腮。而 AI 可以逐步建立思路和方法,帮助科研人员快速构建一个合格的模型。

再比如,在实验设计与优化方面,只需简单提供实验目的、方法和材料等信息,AI 便可生成详细的实验方案,帮助科研人员对已有的方案进行评估优化,减少实验消耗。

总之,对生成式人工智能不可「谈虎色变」,而要加以规范和引导,让它沿着正确的轨道为科学研究服务。对于科研人员而言,要善用 AI 技术,借助它的优势高效、准确地完成科研和论文的撰写,但所有的观点和数据,必须要经过作者的审查,避免生成式 AI 的一些虚假和杜撰的结论,以维护科学的尊严。

其实这也恰恰是 AI for Science 的初衷,利用 AI 实现对传统科研范式的重塑与创新。如今 AI for Science 已经在生物医药、材料化学、数学、物理等众多领域完成了升级,并且创造了一批具有实际应用价值的重要成果。但是,很多科研人员仍持观望态度,一方面是所在领域可能缺乏低门槛的 AI 工具,另一方面也可能是尚未找到 AI 与其研究领域的结合点。

AI for Science 的探索之旅才刚刚启程,唯有科研与 AI 携手并进,才能创造出更普适的工具与方法。

这篇关于科技部出手!科研人员的 AIGC 使用手册来了,学术界开始防范 AI 枪手的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/677767

相关文章

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Spring AI ectorStore的使用流程

《SpringAIectorStore的使用流程》SpringAI中的VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它在AI应用中发挥着至关重要的作用,本文给大家介... 目录一、VectorStore的基本概念二、VectorStore的核心接口三、VectorStore的

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek