OpenAI:我愿花500万购买新闻文章版权,谷歌:我出10亿美金

本文主要是介绍OpenAI:我愿花500万购买新闻文章版权,谷歌:我出10亿美金,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

随着新闻出版商与AI公司达成“使用新闻训练AI模型”的协议,OpenAI 等科技企业愿意为受版权保护的信息支付的价格逐渐浮出水面。

据 The Information 报道,OpenAI 每年愿意向出版商提供 100万到500万美元来支付受版权保护的新闻文章训练其AI模型。

但即使对于小型新闻出版商来说,这个数额其实很小,这可能会让 OpenAI 难以达成交易。

与此同时,苹果也不甘示弱,最近的一份报告称,苹果正在寻求与媒体公司合作,将内容用于人工智能训练,并在多年内提供至少 5000 万美元来购买数据。

这些数字与一些早期的非人工智能许可交易相似。例如谷歌在2020年宣布将总共投资10亿美元与新闻机构合作。在新法律的压力下,谷歌最近还同意每年向加拿大出版商支付总计 1 亿美元,以换取他们文章的链接。

AI模型训练受到挑战

当今的大语言模型主要是根据互联网信息进行训练的。虽然一些AI公司没有透露它们如何获取训练数据,但明显都少不了使用网络爬虫从互联网获取大量数据。

但目前这种做法现在面临着重大挑战。

一方面,OpenAI 的 GPT 爬虫已被一些媒体公司禁止访问数据,其中包括《纽约时报》和 The Verge 的母公司 Vox Media。

另一方面,一些公司认为对其数据进行爬取训练构成版权侵权。

就在几周前,纽约时报法院起诉OpenAI 和微软侵犯版权!要求销毁 ChatGPT 以及任何其他使用《纽约时报》作品而没有付费的大语言模型和训练集。

该诉讼指控 OpenAI 和微软未经允许利用《纽约时报》数百万篇的受版权保护的数据训练ChatGPT等人工智能模型。更重要的是,诉讼声称 ChatGPT 和 Bing Chat 经常复制《纽约时报》文章的长篇逐字副本。这使得 ChatGPT 用户能够绕过《纽约时报》的付费墙。

何以解决?唯有付费

良好的合作伙伴关系可以让人工智能公司避免数据版权问题,并且这在过去的一年里已经成为一种很常见的做法。Axel Springer(Business Insider 的母公司)和美联社等出版商已与 OpenAI 签署协议,授权GPT-4 等模型开发新闻采集技术。

OpenAI 和苹果并不是唯一希望与新闻机构合作的人工智能开发商。据报道,谷歌演示了一款名为 Genesis 的AI工具,该工具可以获取事实并向《纽约时报》、《华尔街日报》和《华盛顿邮报》的高管提供新闻报道。与此同时,一些新闻机构在新闻编辑室中使用了生成式AI工具,但结果好坏参半。

参考资料

 [1]https://www.theverge.com/2024/1/4/24025409/openai-training-data-lowball-nyt-ai-copyright

这篇关于OpenAI:我愿花500万购买新闻文章版权,谷歌:我出10亿美金的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/662196

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨削加工的精度。 转速范围 宽广的转速范围意味着平衡机能够处理更多种类的磨轮,适应不同的工作条件和规格要求。 振动监测能力 振动监测能力是评估平衡机性能的重要因素。通过传感器实时监

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式在最下方 java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频) 停车管理信息系统是为了提升停车场的运营效率和管理水平而设计的综合性平台。系统涵盖用户信息管理、车位管理、收费管理、违规车辆处理等多个功能模块,旨在实现对停车场资源的高效配置和实时监控。此外,系统还提供了资讯管理和统计查询功能,帮助管理者及时发布信息并进行数据分析,为停车场的科学

文章解读与仿真程序复现思路——电力自动化设备EI\CSCD\北大核心《考虑燃料电池和电解槽虚拟惯量支撑的电力系统优化调度方法》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源程序擅长文章解读,论文与完整源程序,等方面的知识,电网论文源程序关注python

全英文地图/天地图和谷歌瓦片地图杂交/设备分布和轨迹回放/无需翻墙离线使用

一、前言说明 随着风云局势的剧烈变化,对我们搞软件开发的人员来说,影响也是越发明显,比如之前对美对欧的软件居多,现在慢慢的变成了对大鹅和中东以及非洲的居多,这两年明显问有没有俄语或者阿拉伯语的输入法的增多,这要是放在2019年以前,一年也遇不到一个人问这种需求场景的。 地图应用这块也是,之前的应用主要在国内,现在慢慢的多了一些外国的应用场景,这就遇到一个大问题,我们平时主要开发用的都是国内的地

【Linux】萌新看过来!一篇文章带你走进Linux世界

🚀个人主页:奋斗的小羊 🚀所属专栏:Linux 很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~ 目录 前言💥1、初识Linux💥1.1 什么是操作系统?💥1.2 各种操作系统对比💥1.3 现代Linux应用💥1.4 Linux常用版本 💥2、Linux 和 Windows 目录结构对比💥2.1 文件系统组织方式💥2.2

多线程的系列文章

Java多线程学习(一)Java多线程入门 Java多线程学习(二)synchronized关键字(1)   Java多线程学习(二)synchronized关键字(2) Java多线程学习(三)volatile关键字 Java多线程学习(四)等待/通知(wait/notify)机制 Java多线程学习(五)线程间通信知识点补充 Java多线程学习(六)Lock锁的使用 Java多

缓存的常见问题 以及解决博客文章

1.jedispool 连 redis 高并发卡死  (子非鱼yy) https://blog.csdn.net/ztx114/article/details/78291734 2. Redis安装及主从配置 https://blog.csdn.net/ztx114/article/details/78320193 3.Spring中使用RedisTemplate操作Redis(sprin

【NodeJS】Unexpected token (109:0) 返回错误码500

刚开始报错是这样的: Unexpected token call 是什么我没看懂,但我发现 span.label.lable-success 后面的 #[i+1] 写错了,应该是 #{i+1} 改成完这个错误后又是一个错误提示: What? Unexpected token (109:0) 返回错误码500是什么鬼 我先将自己这段源码的 - if ... - else 检查下