Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

本文主要是介绍Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、OpenAI 开放 GPT-4o 定制功能,企业可更轻松打造专属 AI 助手

OpenAI 推出了一项新功能,允许企业客户使用自己的数据来定制其最强大的 AI 模型 GPT-4o。此举旨在应对日益激烈的 AI 企业应用竞争,并满足企业对 AI 投资回报的更高要求。

所谓定制,即业界所称的「微调(fine-tuning)」。通过微调,现有 AI 模型可以针对特定任务或领域进行优化。例如,一家滑板公司可以微调 AI 模型,使其成为能够回答有关轮子和滑板护理问题的客服聊天机器人。

此前,OpenAI 仅允许用户微调其较小的模型,如 GPT-4o mini。而此次开放 GPT-4o 和 GPT-4 的微调功能,意味着企业可以更直接地优化 OpenAI 最强大的模型,无需依赖外部服务或使用性能较低的模型。OpenAI 产品主管 Olivier Godement 表示,希望通过直接与公司合作,让客户更轻松地调整其最强大的模型,简化操作流程。

据了解,企业需要将数据上传至 OpenAI 服务器进行模型微调,平均耗时一到两个小时。目前,微调仅支持基于文本的数据,图像等其他类型的数据暂不支持。(@IT 之家)

2、《黑神话:悟空》上市首日销售额超 15 亿元

在这里插入图片描述

8 月 20 日,《黑神话:悟空》正式上线。游戏上线后即登顶 Steam 热玩游戏榜首,同时在线游玩人数迅速突破百万大关。昨晚,根据 Steam 平台显示,《黑悟空:神话》同时在线人数突破 220 万,超过《幻兽帕鲁》,位居历史峰值人数第二,仅次于《PUBG》。

截至目前,《黑悟空》在 Steam 平台共收获 128888 篇评价,其中有 96%的内容为好评。在游戏上线后,针对网友反馈的页面黑屏闪退情况,游戏科学也迅速给出了解决方案。

此前有媒体估算,《黑神话:悟空》在 Steam 国区的售价为 268 元人民币(标准版),数字豪华版售价为 328 元人民币。根据这一定价,游戏科学至少要卖到 300 万份才能回本。而根据国游畅销榜的统计,截至昨日晚间,游戏在 Steam 上已售出超过 300 万份,加上 wegame、epic 和 ps 平台,目前总销量超过 450 万份,总销售额超过 15 亿。

有机构人士向财联社记者表示,看好《黑神话:悟空》对于游戏行业研发实力、游戏出海文化出海方向,以及云游戏市场的带动作用,对于该游戏的销量持乐观态度。(@APPSO)

3、首批万人测试已招满,OpenAI 关闭 SearchGPT 候补名单

OpenAI 宣布已经关闭 SearchGPT 候选名单,仅邀请 10000 人参与测试,并已经开始向未被选中参与测试的用户发送通知邮件。

SearchGPT 目前仅向少量用户开放,这可能有助于避免搜索机器人提供错误建议的情况。官方介绍为:「全新搜索功能原型,利用我们人工智能模型的优势,为您提供清晰、相关的快速答案」。

SearchGPT 可以让用户用自然语言提问,并获得详细、易懂的答案,就像在与专家交谈一样。系统能够保持对话的上下文,理解复杂的查询,甚至自己澄清细节。(@IT 之家)

4、Half_illustration:生成结合摄影和插画涂鸦元素的图像,一半是照片一半是插画

在这里插入图片描述

Half_illustration 是一个用于生成结合摄影和插画涂鸦元素的图像的模型,基于 Flux.1 模型训练。该模型擅长生成既有照片风格,又带有插画效果的独特图像。用户可以尽情发挥想象力,描述各种戏剧性的场景和动作姿势,再加上烟雾、花卉、火焰等插画元素,让作品既真实又充满想象力。只需要在描述中加上特定的关键词(比如 「in the style of TOK」),就可以更好地保持图像的风格统一。这个模型是通过从 Pinterest 上收集的图片训练出来的。

Half_illustration 广泛应用于时尚摄影、广告设计、市场营销等领域。它不仅提供了 API 接口,还和流行的 Diffusers 库兼容。(@小互 AI)

5、中国首个接入大模型的 Linux 开源操作系统正式发布,Linux 发行版 deepin V23

知名开源社区 deepin(深度)社区正式对外发布了开源操作系统,Linux 发行版 deepin V23。deepin V23 搭载 Linux 6.6 LTS 内核,全新 DDE,深度融合 AI 能力,并带来了「如意玲珑」独立包工具集、自研 deepin IDE、原子更新在内的 200 余个产品优化和新增功能。

作为中国首个开源操作系统根社区推出的发行版本,deepin V23 真正实现了操作系统在仓库、应用层、操作系统核心组件上都有自研模块,向全球开源爱好者输出提供优异的源自中国的开发套件。

在应用层,已支持自然语言命令调用 20 多个操作系统设置能力、40 多个使用场景;

在芯片层,支持国内主流 CPU 芯片和英伟达等国内外主流 GPU 芯片;

大模型层开放接口,支持接入所有 OpenAI 接口格式的大模型,用户可根据自身需求,自行适配专属模型。(@腾讯研究院)

02 有态度的观点

1、Cohere 创始人:语音是下一代用户界面;仅通过销售模型,很快变成「零利润业务」

人工智能(AI)技术的商业模型正在快速变化,这是由 Cohere 的创始人 AidanGomez 在最近一次播客中提出的论点。他指出,目前像 OpenAI 和 Anthropic 这样的公司每年在训练如 GPT-4 和 Claude 这样的模型上花费数十亿美元,但由于激烈的价格竞争,围绕这些平台的商业变得相当不稳定。

Gomez 认为,仅仅通过销售模型,即向开发者提供 API 接口访问 AI 模型,将很快变成一个「零利润业务」。尽管这些 AI 模型的需求在迅速增长,但由于价格战,利润空间将变得非常有限。

Cohere 作为 Al 模型的提供商,也面临着类似的挑战。Gomez 提到,尽管 Cohere 的 AI 模型在长期内将是一个有吸引力的业务,但在短期内,通过产品化可能是实现收入的更有意义的方式。

他强调,目前 AI 模型的成本远远超过了它们所产生的收益,而像微软和谷歌这样的大公司可能能够承受或简单地经受住这种损失,但对于初创公司来说,情况并非如此。

此外,大型科技公司在初创公司有机会成为竞争对手之前,就已经开始」吞噬」这些新兴公司。Gomez 警告说,成为云服务提供商的子公司是非常危险的,因为风险投资人可能只想要一个不错的回报,而云服务提供商可能想要更多。

在这种竞争激烈的环境下,开发前沿 AI 模型的公司面临着越来越大的挑战。虽然有传言称,模型架构、数据效率或计算能力的创新将为这些 AI 模型带来巨大的回报,但没有人知道这一天何时或是否会到来。显然,并非今天的每家 AI 初创公司都能看到那一天。

问及语音是否是下一个消费者界面,Gomez 认为:「绝对是的,与模型进行语音对话是一个非常好的体验,模型展示情感、语调、呼吸声、嘴唇的声音,这些都让人印象深刻。」(@Memo)

2、谷歌高级工程师:AGI 的进展已经停滞,因为 LLMs 缺乏系统 2 思维

François Chollet 是谷歌高级软件工程师,Keras 深度学习库的创建者,也是《用 Python 深度学习》的作者,该书通过直观的解释和实践示例来帮助理解深度学习,他在人工智能领域成果显著。

François Chollet 探讨了有关 AGI 的问题,介绍了语言模型存在的问题,如对措辞敏感、泛化能力有限等,指出语言模型的性能依赖任务熟悉度而非复杂度,提出衡量智能的关键概念,如静态技能与流体智能等。Chollet 提出,尽管大实验室正在训练更大的语言模型,但这些模型缺乏深思熟虑的推理能力,即系统 2 思维,这导致了通用人工智能发展的停滞。系统 2 思维源自 Daniel Kahnemann 的理论,指的是有意识、深思熟虑的推理过程。(@雷锋网)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
在这里插入图片描述

素材来源官方媒体/网络新闻

这篇关于Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1094408

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

Spring框架5 - 容器的扩展功能 (ApplicationContext)

private static ApplicationContext applicationContext;static {applicationContext = new ClassPathXmlApplicationContext("bean.xml");} BeanFactory的功能扩展类ApplicationContext进行深度的分析。ApplicationConext与 BeanF

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

Android 10.0 mtk平板camera2横屏预览旋转90度横屏拍照图片旋转90度功能实现

1.前言 在10.0的系统rom定制化开发中,在进行一些平板等默认横屏的设备开发的过程中,需要在进入camera2的 时候,默认预览图像也是需要横屏显示的,在上一篇已经实现了横屏预览功能,然后发现横屏预览后,拍照保存的图片 依然是竖屏的,所以说同样需要将图片也保存为横屏图标了,所以就需要看下mtk的camera2的相关横屏保存图片功能, 如何实现实现横屏保存图片功能 如图所示: 2.mtk

Spring+MyBatis+jeasyui 功能树列表

java代码@EnablePaging@RequestMapping(value = "/queryFunctionList.html")@ResponseBodypublic Map<String, Object> queryFunctionList() {String parentId = "";List<FunctionDisplay> tables = query(parent