马斯克称首位受试者可凭思维操控鼠标；字节低调推出视频模型丨 RTE 开发者日报 Vol.148

本文主要是介绍马斯克称首位受试者可凭思维操控鼠标；字节低调推出视频模型丨 RTE 开发者日报 Vol.148，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在这里插入图片描述

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE （Real Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@CY

01 有话题的新闻

1、马斯克表示第一位 Neuralink 患者可以通过思维控制电脑鼠标

2 月 20 日消息，伊隆·马斯克在社交媒体平台 X 上的 Spaces 活动中透露，脑机接口公司 Neuralink 的首位人类受试者「似乎已完全康复，并能仅凭思维在电脑屏幕上移动鼠标」。

Neuralink 是这位亿万富翁的初创公司，该公司表示已开发出一种大脑植入物，旨在帮助人类利用神经信号来控制外部技术。该公司的目标是恢复视力、运动功能和言语等丧失的能力。

据一篇博客文章称，Neuralink 在 5 月份获得美国食品和药物管理局批准开展这项研究后，于秋季开始招募患者进行首次人体临床试验。此次人体临床试验标志着 Neuralink 在商业化道路上迈出了一步。医疗器械公司必须经过多轮密集的数据安全收集和测试，才能获得 FDA 的最终批准。(@CNBC)

在这里插入图片描述

2、字节跳动低调推出视频模型 Boximator，尚无法作为完善产品落地

2 月 20 日消息，在 OpenAI 发布 Sora 之前，字节跳动低调推出了一款视频模型产品 Boximator。Boximator 可以通过文本控制生成视频中人物或物体的动作。

对此，字节跳动相关人士回应称，Boximator 是视频生成领域控制对象运动的技术方法研究项目，目前还无法作为完善的产品落地，距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

字节跳动从去年开始布局 AI，并于去年 11 月成立专注于 AI 创新业务的新部门 Flow。一位接近字节跳动的知情人士对界面新闻表示，去年一年，字节跳动创始人张一鸣的全部时间都花在 AI 上了，从其精力分配上也可以看到字节跳动对 AI 业务的重视程度。（@界面新闻）

在这里插入图片描述

3、苹果 AirPods 团队大洗牌：Gary Geaves 卸任，苹果 AirPods 团队换帅

根据外媒报道，长期担任声学副总裁的 Gary Geaves 离职，苹果 AirPods 产品线迎来新的掌舵者 Ruchir Davé。古尔曼在推文中表示使用了“shuffles”（洗牌）来形容，表明苹果公司的音频产品团队管理层出现了较大规模的调整。

据了解，苹果公司的声学小组拥有约 300 名成员，为 AirPods、HomePods 和其他苹果设备开发音频技术。该团队负责创建空间音频，即 AirPods、Vision Pro 和其他设备内置的 3D 音效功能。据去年 12 月报道，当月苹果产品设计副总裁 Tang Tan 离职，而他还负责监督配件设计和开发 AirPods 的声学团队，因此他的离职牵动了苹果硬件业务的连锁反应。（@IT 之家）

4、传言称苹果 Vision Pro 主要人员已被调往可折叠 iPhone 开发团队工作

2 月 20 日消息，早前有传言称，苹果已经停止了可折叠 iPhone 的研发工作，因为显示屏的耐用性存在问题。现在，有最新消息称，这家科技巨头依然正在积极开发这款设备，而且实际上已经重新指派了苹果 Vision Pro 团队的一些关键人员来开发这种新的外形。

一位接近苹果内部计划的人士向 Alpha Biz 透露，该公司正在积极努力推出可折叠 iPhone。这位不愿透露姓名的人士还提供了该产品的预计上市时间表，同时提到苹果 Vision Pro 的主要成员已被指定参与该设备的开发。

「据我所知，大量 Vision Pro 核心人员已经被调往可折叠手机开发团队，用于开发可折叠手机。除非情况有变，否则苹果可折叠手机将于 2026 年 9 月开始销售。」(@cnBeta)

5、谷歌 Gemini Advanced 更新，可直接在线编辑和运行 Python 代码

2 月 20 日消息，根据谷歌官方更新公告，Gemini Advanced 订阅用户可直接在 Gemini 界面中编辑和运行 Python 代码，从而帮助开发者快速验证实验代码，确保代码可预期运行，而且可以立即查看代码修改后的结果。

谷歌于 2 月 8 日宣布将 Bard AI 聊天机器人更名为 Gemini，并推出专门的安卓 App，其中搭载 Gemini Ultra 1.0 模型的版本需要注册 Gemini Advanced 订阅，其在逻辑推理、执行指令、编程和创意协作等方面更胜一筹。此次新功能目前仅适用于 Gemini Advanced 高级用户，Gemini 免费版本不可用。

根据谷歌的说法，这项功能可主要用于以下两方面：一是学习，有志于成为程序员的人可以使用 Gemini 试验代码片段，观察修改的影响，并更深入地理解编码原理。二是验证，开发人员可以使用 Gemini 快速验证 AI 生成的 Python 代码的功能，然后再将其集成到他们的项目中。（@IT 之家）

6、微软发布 Visual Studio 2022 17.10 首个预览版更新：改进 GitHub Copilot、自动安装推荐组件

据微软官方新闻稿，微软目前发布了 Visual Studio 2022 17.10 首个预览版本，该版本号称重点改进了 GitHub Copilot，并对设置、扩展组件等方面进行了一系列更新。微软宣称，GitHub Copilot 在 Visual Studio 2022 17.10 中从“聊天机器人”升级到了“开发伙伴”，在该版本中，Copilot 能够“更好地从项目中收集信息”，进一步为开发者当前的开发环境提供更有意义的答案，同时开发者还能够直接在项目中与 Copilot 互动并获取建议，并“轻松获取生成式 AI 应用开发建议”。(@CSDN)

02 有态度的观点

1、周鸿祎回应 AI 十大预言：已实现 4 个

2 月 20 日，在接受采访时被问到现在怎么看年初提出的 AI 十大预言时，周鸿祎回应称已经实现 4 个了。分别是开源大模型爆发、大模型运行在终端、文生图和文生视频取得突破性进展、多模态成为大模型标配。周鸿祎认为，特别是 Sora 的出现让他感到很意外，发展得很快。

十大预测分别是：大模型无处不在，成为数字系统标配；开源大模型爆发；"小模型"涌现，运行在更多终端；大模型企业级市场崛起，向产业化、垂直化方向发展；Agent 智能体激发大模型潜能，成为超级生产力工具；2024 年是大模型应用场景之年，To C 出现杀手级应用；多模态成为大模型标配；文生图、文生视频等 AIGC 功能突破性增长；具身智能赋能人形机器人产业蓬勃发展；大模型推动基础科学取得突破。（@中国企业家杂志）

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述