马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148

本文主要是介绍马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY

01 有话题的新闻

1、马斯克表示第一位 Neuralink 患者可以通过思维控制电脑鼠标

2 月 20 日消息,伊隆·马斯克在社交媒体平台 X 上的 Spaces 活动中透露,脑机接口公司 Neuralink 的首位人类受试者「似乎已完全康复,并能仅凭思维在电脑屏幕上移动鼠标」。

Neuralink 是这位亿万富翁的初创公司,该公司表示已开发出一种大脑植入物,旨在帮助人类利用神经信号来控制外部技术。该公司的目标是恢复视力、运动功能和言语等丧失的能力。

据一篇博客文章称,Neuralink 在 5 月份获得美国食品和药物管理局批准开展这项研究后,于秋季开始招募患者进行首次人体临床试验。此次人体临床试验标志着 Neuralink 在商业化道路上迈出了一步。医疗器械公司必须经过多轮密集的数据安全收集和测试,才能获得 FDA 的最终批准。(@CNBC)

在这里插入图片描述

2、字节跳动低调推出视频模型 Boximator,尚无法作为完善产品落地

2 月 20 日消息,在 OpenAI 发布 Sora 之前,字节跳动低调推出了一款视频模型产品 Boximator。Boximator 可以通过文本控制生成视频中人物或物体的动作。

对此,字节跳动相关人士回应称,Boximator 是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

字节跳动从去年开始布局 AI,并于去年 11 月成立专注于 AI 创新业务的新部门 Flow。一位接近字节跳动的知情人士对界面新闻表示,去年一年,字节跳动创始人张一鸣的全部时间都花在 AI 上了,从其精力分配上也可以看到字节跳动对 AI 业务的重视程度。(@界面新闻)

在这里插入图片描述

3、苹果 AirPods 团队大洗牌:Gary Geaves 卸任,苹果 AirPods 团队换帅

根据外媒报道,长期担任声学副总裁的 Gary Geaves 离职,苹果 AirPods 产品线迎来新的掌舵者 Ruchir Davé。古尔曼在推文中表示使用了“shuffles”(洗牌)来形容,表明苹果公司的音频产品团队管理层出现了较大规模的调整。

据了解,苹果公司的声学小组拥有约 300 名成员,为 AirPods、HomePods 和其他苹果设备开发音频技术。该团队负责创建空间音频,即 AirPods、Vision Pro 和其他设备内置的 3D 音效功能。据去年 12 月报道,当月苹果产品设计副总裁 Tang Tan 离职,而他还负责监督配件设计和开发 AirPods 的声学团队,因此他的离职牵动了苹果硬件业务的连锁反应。(@IT 之家)

4、传言称苹果 Vision Pro 主要人员已被调往可折叠 iPhone 开发团队工作

2 月 20 日消息,早前有传言称,苹果已经停止了可折叠 iPhone 的研发工作,因为显示屏的耐用性存在问题。现在,有最新消息称,这家科技巨头依然正在积极开发这款设备,而且实际上已经重新指派了苹果 Vision Pro 团队的一些关键人员来开发这种新的外形。

一位接近苹果内部计划的人士向 Alpha Biz 透露,该公司正在积极努力推出可折叠 iPhone。这位不愿透露姓名的人士还提供了该产品的预计上市时间表,同时提到苹果 Vision Pro 的主要成员已被指定参与该设备的开发。

「据我所知,大量 Vision Pro 核心人员已经被调往可折叠手机开发团队,用于开发可折叠手机。除非情况有变,否则苹果可折叠手机将于 2026 年 9 月开始销售。」(@cnBeta)

5、谷歌 Gemini Advanced 更新,可直接在线编辑和运行 Python 代码

2 月 20 日消息,根据谷歌官方更新公告,Gemini Advanced 订阅用户可直接在 Gemini 界面中编辑和运行 Python 代码,从而帮助开发者快速验证实验代码,确保代码可预期运行,而且可以立即查看代码修改后的结果。

谷歌于 2 月 8 日宣布将 Bard AI 聊天机器人更名为 Gemini,并推出专门的安卓 App,其中搭载 Gemini Ultra 1.0 模型的版本需要注册 Gemini Advanced 订阅,其在逻辑推理、执行指令、编程和创意协作等方面更胜一筹。此次新功能目前仅适用于 Gemini Advanced 高级用户,Gemini 免费版本不可用。

根据谷歌的说法,这项功能可主要用于以下两方面:一是学习,有志于成为程序员的人可以使用 Gemini 试验代码片段,观察修改的影响,并更深入地理解编码原理。二是验证,开发人员可以使用 Gemini 快速验证 AI 生成的 Python 代码的功能,然后再将其集成到他们的项目中。(@IT 之家)

6、微软发布 Visual Studio 2022 17.10 首个预览版更新:改进 GitHub Copilot、自动安装推荐组件

据微软官方新闻稿,微软目前发布了 Visual Studio 2022 17.10 首个预览版本,该版本号称重点改进了 GitHub Copilot,并对设置、扩展组件等方面进行了一系列更新。微软宣称,GitHub Copilot 在 Visual Studio 2022 17.10 中从“聊天机器人”升级到了“开发伙伴”,在该版本中,Copilot 能够“更好地从项目中收集信息”,进一步为开发者当前的开发环境提供更有意义的答案,同时开发者还能够直接在项目中与 Copilot 互动并获取建议,并“轻松获取生成式 AI 应用开发建议”。(@CSDN)

02 有态度的观点

1、周鸿祎回应 AI 十大预言:已实现 4 个

2 月 20 日,在接受采访时被问到现在怎么看年初提出的 AI 十大预言时,周鸿祎回应称已经实现 4 个了。分别是开源大模型爆发、大模型运行在终端、文生图和文生视频取得突破性进展、多模态成为大模型标配。周鸿祎认为,特别是 Sora 的出现让他感到很意外,发展得很快。

十大预测分别是:大模型无处不在,成为数字系统标配;开源大模型爆发;"小模型"涌现,运行在更多终端;大模型企业级市场崛起,向产业化、垂直化方向发展;Agent 智能体激发大模型潜能,成为超级生产力工具;2024 年是大模型应用场景之年,To C 出现杀手级应用;多模态成为大模型标配;文生图、文生视频等 AIGC 功能突破性增长;具身智能赋能人形机器人产业蓬勃发展;大模型推动基础科学取得突破。(@中国企业家杂志)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

这篇关于马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/734231

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言