每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体

本文主要是介绍每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。

每周日解读每周AI大事件。

大厂动向

【1】谷歌推出最强开源大模型Gemma

谷歌发布开源模型Gemma,Gemma主打轻量级、高性能,有20亿、70亿两种参数规模,能在笔记本电脑、台式机、物联网设备、移动设备和云端等不同平台运行。性能方面,Gemma在18个基准测评中平均成绩击败目前的主流开源模型Llama 2和Mistral,特别是在数学、代码能力上表现突出,还登顶Hugging Face开源大模型排行榜。

Gemma开源地址:https://www.kaggle.com/models/google/gemma/code

技术报告地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

【2】英伟达成立“GEAR”,打造具身智能体的基础模型

英伟达成立了新的研究部门“GEAR”,由AI高级研究科学家和教授领导,旨在打造具身智能体的基础模型,实现跨多模态、多场景的智能应用。GEAR研究团队专注于多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体以及模拟与合成数据技术,开放了多个职位申请。

【3】英伟达已开始为中国市场提供两款新AI芯片样品

据英国路透社报道,英伟达CEO黄仁勋在发布公司2023年第四季度财报后接受采访时透露,英伟达目前正在向客户提供针对中国市场的两款新型AI芯片样品。“我们现在正和客户一起测试,它们(两款新AI芯片)都在没有许可证的情况下遵守了(美国出口管制)规定,我们正等待客户的反馈。”

【4】谷歌与英伟达合作优化Gemma

谷歌与英伟达宣布合作,利用英伟达TensorRT-LLM对谷歌开源大模型Gemma进行优化。英伟达上周刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

【5】OpenAI工程师曝工作时间表

OpenAI研究员Jason Wei在社交平台X上分享了自己工作的一天:9点起床,10点开会,6点吃完饭,7点回家后继续写代码、做实验,直到凌晨1点15就寝。Meta FAIR研究院研究员、高级经理田渊栋对此评价:都说国外没有996,其实真正可怕的是自我驱动的卷。

创业 & 投融资

【1】创企Groq自研AI芯片 推理速度超英伟达GPU十倍

近日,AI芯片创企Groq推出了Mixtral 8x7B API,据AI模型和托管提供商ArtificialAnalysis.ai的测评数据,该接口创下了新的大模型吞吐量记录,达到每秒430 Tokens。Groq还提供Llama2 7B模型访问,最高可实现每秒750 Tokens。据介绍,Groq平台基于其自研LPU(语言处理单元)芯片运行,该芯片在大模型推理任务上速度是英伟达GPU的10倍。Groq由谷歌前员工乔纳森·罗斯(Jonathan Ross)在2016年创立,主要针对云计算市场开发AI芯片,其主要成员曾参与研发谷歌的TPU(张量处理单元)。

【2】Anthropic一年内融资73亿美元

据《纽约时报》今日报道,Anthropic成为AI领域最热门的创企之一,该公司在过去一年中筹集了73亿美元,投资者包括谷歌、亚马逊、Salesforce等。知情人士透露,该公司去年的月收入约为800万美元,今年预计增长8倍左右。

【3】人形机器人独角兽Figure AI融资6.75亿美元

据彭博社2月24日援引知情人士消息,杰夫·贝佐斯、英伟达及其他大型科技公司正在投资一家开发类人机器人的企业Figure AI。Figure AI在新一轮融资中筹集了约6.75亿美元,融资前估值约为20亿美元。贝佐斯通过他的公司Explore Investments LLC承诺投资1亿美元,微软将投资9500万美元,而英伟达和亚马逊附属基金各提供5000万美元。

【4】生成式AI创企Abridge完成1.5亿美元融资

据英国路透社报道,生成式AI初创公司Abridge今日宣布成功完成了1.5亿美元的C轮融资。Abridge是一家开发AI驱动的临床文档工具的初创公司,该公司告诉路透社,随着越来越多的投资者寻求接触特定行业的生成式AI应用程序,该公司已在C轮融资中筹集了1.5亿美元,由Lightspeed Venture Partners和Redpoint Ventures领投,对Abridge的估值约为8.5亿美元。根据PitchBook的数据,该公司上次融资仅四个月前,当时估值超过2亿美元。

产品 & 模型

【1】字节发布文生图开放模型SDXL-Lightning

字节发布文生图开放模型SDXL-Lightning。SDXL-Lightning跻身模型趋势榜,同时成为Hugging Face Spaces上的热门模型。与SDXL-Lightning一同上榜的是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快10倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为1/10。SDXL-Lightning可作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件ComfyUI

【2】Stable Diffusion 3.0发布

根据AI创企Stability AI官网,Stability AI于当地时间2月22日推出AI文生图工具新版本Stable Diffusion 3,开放提前预览版申请通道。Stable Diffusion 3主要在多主题提示、图像质量和文字渲染能力方面大幅提高性能。目前,Stable Diffusion 3模型套件的参数范围为从800M到8B,模型采用了类似Sora的Diffusion Transformer架构。

【3】AI视频生成工具Stable Video开放公测

根据AI创企Stability AI官网,Stability AI旗下的视频生成产品Stable Video于当地时间2月21日开放公测,产品基于Stable Video Diffusion 1.1架构打造,支持文生视频和图生视频功能。

【4】UC伯克利大世界模型登GitHub热榜第一

UC伯克利大学研究人员提出的大世界模型(Large World Model,LWM)登上GitHub榜首,目前已经揽获3.2K星标。为了应对内存限制、计算复杂性和数据集有限等挑战,研究人员从数百万个视频和语言序列的标记中学习,整理了一个包含各种视频和书籍的大型数据集,利用RingAttention技术对长序列进行可扩展训练,并逐渐将上下文大小从4000 tokens增加到100万tokens,并完全开源一系列7B参数模型。论文中提到,LWM可以回答超过1小时的YouTube视频中的相关问题,还能在100万tokens的上下文窗口内实现高精度检索,并且性能优于GPT-4V和Gemini Pro。

论文地址:https://largeworldmodel.github.io/

项目地址:https://github.com/LargeWorldModel/LWM?tab=readme-ov-file

如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。

这篇关于每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/745162

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

题库来源:安全生产模拟考试一点通公众号小程序 2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题是由安全生产模拟考试一点通提供,流动式起重机司机证模拟考试题库是根据流动式起重机司机最新版教材,流动式起重机司机大纲整理而成(含2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题参考答案和部分工种参考解析),掌握本资料和学校方法,考试容易。流动式起重机司机考试技

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业