本文主要是介绍每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。
每周日解读每周AI大事件。
大厂动向
【1】谷歌推出最强开源大模型Gemma
谷歌发布开源模型Gemma,Gemma主打轻量级、高性能,有20亿、70亿两种参数规模,能在笔记本电脑、台式机、物联网设备、移动设备和云端等不同平台运行。性能方面,Gemma在18个基准测评中平均成绩击败目前的主流开源模型Llama 2和Mistral,特别是在数学、代码能力上表现突出,还登顶Hugging Face开源大模型排行榜。
Gemma开源地址:https://www.kaggle.com/models/google/gemma/code
技术报告地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf
【2】英伟达成立“GEAR”,打造具身智能体的基础模型
英伟达成立了新的研究部门“GEAR”,由AI高级研究科学家和教授领导,旨在打造具身智能体的基础模型,实现跨多模态、多场景的智能应用。GEAR研究团队专注于多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体以及模拟与合成数据技术,开放了多个职位申请。
【3】英伟达已开始为中国市场提供两款新AI芯片样品
据英国路透社报道,英伟达CEO黄仁勋在发布公司2023年第四季度财报后接受采访时透露,英伟达目前正在向客户提供针对中国市场的两款新型AI芯片样品。“我们现在正和客户一起测试,它们(两款新AI芯片)都在没有许可证的情况下遵守了(美国出口管制)规定,我们正等待客户的反馈。”
【4】谷歌与英伟达合作优化Gemma
谷歌与英伟达宣布合作,利用英伟达TensorRT-LLM对谷歌开源大模型Gemma进行优化。英伟达上周刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。
【5】OpenAI工程师曝工作时间表
OpenAI研究员Jason Wei在社交平台X上分享了自己工作的一天:9点起床,10点开会,6点吃完饭,7点回家后继续写代码、做实验,直到凌晨1点15就寝。Meta FAIR研究院研究员、高级经理田渊栋对此评价:都说国外没有996,其实真正可怕的是自我驱动的卷。
创业 & 投融资
【1】创企Groq自研AI芯片 推理速度超英伟达GPU十倍
近日,AI芯片创企Groq推出了Mixtral 8x7B API,据AI模型和托管提供商ArtificialAnalysis.ai的测评数据,该接口创下了新的大模型吞吐量记录,达到每秒430 Tokens。Groq还提供Llama2 7B模型访问,最高可实现每秒750 Tokens。据介绍,Groq平台基于其自研LPU(语言处理单元)芯片运行,该芯片在大模型推理任务上速度是英伟达GPU的10倍。Groq由谷歌前员工乔纳森·罗斯(Jonathan Ross)在2016年创立,主要针对云计算市场开发AI芯片,其主要成员曾参与研发谷歌的TPU(张量处理单元)。
【2】Anthropic一年内融资73亿美元
据《纽约时报》今日报道,Anthropic成为AI领域最热门的创企之一,该公司在过去一年中筹集了73亿美元,投资者包括谷歌、亚马逊、Salesforce等。知情人士透露,该公司去年的月收入约为800万美元,今年预计增长8倍左右。
【3】人形机器人独角兽Figure AI融资6.75亿美元
据彭博社2月24日援引知情人士消息,杰夫·贝佐斯、英伟达及其他大型科技公司正在投资一家开发类人机器人的企业Figure AI。Figure AI在新一轮融资中筹集了约6.75亿美元,融资前估值约为20亿美元。贝佐斯通过他的公司Explore Investments LLC承诺投资1亿美元,微软将投资9500万美元,而英伟达和亚马逊附属基金各提供5000万美元。
【4】生成式AI创企Abridge完成1.5亿美元融资
据英国路透社报道,生成式AI初创公司Abridge今日宣布成功完成了1.5亿美元的C轮融资。Abridge是一家开发AI驱动的临床文档工具的初创公司,该公司告诉路透社,随着越来越多的投资者寻求接触特定行业的生成式AI应用程序,该公司已在C轮融资中筹集了1.5亿美元,由Lightspeed Venture Partners和Redpoint Ventures领投,对Abridge的估值约为8.5亿美元。根据PitchBook的数据,该公司上次融资仅四个月前,当时估值超过2亿美元。
产品 & 模型
【1】字节发布文生图开放模型SDXL-Lightning
字节发布文生图开放模型SDXL-Lightning。SDXL-Lightning跻身模型趋势榜,同时成为Hugging Face Spaces上的热门模型。与SDXL-Lightning一同上榜的是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。
字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快10倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为1/10。SDXL-Lightning可作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件ComfyUI
【2】Stable Diffusion 3.0发布
根据AI创企Stability AI官网,Stability AI于当地时间2月22日推出AI文生图工具新版本Stable Diffusion 3,开放提前预览版申请通道。Stable Diffusion 3主要在多主题提示、图像质量和文字渲染能力方面大幅提高性能。目前,Stable Diffusion 3模型套件的参数范围为从800M到8B,模型采用了类似Sora的Diffusion Transformer架构。
【3】AI视频生成工具Stable Video开放公测
根据AI创企Stability AI官网,Stability AI旗下的视频生成产品Stable Video于当地时间2月21日开放公测,产品基于Stable Video Diffusion 1.1架构打造,支持文生视频和图生视频功能。
【4】UC伯克利大世界模型登GitHub热榜第一
UC伯克利大学研究人员提出的大世界模型(Large World Model,LWM)登上GitHub榜首,目前已经揽获3.2K星标。为了应对内存限制、计算复杂性和数据集有限等挑战,研究人员从数百万个视频和语言序列的标记中学习,整理了一个包含各种视频和书籍的大型数据集,利用RingAttention技术对长序列进行可扩展训练,并逐渐将上下文大小从4000 tokens增加到100万tokens,并完全开源一系列7B参数模型。论文中提到,LWM可以回答超过1小时的YouTube视频中的相关问题,还能在100万tokens的上下文窗口内实现高精度检索,并且性能优于GPT-4V和Gemini Pro。
论文地址:https://largeworldmodel.github.io/
项目地址:https://github.com/LargeWorldModel/LWM?tab=readme-ov-file
如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。
这篇关于每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!