每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体

本文主要是介绍每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。

每周日解读每周AI大事件。

大厂动向

【1】谷歌推出最强开源大模型Gemma

谷歌发布开源模型Gemma,Gemma主打轻量级、高性能,有20亿、70亿两种参数规模,能在笔记本电脑、台式机、物联网设备、移动设备和云端等不同平台运行。性能方面,Gemma在18个基准测评中平均成绩击败目前的主流开源模型Llama 2和Mistral,特别是在数学、代码能力上表现突出,还登顶Hugging Face开源大模型排行榜。

Gemma开源地址:https://www.kaggle.com/models/google/gemma/code

技术报告地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

【2】英伟达成立“GEAR”,打造具身智能体的基础模型

英伟达成立了新的研究部门“GEAR”,由AI高级研究科学家和教授领导,旨在打造具身智能体的基础模型,实现跨多模态、多场景的智能应用。GEAR研究团队专注于多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体以及模拟与合成数据技术,开放了多个职位申请。

【3】英伟达已开始为中国市场提供两款新AI芯片样品

据英国路透社报道,英伟达CEO黄仁勋在发布公司2023年第四季度财报后接受采访时透露,英伟达目前正在向客户提供针对中国市场的两款新型AI芯片样品。“我们现在正和客户一起测试,它们(两款新AI芯片)都在没有许可证的情况下遵守了(美国出口管制)规定,我们正等待客户的反馈。”

【4】谷歌与英伟达合作优化Gemma

谷歌与英伟达宣布合作,利用英伟达TensorRT-LLM对谷歌开源大模型Gemma进行优化。英伟达上周刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

【5】OpenAI工程师曝工作时间表

OpenAI研究员Jason Wei在社交平台X上分享了自己工作的一天:9点起床,10点开会,6点吃完饭,7点回家后继续写代码、做实验,直到凌晨1点15就寝。Meta FAIR研究院研究员、高级经理田渊栋对此评价:都说国外没有996,其实真正可怕的是自我驱动的卷。

创业 & 投融资

【1】创企Groq自研AI芯片 推理速度超英伟达GPU十倍

近日,AI芯片创企Groq推出了Mixtral 8x7B API,据AI模型和托管提供商ArtificialAnalysis.ai的测评数据,该接口创下了新的大模型吞吐量记录,达到每秒430 Tokens。Groq还提供Llama2 7B模型访问,最高可实现每秒750 Tokens。据介绍,Groq平台基于其自研LPU(语言处理单元)芯片运行,该芯片在大模型推理任务上速度是英伟达GPU的10倍。Groq由谷歌前员工乔纳森·罗斯(Jonathan Ross)在2016年创立,主要针对云计算市场开发AI芯片,其主要成员曾参与研发谷歌的TPU(张量处理单元)。

【2】Anthropic一年内融资73亿美元

据《纽约时报》今日报道,Anthropic成为AI领域最热门的创企之一,该公司在过去一年中筹集了73亿美元,投资者包括谷歌、亚马逊、Salesforce等。知情人士透露,该公司去年的月收入约为800万美元,今年预计增长8倍左右。

【3】人形机器人独角兽Figure AI融资6.75亿美元

据彭博社2月24日援引知情人士消息,杰夫·贝佐斯、英伟达及其他大型科技公司正在投资一家开发类人机器人的企业Figure AI。Figure AI在新一轮融资中筹集了约6.75亿美元,融资前估值约为20亿美元。贝佐斯通过他的公司Explore Investments LLC承诺投资1亿美元,微软将投资9500万美元,而英伟达和亚马逊附属基金各提供5000万美元。

【4】生成式AI创企Abridge完成1.5亿美元融资

据英国路透社报道,生成式AI初创公司Abridge今日宣布成功完成了1.5亿美元的C轮融资。Abridge是一家开发AI驱动的临床文档工具的初创公司,该公司告诉路透社,随着越来越多的投资者寻求接触特定行业的生成式AI应用程序,该公司已在C轮融资中筹集了1.5亿美元,由Lightspeed Venture Partners和Redpoint Ventures领投,对Abridge的估值约为8.5亿美元。根据PitchBook的数据,该公司上次融资仅四个月前,当时估值超过2亿美元。

产品 & 模型

【1】字节发布文生图开放模型SDXL-Lightning

字节发布文生图开放模型SDXL-Lightning。SDXL-Lightning跻身模型趋势榜,同时成为Hugging Face Spaces上的热门模型。与SDXL-Lightning一同上榜的是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快10倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为1/10。SDXL-Lightning可作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件ComfyUI

【2】Stable Diffusion 3.0发布

根据AI创企Stability AI官网,Stability AI于当地时间2月22日推出AI文生图工具新版本Stable Diffusion 3,开放提前预览版申请通道。Stable Diffusion 3主要在多主题提示、图像质量和文字渲染能力方面大幅提高性能。目前,Stable Diffusion 3模型套件的参数范围为从800M到8B,模型采用了类似Sora的Diffusion Transformer架构。

【3】AI视频生成工具Stable Video开放公测

根据AI创企Stability AI官网,Stability AI旗下的视频生成产品Stable Video于当地时间2月21日开放公测,产品基于Stable Video Diffusion 1.1架构打造,支持文生视频和图生视频功能。

【4】UC伯克利大世界模型登GitHub热榜第一

UC伯克利大学研究人员提出的大世界模型(Large World Model,LWM)登上GitHub榜首,目前已经揽获3.2K星标。为了应对内存限制、计算复杂性和数据集有限等挑战,研究人员从数百万个视频和语言序列的标记中学习,整理了一个包含各种视频和书籍的大型数据集,利用RingAttention技术对长序列进行可扩展训练,并逐渐将上下文大小从4000 tokens增加到100万tokens,并完全开源一系列7B参数模型。论文中提到,LWM可以回答超过1小时的YouTube视频中的相关问题,还能在100万tokens的上下文窗口内实现高精度检索,并且性能优于GPT-4V和Gemini Pro。

论文地址:https://largeworldmodel.github.io/

项目地址:https://github.com/LargeWorldModel/LWM?tab=readme-ov-file

如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。

这篇关于每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/745162

相关文章

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee

DeepSeek模型本地部署的详细教程

《DeepSeek模型本地部署的详细教程》DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私,在本地成功部署DeepSe... 目录一、环境准备(一)硬件需求(二)软件依赖二、安装Ollama三、下载并部署DeepSeek模型选

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言