每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体

本文主要是介绍每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。

每周日解读每周AI大事件。

大厂动向

【1】谷歌推出最强开源大模型Gemma

谷歌发布开源模型Gemma,Gemma主打轻量级、高性能,有20亿、70亿两种参数规模,能在笔记本电脑、台式机、物联网设备、移动设备和云端等不同平台运行。性能方面,Gemma在18个基准测评中平均成绩击败目前的主流开源模型Llama 2和Mistral,特别是在数学、代码能力上表现突出,还登顶Hugging Face开源大模型排行榜。

Gemma开源地址:https://www.kaggle.com/models/google/gemma/code

技术报告地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

【2】英伟达成立“GEAR”,打造具身智能体的基础模型

英伟达成立了新的研究部门“GEAR”,由AI高级研究科学家和教授领导,旨在打造具身智能体的基础模型,实现跨多模态、多场景的智能应用。GEAR研究团队专注于多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体以及模拟与合成数据技术,开放了多个职位申请。

【3】英伟达已开始为中国市场提供两款新AI芯片样品

据英国路透社报道,英伟达CEO黄仁勋在发布公司2023年第四季度财报后接受采访时透露,英伟达目前正在向客户提供针对中国市场的两款新型AI芯片样品。“我们现在正和客户一起测试,它们(两款新AI芯片)都在没有许可证的情况下遵守了(美国出口管制)规定,我们正等待客户的反馈。”

【4】谷歌与英伟达合作优化Gemma

谷歌与英伟达宣布合作,利用英伟达TensorRT-LLM对谷歌开源大模型Gemma进行优化。英伟达上周刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

【5】OpenAI工程师曝工作时间表

OpenAI研究员Jason Wei在社交平台X上分享了自己工作的一天:9点起床,10点开会,6点吃完饭,7点回家后继续写代码、做实验,直到凌晨1点15就寝。Meta FAIR研究院研究员、高级经理田渊栋对此评价:都说国外没有996,其实真正可怕的是自我驱动的卷。

创业 & 投融资

【1】创企Groq自研AI芯片 推理速度超英伟达GPU十倍

近日,AI芯片创企Groq推出了Mixtral 8x7B API,据AI模型和托管提供商ArtificialAnalysis.ai的测评数据,该接口创下了新的大模型吞吐量记录,达到每秒430 Tokens。Groq还提供Llama2 7B模型访问,最高可实现每秒750 Tokens。据介绍,Groq平台基于其自研LPU(语言处理单元)芯片运行,该芯片在大模型推理任务上速度是英伟达GPU的10倍。Groq由谷歌前员工乔纳森·罗斯(Jonathan Ross)在2016年创立,主要针对云计算市场开发AI芯片,其主要成员曾参与研发谷歌的TPU(张量处理单元)。

【2】Anthropic一年内融资73亿美元

据《纽约时报》今日报道,Anthropic成为AI领域最热门的创企之一,该公司在过去一年中筹集了73亿美元,投资者包括谷歌、亚马逊、Salesforce等。知情人士透露,该公司去年的月收入约为800万美元,今年预计增长8倍左右。

【3】人形机器人独角兽Figure AI融资6.75亿美元

据彭博社2月24日援引知情人士消息,杰夫·贝佐斯、英伟达及其他大型科技公司正在投资一家开发类人机器人的企业Figure AI。Figure AI在新一轮融资中筹集了约6.75亿美元,融资前估值约为20亿美元。贝佐斯通过他的公司Explore Investments LLC承诺投资1亿美元,微软将投资9500万美元,而英伟达和亚马逊附属基金各提供5000万美元。

【4】生成式AI创企Abridge完成1.5亿美元融资

据英国路透社报道,生成式AI初创公司Abridge今日宣布成功完成了1.5亿美元的C轮融资。Abridge是一家开发AI驱动的临床文档工具的初创公司,该公司告诉路透社,随着越来越多的投资者寻求接触特定行业的生成式AI应用程序,该公司已在C轮融资中筹集了1.5亿美元,由Lightspeed Venture Partners和Redpoint Ventures领投,对Abridge的估值约为8.5亿美元。根据PitchBook的数据,该公司上次融资仅四个月前,当时估值超过2亿美元。

产品 & 模型

【1】字节发布文生图开放模型SDXL-Lightning

字节发布文生图开放模型SDXL-Lightning。SDXL-Lightning跻身模型趋势榜,同时成为Hugging Face Spaces上的热门模型。与SDXL-Lightning一同上榜的是谷歌新近推出的“最强开放大模型”Gemma系列,以及Stability AI的新一代文生图模型Stable Cascade。

字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快10倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为1/10。SDXL-Lightning可作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中,并支持当前流行的控制插件ControlNet、生成软件ComfyUI

【2】Stable Diffusion 3.0发布

根据AI创企Stability AI官网,Stability AI于当地时间2月22日推出AI文生图工具新版本Stable Diffusion 3,开放提前预览版申请通道。Stable Diffusion 3主要在多主题提示、图像质量和文字渲染能力方面大幅提高性能。目前,Stable Diffusion 3模型套件的参数范围为从800M到8B,模型采用了类似Sora的Diffusion Transformer架构。

【3】AI视频生成工具Stable Video开放公测

根据AI创企Stability AI官网,Stability AI旗下的视频生成产品Stable Video于当地时间2月21日开放公测,产品基于Stable Video Diffusion 1.1架构打造,支持文生视频和图生视频功能。

【4】UC伯克利大世界模型登GitHub热榜第一

UC伯克利大学研究人员提出的大世界模型(Large World Model,LWM)登上GitHub榜首,目前已经揽获3.2K星标。为了应对内存限制、计算复杂性和数据集有限等挑战,研究人员从数百万个视频和语言序列的标记中学习,整理了一个包含各种视频和书籍的大型数据集,利用RingAttention技术对长序列进行可扩展训练,并逐渐将上下文大小从4000 tokens增加到100万tokens,并完全开源一系列7B参数模型。论文中提到,LWM可以回答超过1小时的YouTube视频中的相关问题,还能在100万tokens的上下文窗口内实现高精度检索,并且性能优于GPT-4V和Gemini Pro。

论文地址:https://largeworldmodel.github.io/

项目地址:https://github.com/LargeWorldModel/LWM?tab=readme-ov-file

如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。

这篇关于每周AI新闻(2024年第8周)谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/745162

相关文章

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Spring AI ectorStore的使用流程

《SpringAIectorStore的使用流程》SpringAI中的VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它在AI应用中发挥着至关重要的作用,本文给大家介... 目录一、VectorStore的基本概念二、VectorStore的核心接口三、VectorStore的

无需邀请码!Manus复刻开源版OpenManus下载安装与体验

《无需邀请码!Manus复刻开源版OpenManus下载安装与体验》Manus的完美复刻开源版OpenManus安装与体验,无需邀请码,手把手教你如何在本地安装与配置Manus的开源版OpenManu... Manus是什么?Manus 是 Monica 团队推出的全球首款通用型 AI Agent。Man

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot