清华汪玉创始公司浮出水面,要做大模型一体机,仍是“深鉴式”师生组合拳...

本文主要是介绍清华汪玉创始公司浮出水面,要做大模型一体机,仍是“深鉴式”师生组合拳...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

清华大学电子工程系系主任汪玉,再一次躬行实践“产学结合”。

具体领域,与大模型紧密相关。

量子位获悉,汪玉担任创始人身份的新公司无问芯穹,主要做大模型推理用一体机,以及工具链软件。

公司旨在解决大模型算法向大算力芯片的高效统一部署问题,打造算法-硬件联合优化平台,提升大模型到国产芯片平台的部署效率。

eb93cdc33360980195a3f38dda02ccee.jpeg

回顾汪玉此前在产业界的作为,2016年,汪玉参与AI芯片公司深鉴科技创立,迅速成为国内AI芯片创业头部公司之一。

2018年7月深鉴被全球最大的FPGA厂商赛灵思收购,汪玉旋即与合伙人一起向母校清华大学捐赠500万美金。

此次再次将技术在市场进行验证,汪玉的合作伙伴包括北京大学科研副教授、商汤原数据与计算平台部执行总监颜深根,上海交通大学长聘教轨副教授戴国浩——此人与团队另一创始成员曾书霖同为汪玉学生。

市场方面传来的消息是,无问芯穹已经完成两轮融资,领投方为红杉,跟投方有经纬、徐汇资本等。

谁是汪玉?

汪玉,IEEE Fellow。

清华电子工程系长聘教授、系主任,信息科学技术学院副院长,同时也是ACM FPGA技术委员会亚太地区唯一成员。

4521d73d2cd65975ac26c42cd9554de1.png
别问,小红心是清华官网自带的

1998年,汪玉入学清华,本硕博均在清华,博士师从杨华中和谢源,2007年开始留校任教。

长期从事智能芯片、高能效电路与系统研究,主要面向并行电路分析、低功耗系统设计方法、特定应用的硬件计算、MPSOC 的片上通信/控制策略等方面。

汪玉曾多次在顶会拿下最佳论文奖,共发表IEEE/ACM杂志文章50余篇,谷歌学术引用17000余次

abe3a9859785fd63637317573aefe3b9.png

学术之外,他在产业方面也有重要成果。

2016年,汪玉以知识产权转化入股而创立AI芯片公司深鉴科技,其学生姚颂、单羿是该公司其他创始成员。

2年后,深鉴被全球最大的FPGA厂商赛灵思收购,成为国内最先上岸的AI芯片创业公司。

本硕博在清华,任教科研在清华,创业成功后捐资清华:

深鉴被收购后,汪玉、姚颂、单羿宣布向母校清华大学捐赠500万美金(约合3400万人民币),其中2000万用于设立“孟昭英讲席教授基金”,用于支持高端人才引进与培养;1400万用于设立清华大学电子工程系“刘润生励教励学基金”,支持教师队伍与学生的培养。

6b51bae71571a3dd68fd815bd5a090ae.jpeg

2020年,年仅38岁的汪玉就任清华大学电子工程系第十任系主任,直至今天。

据悉,他是该系创办以来第二年轻系主任。

(最年轻的是第二任系主任李传信,1959年就任时33岁;后在1984年7月至1988年9月任清华校党委书记)

2021年年底,汪玉当选IEEE Fellow。

仍是“深鉴式”师生组合拳

天眼查显示,北京无问芯穹科技有限公司(以下简称无问芯穹)成立于今年5月。

34b6bf1df8ee2058b8e3ca49d223d295.png

其最大股东为戴国浩,占股超六成。

公开资料显示,戴国浩为上海交通大学长聘教轨副教授,CCC(清源研究院定制计算中心)Co-PI,DAI Group(人工智能设计自动化创新实验室)负责人。

戴国浩同为清华校友,分别于2014年和2019年取得清华电子工程系工学学士和博士学位。

汪玉为其博士毕业论文指导老师。

其主要研究方向是大规模稀疏图计算、异构硬件计算、新兴硬件架构等,曾获ASP-DAC19最佳论文奖,以及DAC22/DATE18最佳论文提名。

毕业后,他曾为汪玉研究团队的助理研究员,后于2022年加入上海交大任副教授,方向为稀疏计算、人工智能电路与系统。

655eddc074825024b9e5bd2d68b0ac7d.png

公司法人曾书霖,同样是汪玉的学生。

2018年,曾书霖在清华拿下电子工程系学士学位。这一年,他作为队长带领团队拿下DAC会议系统设计比赛FPGA组第一名。

同年,他又在清华电子工程系开启博士学位学习生涯,导师就是汪玉。

其主要研究方向基于FPGA的神经网络加速器设计,以及软硬件协同优化、云端硬件虚拟化、大规模异构计算等。

有趣的事,曾书霖曾在深鉴FPGA硬件组当过两年的硬件组实习生,后又在MSRA实习过。

942e17826719b473dc9ffb61bc5058c2.png

量子位获悉,北京大学科研副教授,商汤原数据与计算平台部执行总监、小红书原AI平台部负责人颜深根也加入了无问芯穹。

颜深根其人是中国科学院大学计算机科学博士毕业,香港中文大学博士后。

其研究兴趣包括大规模异构并行,分布式深度学习,图像识别等。

曾在并行计算顶级会议PPoPP连续两年发表长论文(大陆首次),主力开发Open被OpenCV官方接收并开源。

毕业后,他先后在百度研究院作为技术负责人负责百度Minwa超级计算机项目,后历任商汤科技数据与计算平台部执行研究总监,以及小红书原AI平台部负责人。

c41d5f5e6da06a0c7c381933840ce401.png

不难发现,无问芯穹创始班子的路线,与当年的深鉴有诸多异曲同工之处——

随时而制,然后以自身技术点入局,把技术从实验室带入市场。

再然后,招揽自己的得意弟子组建创始团队。

想当年,深鉴以2年时间闪电般完成了一家AI芯片公司从创立、多轮融资到被收购的全部创业周期,这一回,汪玉又要带着新公司接受市场的检验了。

— 联系作者 —

1d750ec9f887b513558de69abc14ded8.png

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「广告营销」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

a0db494d97de38d80f73250b7e4a27c3.png

点这里👇关注我,记得标星哦~

这篇关于清华汪玉创始公司浮出水面,要做大模型一体机,仍是“深鉴式”师生组合拳...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/354538

相关文章

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

vue+el国际化-东抄西鉴组合拳

vue-i18n 国际化参考 https://blog.csdn.net/zuorishu/article/details/81708585 说得比较详细。 另外做点补充,比如这里cn下的可以以项目模块加公共模块来细分。 import zhLocale from 'element-ui/lib/locale/lang/zh-CN' //引入element语言包const cn = {mess

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

OpenCompass:大模型测评工具

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步,扬帆起航。 大模型应用向开发路径:AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factor

模型压缩综述

https://www.cnblogs.com/shixiangwan/p/9015010.html

AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著

PyTorch模型_trace实战:深入理解与应用

pytorch使用trace模型 1、使用trace生成torchscript模型2、使用trace的模型预测 1、使用trace生成torchscript模型 def save_trace(model, input, save_path):traced_script_model = torch.jit.trace(model, input)<

六西格玛培训公司:解锁成功之门,让企业与个人共赴“嗨”途

在竞争激烈的21世纪,六西格玛培训公司手握一把神奇的钥匙,帮助企业及个人轻松开启成功的大门。 对企业来说: 产品质量飞跃:不再是偶尔的精品,而是每个产品都如同精雕细琢的艺术品,吸引无数顾客争相购买。 工作流程优化:六西格玛培训如同精准的剪刀,剪去冗余,让工作流程更加顺畅高效。 客户满意度飙升:深谙客户需求的六西格玛,帮助企业精准把握市场脉搏,让每位客户都感受到宾至如归的满意。 战略转型游刃有