华科出身,师从贾佳亚,从鹅厂到创业,90后如何登上胡润U30?

2024-02-03 18:18

本文主要是介绍华科出身,师从贾佳亚,从鹅厂到创业,90后如何登上胡润U30?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者 | 八宝粥

出品 | CSDN(id:CSDNnews)

随着AI 技术的发展,国内外涌现出一大批基于AI 落地的工业项目,例如无人车,巡检机器人、仓储智能系统等等。2019年,一家以 AI 视觉为主要技术、专注智能制造和超高清视频的企业诞生,该企业由香港中文大学终身教授、IEEE院士贾佳亚主导创立,核心团队深耕计算机视觉领域20余年。这家企业就是思谋科技,本次采访嘉宾,思谋科技联合创始人、技术负责人刘枢。今年11月,刘枢作为先进制造业的杰出青年企业家,入选《2020胡润Under30s创业领袖》榜单。

内容要点 

  • 工匠精神,如果这个事还能看到哪些地方可能没有做好,或者觉得有提升的地方,那这个事其实还没有完成;

  • 身份转变后,更多地考虑宏观技术架构,如何把握技术方向、让公司的技术保持领先优势;

  • 智能制造和超高清视频,选择两条赛道列入国家“新基建”,前景明朗;

  • 项目落地,保障高准确率和召回率,提供客制化解决方案;

  • 深耕专业领域,努力做到行业头部。 

以下为采访全文,在不改变原意的情况下进行了部分编辑:

 

明确目标, 把事情做到极致

 

CSDN: 从个人经历来看,您在大学就是本科特优生,专业排名第一,25岁博士毕业,可以说是不折不扣的学霸。请问您是如何保持优秀的?

刘枢:首先是要明确目标,为了目标不断努力。如果大家希望能得到一个好的成绩的话,肯定是在考前认真复习,做足准备。另外既然是决定读博,有好的成果出来,就需要花时间去学习已有的方法、思考如何创新,沉淀出自己的知识。这一点和贾老师之前跟我说的“工匠精神”十分契合,“工匠精神”对我的影响也比较大,当时贾老师说:“做事情一定要做到极致!如果觉得这个事自己还能看到哪些地方可能没有做好,或者说觉得还有能提升的地方的话,这个事情其实还没有完成”。 

前面提到的是内在的部分,其实外在的环境也非常重要。在贾老师的团队当中,师兄弟们差不多都是各个名校的第一名,有些同学已经有了文章,有些同学手握 ACM 金牌,都有非常强的点。和优秀的同学一起学习交流,就是 push 自己不断变强,对自己有要求,就会不断进步。这种氛围和环境都是可遇不可求的,和他们一起读书、在思谋共事,我觉得非常幸运,也非常享受这个过程。 

CSDN: 很多还在读博的朋友还在发愁论文和毕业,作为 20 余篇论文的作者和顶级学术会议 NeurIPS 和 ICCV 的审稿人,这方面有什么经验可以和大家分享呢?

刘枢:这方面我感触很多,做研究一定要沉下心来,不能浮躁。Research 这个词,拆开来看就是反复地 Search,反复搜索,本身就告诉大家,这个过程不会一帆风顺,而是一个需要不断尝试、失败再尝试直到成功的过程。如果遇到一点问题就放弃了,肯定做不出好的工作。举个例子,我当时在打 COCO 比赛的时候,第一步需要复现一个经典的工作,Mask R-CNN,花费了很长时间,结果还是有零点几到一个点的差距,为了这个问题花了大概一周的时间,不断寻找问题到底出在哪里,研究后期我做梦的时候都在 de 这个 bug,非常玄幻的是我梦到了一个位置,而且真的就是这个地方的问题。所以我觉得一定要投入进去,认真去做、反复研究,很多时候问题自然就能解决了。 

另外我认为要多想、多试。我也经常和同门师弟师妹讨论问题,给他们一些建议:发现问题的时候一定要大胆假设小心论证,敢于想新的问题、新的点,而后自己通过做实验,把自己的假设验证成功的时候,就很有意义,两者结合起来就能得到一个好的效果。关于论文的话,也不必太过发愁,要享受研究过程,做出好的研究,发文章也是自然而然的事情。另外我认为发文章也不是衡量一个博士能力的唯一标准,读PhD 也是培养自己去发现问题、分析问题和解决问题这样一种能力,这是一个博士核心的能力点,只有掌握这一套方法论,才能担得起 PhD 这个 Title。

 

角色转换,万变不离其宗 

CSDN: 您从腾讯的高级研究员到联合创办思谋科技担任技术负责人,经历了怎样的心路历程,对于身份的转变有什么体会?

刘枢:在腾讯的工作会更加具体,主要是自己或者一个小团队一起做事,不会特别宏观,后来联合创立思谋科技,作为技术负责人,会考虑更加宏观的问题,这时候责任和压力就更重一些,目前考虑的肯定是宏观技术架构,如何让我们的技术体系保持先进性和可扩展性。同时必须要预见技术发展方向,让公司保持技术优势。 

这个层面主要还是我们或者我自己对于技术的把握和理解,如何让技术优势实际地去服务公司的产品和落地项目。我们的技术要打造成什么形式?比如单点工具或者线性工具链,或者是更加整合的一个平台。如何降低交付成本,提升交付效率都是需要从更宏观的层面去考虑的。当然还需要考虑怎样提升产品易用性、泛化性,还有在最终的结果上超过对手。这都是目前考虑的问题。 

此外还要考虑我们的技术如何配合整个公司的战略方向,提前做好技术布局和支持。总体来说,现在考虑的事情更加宏观,压力也更大,但也更有激情。因为我觉得把这些事做好之后,整个公司技术研发的同学都能够非常开心地工作、快速地成长,还是非常有成就感的。 

CSDN:计算机视觉在工业应用和实现,和在学术界或者比赛当中解决问题的情况对比,有什么异同?

刘枢:工业应用主要是关心技术产品能否满足客户最终要求,比如要求达到某个准确率、召回率,完成时间等等,更多的是考虑能否达标,而且解决的也是杂糅的问题,比如我们会发现数据集当中有一些长尾分布、小样本或者脏数据问题,还有如何去增量学习等等。我们为了最终的指标去不断解决问题。这个和打比赛比较像,因为打比赛也是给出数据集和最终的指标,我们对目标结果去做优化,和工业界的追求的目标是一致的。 

而学术界发文章,更多的是去解决一些单点问题,比如前面提到的长尾分布、小样本、脏数据等等,它们本身就是一个个研究的 topic,有很多值得研究的地方。许多文章只是为了去解决一个问题,而且,发文章也不仅仅是为了追求最后的性能怎样,文章本身的创新性也是非常重要的衡量标准。 

在发现问题、分析问题、解决问题,提升性能这些方面的方法论都是相通的。工业应用中解决难题其实也是很好的研究工作,我觉得计算机视觉本身就是偏实践和应用的学科,学术界和工业界没有那么割裂,在工业界也可以做出非常好的一些研究成果。 

 

选择赛道,突破算法局限

 

CSDN: 思谋科技选择了智能制造和超高清视频两条赛道,这种选型是出于怎样的考虑?

刘枢:我们公司在 19 年底成立的时候,就已经选择了这两条赛道,当时我们是基于对市场判断和技术的把握做出的选择。今年年初,国家发布了“新基建”重大战略,智能制造和超高清视频这两个赛道均属于“新基建”领域,我们非常激动,觉得在做正确的事情。 

选择智能制造的原因是这样,制造业考虑的是怎么把东西造出来,如何做好,然后提升自动化率,怎样进行智能化制造。产业转型升级是一个很大的需求,疫情期间制造业受到了非常大的影响,在复工复产的时候,如果产业自动化率高、需要人力少的话,就非常容易。目前大家可能都是用 AOI 机台,加上机器视觉的方法进行缺陷检验,随着国内外制造业巨头对于品控要求的升级,整个行业的品控要求也不断提升。这时候引入 AI 来解决之前机器学习解决不了的问题,就是水到渠成。整体来看,我们认为在智能制造方面有很大的市场规模,对于 AI 导入的需求也越来越高,是一个很好的切入点。 

关于超高清视频,我们可以把 5G 看作是一个管道。随着技术越来越成熟,管道越来越多,里面的水或者叫做媒介,就是视频。此次疫情原因也引爆了居家办公和娱乐的热情。居家办公当中,支撑视频会议重要的技术就是视频处理,娱乐也一样,比如我们有 4k 屏等高清的硬件设备,就需要有片源,超高清视频的需求目前不断增加。以居家娱乐为例,我们可以在传输当中使用更低的码率和质量,在端侧进行超清化处理。视频会议也一样,我们如何保证端侧的画质和传输的效率,如何对视频的内容有较好的理解。 

无论在智能制造还是超高清视频领域,我们都有雄厚的技术积累,加上巨大的市场前景,我们就选定了这两个最重要的赛道。 

CSDN: 今年早些时候贾佳亚教授曾经谈到通过AI体系架构的研发和落地,突破单一算法能力升级的局限,帮助产业客户实现全面数字化、自动化和智能化。思谋目前提供了哪些产品和解决方案,有哪些成功案例可以同大家分享一下? 

刘枢:我们在智能制造和超高清视频上,目前有两个较大的产品,智能制造的 SMore Factory 和超高清视频的 SMore Media。 

SMore Factory,主要是针对工业场景中制造过程、质量检测和设备维护等环节的问题,提供全流程一站式的赋能和管理能力。这里面包括两个形态,一个是叫做 SMore ViMo (Vision Inspection and More)  的一个软件平台,另外一个是端上的一个智能的硬件,叫做 SMore Edge。 

关于SMore ViMo,我们提供整套软件平台,它包括物体分类、缺陷检测、图像分割,还有 OCR 这4个比较核心算法。软件平台本身除了 AI 算法能力之外,也能够满足整个工业生产的需求。比如集中式项目管理、分布式的数据存储,包括数据标注,客户也可以自己去训练模型,最后去根据能够把训练的模型能够做到一键的部署去测试等等这些业务的需求。对于比较难的算法的问题,我们会派出优秀的算法工程师提供客制化的解决方案,然后可以再把它打包放到 SMore ViMo 里面去,作为我们最终的一个交付形式。 

SMore Edge 主要是一个边缘侧的一些智能的相机等一些智能硬件,主要是为了解决像扫码 OCR 等进行智能识别的一些需求,除了软件层面,我们现在也有一些硬件的 AOI 机台,例如我们在 VisionChina (中国机器视觉技术展览会) 也展出了我们的晶圆外观智能检测设备,整个内外的这种方式,我们能够提供整个硬件的 AOI 机台在打包我们自己的 AI 的算法方案,然后完成一个整套的解决方案。 

超高清视频方面我们的产品是 SMore Media,是从整个视频的内容的生产到呈现的全链条 AI 解决方案,包括画质的处理引擎、超高清一体机以及智能处理器,这个方案能够提供到端的图像和视频的画质增强能力,能够根据具体一个场景去选择最合适的方案,提供云上的部署以及端侧的部署等不同的交付场景。 

我们在3C、新能源以及汽车等行业已经有一些具体的落地项目,例如我们为一家国际知名的3C 巨头 ,落地的多种 AI 外观缺陷检测项目,包括 20 多类缺陷的外观识别,最后实现召回率在 99.6% 以上,误差率在 2% 以下,高质量地通过了验收。这里只是简单举个例子,更多案例在我们网站上也有具体的展示。  

 

积累人才,蓄力提速布局

 

CSDN: 作为思谋的技术负责人,思谋建立技术团队有怎样的选择标准? 

刘枢:首先,优秀的人才是我们最宝贵的资源,我们最近也在大力招聘,选择的标准,首先最重要是一定要志同道合,认同我们的文化价值观。 

其次,整个的创业过程,一定会遇到很多“坑”,可能有一些艰难时刻,这时候有共同的文化认可,大家才能团结一致,把事情做成。所以我们把价值观的认同摆在第一位。具体到个人的品质就是要踏实肯干、实事求是,因为技术本身是一个比较客观的,做的时候一定要脚踏实地,千万不能飘,另外一定要清楚自己的优势和劣势,尽快取长补短,把自己的一些缺点或者说欠缺的地方补上来,这才是一个比较好的技术同学所需要具备的一些品质。此外,我希望我们的伙伴对技术本身一定要有追求,不能说浅尝辄止或者非常容易自满,随随便便做了一个东西,就觉得做得非常不错了。其实很多时候还有很多成长和提升空间,大家一定要对自己有一个明确的认识。 

最后,我觉得如果有很强的专业背景当然是最好的,属于锦上添花的事情。如果没有的话,我们也很乐于去培养像上面提到的踏实肯干,学习能力强,同时对技术有追求,能够不断去提升自己的同学,这些都会是很好的候选者。 

CSDN:思谋科技目前在深圳、上海、香港、苏州都设立了研发与商务中心,同时也交付了多个境外项目,推进全球化商业步伐。请谈谈思谋下一步的发展规划。 

刘枢:发展规划主要是两个层面,首先我们会继续加快招聘步伐,持续地加强对于研发、销售人员,尤其是整个业内顶尖人才的招聘力度,尽快去培养和壮大骨干队伍,包括一些中层管理等,来适应我们整个公司的发展需要。这方面我们后续也会重点关注、重点开拓。 

另外是商业层面的布局,目前我们在海内外都已经有了一些初步的点,一方面会继续重点开拓海外的业务市场,对于海内外两个市场相关行业的扩展我们也会进行提速。前面提到,我们已经 3C、新能源还有汽车等行业有一些项目交付完成。此后将在这些高端制造业里面继续深耕,尽量把自己做到这个行业里面的头部。我们将在落地的行业中继续打磨自己的产品,呈现新的技术,也会快速地去复制到一些相关的行业里面去,去接触到更多的客户和更多的场景。对于海外的,我们也会用同样的方式快速地去复制迁移和场景落地。

  1. 推 荐
  2. CSDN公众号全新搜索技能上线啦!只要在公众号后台回复消息就能自动回复想搜索的内容啦!简直是程序员必备的搜索神器!
  3. 猜猜回复“Mysql安装”会出现什么
点分享点点赞点在看

这篇关于华科出身,师从贾佳亚,从鹅厂到创业,90后如何登上胡润U30?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/674969

相关文章

90、k8s之secret+configMap

一、secret配置管理 配置管理: 加密配置:保存密码,token,其他敏感信息的k8s资源 应用配置:我们需要定制化的给应用进行配置,我们需要把定制好的配置文件同步到pod当中容器 1.1、加密配置: secret: [root@master01 ~]# kubectl get secrets ##查看加密配置[root@master01 ~]# kubectl get se

Android 10.0 mtk平板camera2横屏预览旋转90度横屏拍照图片旋转90度功能实现

1.前言 在10.0的系统rom定制化开发中,在进行一些平板等默认横屏的设备开发的过程中,需要在进入camera2的 时候,默认预览图像也是需要横屏显示的,在上一篇已经实现了横屏预览功能,然后发现横屏预览后,拍照保存的图片 依然是竖屏的,所以说同样需要将图片也保存为横屏图标了,所以就需要看下mtk的camera2的相关横屏保存图片功能, 如何实现实现横屏保存图片功能 如图所示: 2.mtk

代码随想录刷题day24丨93.复原IP地址 ,78.子集 , 90.子集II

代码随想录刷题day24丨93.复原IP地址 ,78.子集 , 90.子集II 1.题目 1.1复原IP地址 题目链接:93. 复原 IP 地址 - 力扣(LeetCode) 视频讲解:回溯算法如何分割字符串并判断是合法IP?| LeetCode:93.复原IP地址_哔哩哔哩_bilibili 文档讲解:https://programmercarl.com/0093.%E5%A4%8

AI项目的商业模式与回报支持者【AI创业、AI项目】

随着人工智能技术的日益成熟,越来越多的AI项目涌现出来,如何维持项目的可持续发展成为了关键问题之一。本文将探讨AI项目的商业模式,并介绍如何回报那些支持项目发展的用户。我们将从不同的角度来分析这个问题,包括赞助方式、会员制度、开源项目的部署和功能等方面。 一、AI项目的商业模式 赞助与会员制度 AI项目的商业模式通常包括赞助和会员制度两大部分。赞助是指通过用户的直接经济支持来帮助项目发展,而

英伟达本月启动RTX 5080/90预案 600W散热模组推进中

据供应链最新消息称,英伟达将在本月开始RTX 5090、5080的宣传预案,而AIC合作伙伴会陆续收到相关资料。按照消息人士的说法,英伟达将在明年1月的CES大会上,正式发布RTX 5090、5080等重磅显卡。 按照散热模组厂商的说法,面向英伟达显卡的600W散热模组方案正持续推进,而400W功耗方案目前处于取消或搁置状态,此外目前共有5个英伟达显卡散热方案正在开发中。 这似乎也从侧面印证

判断两个yaw角度之差是否超过了90度

一. 判断两个yaw角度之差是否超过了90度 要判断两个 yaw 角度之差是否超过 90 度,你可以通过计算这两个角度的差值,并将其归一化为 [-180, 180] 的范围内。接着,只需判断该差值的绝对值是否大于 90 度。 实现步骤: 计算角度差:两个角度的差值可以通过直接相减得到,但需要将结果限制在 [-180, 180] 范围内,因为角度是周期性的。归一化到 [-180, 180] 范

第九届“创客中国”生成式人工智能中小企业创新创业大赛招商推介圆满落幕

金秋九月,丹桂飘香。9月2日晚,第九届“创客中国”生成式人工智能(AIGC)中小企业创新创业大赛招商推介会在南昌高新区艾溪湖畔成功举办。南昌市政府副秘书长、办公室党组成员陈吉炜出席并致辞。市中小企业局党组书记、市工信局党组书记、局长骆军出席。南昌高新区党工委委员、管委会副主任刘用强主持并作高新区推介。南昌高新区生成式人工智能相关企业及大赛参赛选手参加了本次活动。 (市政府副秘书长

创业型公司如何实现数字化营销突破?

​在当今数字化时代,创业型公司可谓机遇与挑战并存。如何利用数字化营销手段实现突破,成为发展关键。 一、现状之困 资源有限:创业型公司资金、人力相对匮乏,难在传统营销上大笔投入。 品牌知名度低:新公司在市场上认知度不足,吸引客户关注有难度。 数字化营销意识薄弱:部分创业公司对数字化营销重要性认识不够,仍依赖传统方式。 二、突破策略 明确目标客户群体:通过市场调研和数据分析,精准定位,

90后不买房 你的生活会更好 20年后的房子像白菜

90后不买房 你的生活会更好 20年后的房子像白菜  理由:请不要 做啥奴了 潇洒一生行啊  拒绝背贷 当资本家的韭菜 有人说:不买房咋活  答:可以啊租房   又说:租房这么贵 20年后的钱都能买了 答:那为啥你还在那个城市工作呢 可不可以去2-3线城市生活呢 又说:为啥去2-3线啊 哪里没有那么多高工资 没啥医疗啊 答:你拿到的工资全是你的么 1w去除生活费4000吧就剩6000

盘点成都产业园前十,寻找你的理想创业地!

成都,这座充满活力与机遇的城市,拥有众多优秀的产业园。今天,就让我们一同来盘点成都产业园前十,为你的创业梦想找到最理想的栖息之地。 国际数字影像产业园:作为成都产业园排名前十的数字文创产业园,国际数字影像产业园在数字影像、数字文创、数字媒体等领域具有明显优势。该园区为创业者提供了专业的产业服务平台和丰富的共享资源,是数字影像产业创新发展的新高地。 成都高新技术产业开发区:在高新技术产业孵化