国内大厂疯抢大模型人才，大模型人才的春天来了吗？

本文主要是介绍国内大厂疯抢大模型人才，大模型人才的春天来了吗？，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

绝对不要怀疑国内大厂对于人才的投入力度，几乎所有的互联网大厂都有这种对于高端人才的招聘计划，特点就是「高薪」+「高要求」。

你看腾讯的青云计划提到的，它的目标是面向全球，给高薪、给定制化的培养、做核心业务、目标是解决前沿问题，可以理解这是一个更偏向研究型的工作岗位。

特别这个计划有一个专门针对于大模型的系列，全都是大模型最前沿的且亟待解决的问题，比如大模型的文生视频、多模态大模型等等。这些都是非常前沿且开放的问题，现在市面上有一些解决方案，比如OpenAI的GPT4o，但是很难说这就是最终的解决方案。

跟青云计划类似的「大模型」人才招聘计划还有一些，比如字节跳动的“Top Seed”和“筋斗云人才计划”、百度的“AIDU计划”以及商汤的“AI先锋顶尖人才计划”，这些全都是针对于人才的争抢，年薪基本上都在大几十万起。

但是这么高的薪资自然要求也会更高，一般来说得满足“专业技能”和“工程经验”。

专业技能：都是常规的技能，比如AI的理论知识，一些编程语言，常用的框架等等。

机器学习、深度学习等理论知识。
精通深度学习框架，如PyTorch、TensorFlow等，以及模型优化技术。
对于多模态大模型岗位，需深入理解Transformer、CNN、RNN等。

这些技能的特点就是杂而多，只对于非AI专业来说学习初期阻力会很大，特别是大模型这种技术，外行入门自学入门需要的时间和知识储备都非常大，建议跟行业深耕多年的大咖进行系统的学习，从一个具体的项目入手会学的既扎实又快，毕竟大模型这波红利不等人。

工程经验：这个部分其实非常能拉开差距，且能看出来是否有比如有没有实战经验，比如多卡多机的大模型预训练，有没有做过RLHF的实践等等，这个很容易从简历和发布的论文中看出端倪。

下面我罗列了一些比较常见的技能储备，但一般来说只需要掌握一些核心的技能即可，工作中遇到的问题大多数考验的是学习能力以及随机应变的能力。

技能类别	技能描述
大模型训练经验	具有使用大规模计算资源（如多机多卡配置）进行大模型（如65B参数以上）训练的经验。熟悉如何高效利用GPU资源，如A100等高端显卡，进行全量微调或预训练。
模型优化与调参	能够对模型架构进行排列组合优化，避免过度复杂的网络结构，追求模型的效率与性能平衡。了解如何通过技术如LoRA、P-tuning等来提升模型在有限资源下的表现。
模型评测与强化学习	掌握模型评估方法，能够设计和实施有效的模型评测体系，确保模型质量。对于强化学习（RLHF）有实践经验，能解决训练资源紧张下的模型优化问题。
算法落地与优化	将大模型应用于实际业务场景，如营销、内容生成等，根据用户反馈持续优化模型效果和用户体验。
多模态大模型开发	对于涉及图像、文本等多模态数据的模型，需要有从零开始构建、优化多模态大模型的经验，包括预训练、指令微调等技术。
持续集成与部署（CI/CD）	作为MLOps的一部分，了解如何自动化模型的构建、测试和部署流程，确保模型的快速迭代和稳定运行。

其实除了这些需要高度专业化的岗位需要硕士博士且研究性极强外，还有很多的公司其实做的更多的是基于大模型的应用。

这类型应用的特点就是高度依赖于别家的API，比如市面上很多的写作助手、对话助手之类的AI应用，其实就是在第三方的API上套了一层壳。

简单来说，我是对话助手，你把信息发给我，我自己不会处理，我发给你ChatGPT，它处理完的信息回复给我，我再回复给你，我只起到了中转的作用，而核心的处理是OpenAI在做。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。