本文主要是介绍大模型微调训练营毕业总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
我目前在一家零售公司从事大数据架构方面的工作。
之所以选择参加AI大模型微调训练营,主要是考虑到当前无论是大数据这条技术赛道,还是个人职业发展都处在平台期,短期内看不到突破点。所以想看看在大模型这个技术领域有没有可能有所突破。大数据经过多年的发展,在理论和技术层面都已经到达了一个比较成熟的高度,用户使用也属于普惠期。不仅仅有支持度良好的商业化的产品,而且开源系统也能满足用户的基本使用。另外经过这么多年的发展,大数据这条赛道已经比较拥挤,个人要想有所突破不是太容易。
反观现在大模型领域,由于比较新,所以还有很多可能性。虽然在大数据架构这个技术领域内大模型不能完全取代人工,但是在实际工作中已经有很多部分大模型可以发挥重要作用。比如各种知识点的讲解、架构选型、疑难解答,甚至是一些编程工作都可以由大模型代劳。另外,大模型也有可能成为大数据架构中的一环。比如根据自然语言生成数据加工、即席查询任务等。甚至运维工作也可以采用大模型。
经过上述的深思熟虑后我决定学习大模型。在比对了市场上的一些培训课后,还是觉得极客时间的训练营性价比比较高。有一些平台的课程看上去比较综合,但细究课程表,更多的是偏向应用,如提示词工程、AIGC等。极客时间的训练营相对比较深入,尤其是在原理方面讲得比较透,适合喜欢追根究底的人。
参加课程后才发现之前就听过彭靖田老师的Tensorflow课,一如既往的逻辑清晰、知识广博。在彭老师的带领下迅速对大模型领域有了比较深入的了解,也逐步掌握了大模型的使用和微调技术。从茫然不知所措,到能够熟练应用,甚至有一些创新性的想法。现在在我的提议下,公司已准备在两个方面探索大模型的应用,一个是之前提到过的根据自然语言生成数据加工任务、即席查询;另一个是用AI辅助员工培训。这两个项目都受到了公司领导的重视。
现在课程结束了,我也想对平台提一点小建议:模型微调工作相对比较范式化,咱们的毕业作业是否可以整合这些工作成一个系统?现在有些大厂就提供了这样的系统。让用户提供数据、指定微调方法等,即可开始微调模型。甚至这都有一个约定俗成的名称:炼丹。
这篇关于大模型微调训练营毕业总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!