段勇师弟和他的AI情结

2023-11-10 23:50
文章标签 ai 师弟 情结 段勇

本文主要是介绍段勇师弟和他的AI情结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    在一次关于AI的技术交流会上,认识了段勇。那个会议有两天,第一天只是短暂的见面,他没给我留下特别的印象。

    第二天下午的交流议程,有一项是Recurrent neural network(RNN)。这个题目我也很感兴趣。神经网络有很多种,无论如何,RNN都是诸多神经网络模型中比较复杂的。一般的网络,都是无循环的,输入信息顺着网络向前传递进行推理。误差信息向后反馈进行训练。但是RNN是有循环的,n层的输出除了要向前给n+1层外,还要返回影响本层的输入。

    记得在那次交流之前的几个月里,我经常与JIURL聊AI。一般是中午散步时候,我们聊AI的问题,对AI的看法,也聊到过RNN。简单说,RNN是解决网络记忆问题的一种方法。人类的大脑是有记忆的,但是目前的神经网络只是在训练时可以记忆,到了推理环境,无法记忆新的信息。虽然有这样的基本理解,但是我们都认为RNN比较难,不好理解,训练的难度更大。

    因为此,看到有人要讲RNN,我就想听一下,谦虚点说,是想学习一下。不客气点说,是想看看这人到底啥水平,竟然敢讲RNN,看他讲的怎么样。

    时间到了,段勇上台,RNN开讲。

    他先举了一个栗子(^-^):the president of apple eats an apple。以NLP问题解说深度神经网络(DNN)需要记忆。找到了后来他给我的PPT,截图如下:

640?wx_fmt=png

一个例子讲完,他又举了一个栗子。

640?wx_fmt=png

    通过两个例子把RNN的背景说清楚了。也让我觉得这个人可以的,不是照本宣科的等闲之辈。

    接下来他直奔主题,抛出RNN的基本原理:使用记忆体来解决记忆问题。

640?wx_fmt=png

    记得他当时反复把记忆体比喻为记忆细胞。讲的时候表情很丰富,面带笑容,音调抑扬顿挫,讲的很有感情。

    然后,他详细讲解了向记忆体存储知识,和从中读取知识的过程。并且回到第二个NLP例子,结合着讲了RNN如何使用记忆细胞解决NLP问题。

    

640?wx_fmt=png

    听了这场RNN演讲,我彻底认识了段勇。当晚一起吃饭聊天,知道了他也是交大毕业的,比我晚几年,于是我叫他段勇师弟。

    后来知道,他也在创业。与我类似,辞掉了工作,专心做想做的事情。

    再后来又知道,他也有讲课的经历。难怪那天听他讲RNN,感觉他讲台感很强,面对听众,驾轻就熟。

    再后来又知道,他也喜欢写作。辞掉工作后,先是闭门写了一本关于AI的书。后来又搞了个学习AI的平台(www.shiyan.ai),然后闭门写了很多课程供大家学习。

640?wx_fmt=png

    有一天,我请他到863。他来了,吃过午饭,一起在园区散步。闲聊时,讲到红火的区块链,他口若悬河般给我讲了一大通,让我获益很多。 

    那一天,我们又聊起交大校园,我问他住哪个宿舍,他说11栋,我说怎么和我当年的一样,我继续问他住几楼,他说6楼,我说当年我也住6楼啊,我继续问他住六零几。他说住602,终于有点差别了。和他在前一起,我们俩都喜欢哈哈大笑。这就是我的段勇师弟。前段时间,段勇师弟花了一年多时间精心创作的AI实验室上线了,就以这篇小文, 表示祝贺和我的敬意吧。

640?wx_fmt=jpeg

(段勇师弟A+实验室的二维码)



***********************************************************

正心诚意,格物致知,以人文情怀审视软件,以软件技术改变人生。

欢迎关注格友公众号

640?wx_fmt=jpeg


这篇关于段勇师弟和他的AI情结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/386125

相关文章

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20