神经网络如何学习到加法等算法 - 神经编码器-解释器(Neural Programmer-Interpreters)

本文主要是介绍神经网络如何学习到加法等算法 - 神经编码器-解释器(Neural Programmer-Interpreters),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

算法的本质

    何为算法(algorithm)?

    从狭义来讲,算法是计算机科学里面的概念,简单来说,所谓算法就是定义良好的计算过程,它取一个或者一组值作为输入,并产生出一个或一组值作为输出。亦即,算法就是一系列的计算步骤,用来将输入数据转换成输出结果[1]。

    从广义来讲,算法是从初始态到可达目标态的序列过程。

    如:命令机器人拿起一个瓶子,那么算法就是从机器手中没有瓶子到不断修正自己机器手到拿起一个瓶子的动作过程。而这些动作和程序没有本质的区别,都是序列化过程。假如我们将拿起瓶子的动作简化为基本的形式:Left,Right,Top,Down,Forward,Backward,OpenHand,CloseHand,这些动作的参数都为T,即持续时间,且简单的做匀速运动。那么机器人拿起瓶子这样的动作过程就可以概括为这些动作的组合序列过程,我们如果定义整个组合序列过程集合即机器人动作空间,那么这个算法就是找到这样一个或者多个子动作空间使机器人拿起瓶子。

神经编码器-解释器

    本质上算法程序就是序列过程,但是通常算法程序都是人类写的。因为人工智能的发展,机器变得越来越智能,越来越能做很多事情,所以这里就有一个有趣的问题:如果机器能够学会了写出自己的算法并改变自身的算法,那么机器是否就拥有了自我进化的能力?

    我们知道任何复杂的事物或概念C都必然由比他自己更简单的事物或概念S构成,如果S不能再分解为比自己更简单的东西,那么S就是C的一个因子,如果C=S那么C不能被分解。以自然数为例:0,1,2,3...任何自然数(排除0以外)必然可以由一个或者多个素数相乘得到,而素数无法被分解为除自身与1相乘的任何自然数相乘的形式,所以任何素数构成得到任何自然数(排除0以外)的乘法因子。同理,加法中任意个0与1可以相加构成任何的自然数,所以0与1构成任意自然数的加法因子。

    由上,为了学习C我们可以先学习S,同样可以递归的找到学习C的所有因子。这和人类相似,我们学习概念也是从简单的开始,然后学习由简单概念构成的复杂概念,尤其在数学上,如果基本的自然数加减乘除都不会的话,自然无法学会更高级的线性方程。这也是我们常说的基础很重要的原因,因为复杂的东西由基础的东西构成。这个在自然语言中也呈现出简单到抽象的层次结构。

     神经编码器-解释器(Neural Programmer-Interpreters,NPI)的思想和上面的类似,即我们可以先学习简单的算法,如:自然数加法,文本替换等,然后学习复杂的算法。在神经编码器-解释器之前,就有很多论文阐述如何学习加法的机器学习算法,如:神经图灵机(Neural Turing Machine),等等,还有最近Facebook发表的用强化学习来训练机器学习简单算法。

     下面根据论文来叙述该算法的思想。NPI由三个可学习组件,即:一个任务未知的递归核心,一个持久的键值对程序内存和特定领域的编码器组成。其中该论文中的递归核心是以LSTM为基础的序列模型。下面是架构图:

前馈过程

   

   

   

   其中:

    为时间 的原始环境状态, 为函数参数, 为编码后的状态, 为特定领域的编码器(函数),

   为程序或程序动作, 为LSTM的内部隐藏状态, 输出状态,为多层感知机(MLP)和LSTM-Core构成的递归网络函数

   为是否终止程序的概率, 为嵌入程序的键(key), 为下一个时间的参数值,皆为解码器

    为下一时间的环境状态,只是环境变化函数,并不是我们计算得到的,而是环境生成的。

加法计算过程

    加法计算过程如下图:

               

    整个加法是在一个表格中进行,其中第1,3,5,7行为指针可达位置,其他行为数字行,红色的箭头为指针,红色的箭头只能左右移动即:LEFT,RIGHT,而这些移动即我们的子程序,ADD,ACT...也是子程序或者叫因子程序。而指针指向的位置为他下面的格子。上面过程为第一个执行ADD1,产生下一个程序WRITE和两个参数,即位置为第4个指针行的指针所指位置(即第8行,第5列,下同)及得到的值2;然后执行并产生程序ADD1等等,都差不多不细讲。其中CARRY为进位程序,ACT是一个综合简化程序,WRITE为写入数字到表格。当然还有其他程序过程,这里只列举了加法。

训练

    训练主要通过运行的轨迹即:这个时间步的输入和应该的输出来监督式训练。最优参数通过下面的公式获得:

    而代价函数为:

    其中单步条件概率可以因子化为以下的和:

    通过梯度上升法,求解最优参数集。 其他问题可参考[2]。

总结

    有人说自然数加法很简单,实际上对于研究人工智能的人而言未必是简单的,因为我们不仅仅要知道是什么,更要知道为什么,往往简单的东西是难以说清楚的比如:1+1为什么等于2,很难说清楚,当然这是皮亚诺公理的内容。自然数加法的基础公理是大学数学分析才学的,相对的自然数加法则是小学数学的内容,所以what和why的层次有巨大的区别。在人工智能中自然数加法如果用回归逼近的方法来做只能得到近似解,而不能得到精确解,这个是有很大差别的。

参考:

 1. Thomas H.Cormen、Charles E.Leiserson、etc,Introduction to Algorithms

 2. Scott Reed 、Nando de Freitas,Neural Programmer-Interpreters

 3. Neural Programmer-Interpreters 动画演示

这篇关于神经网络如何学习到加法等算法 - 神经编码器-解释器(Neural Programmer-Interpreters)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/969096

相关文章

springboot+dubbo实现时间轮算法

《springboot+dubbo实现时间轮算法》时间轮是一种高效利用线程资源进行批量化调度的算法,本文主要介绍了springboot+dubbo实现时间轮算法,文中通过示例代码介绍的非常详细,对大家... 目录前言一、参数说明二、具体实现1、HashedwheelTimer2、createWheel3、n

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

如何通过Golang的container/list实现LRU缓存算法

《如何通过Golang的container/list实现LRU缓存算法》文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向... 目录力扣:146. LRU 缓存主要结构 List 和 Element常用方法1. 初始化链表2.

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为

通俗易懂的Java常见限流算法具体实现

《通俗易懂的Java常见限流算法具体实现》:本文主要介绍Java常见限流算法具体实现的相关资料,包括漏桶算法、令牌桶算法、Nginx限流和Redis+Lua限流的实现原理和具体步骤,并比较了它们的... 目录一、漏桶算法1.漏桶算法的思想和原理2.具体实现二、令牌桶算法1.令牌桶算法流程:2.具体实现2.1

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

Python中的随机森林算法与实战

《Python中的随机森林算法与实战》本文详细介绍了随机森林算法,包括其原理、实现步骤、分类和回归案例,并讨论了其优点和缺点,通过面向对象编程实现了一个简单的随机森林模型,并应用于鸢尾花分类和波士顿房... 目录1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例:使用随机森林预测鸢尾花品种4.1

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert