神经元示意图
上图中,大圆圈表示为一个抽象的*神经元,连线和小圆分别表示神经元的轴突和突触,当一个神经元处于激活状态时候会发出冲动信号,冲动信号延轴突单向传递给*突触(小圆),这时候突触启动,发放*神经递质,发放递质的多少由突触强度大小来决定,强度越大发放的量越多,而产生的效应值也越多,得到效应值的多少对神经元的激活起决定作用,因为神经元激活的条件是:统计所有输入*效应的总值和*阀值做比较,如果超过阀值就表示激活,然后神经元会把冲动信号传递给自己的突触,再重复上述的比较过程。
黄色的大圆圈:表示专门释放兴奋性递质的神经元,淡黄色表示它没有被激活,而黄色表示处于激活状态。
红色的大圆圈:表示专门释放抑制性递质的神经元,淡红色表示它没有被激活,而红色表示处于激活状态。
小圆圈:表示为神经元的突触。旁边用数值标示其连接强度(效应值)
大圆圈中的数值:是某一神经元的阀值。
方框中的数字:表示在某一时刻,神经元在进行的输入效应总值与阀值的比较过程。
正是由于突触传递效果有正效应和负效应,每一个突触的强度大小也不相同,每一个神经元的阀值也不相同,它们的彼此连接可以组成逻辑上的门结构: 与门、或门、异或门等,有一些这样的逻辑门连接属于本能的先天性连接,是一种程序化逻辑结构,有一些则属于后天训练而来的逻辑结构。
神经元的“学习和记忆”的形成
如图-1所见,这是一个抽象了的神经连接布局,有4个神经元A、B、C、D。 A:感应外部条件信号输入的神经元 B:感应外部刺激而响应的本能神经元 C:一个中间神经元 D:输出端神经元 W-AC:是神经元 A与C 的连接突触强度 W-BC:是神经元 B与C 的连接突触强度
假定:得到外界某一输入信号而产生本能响应的B 对C的连接W-BC强度足够的强,(这个连接强度大小是先天决定的,由基因遗传保留,强度不会改变),以至于B的激活可以带动C的激活,而C与输出端的D的连接强度也很巩固,那么B的激活通过C也会使得D产生激活。这就是一条简单的反射链:激活B导致D被激活,当然现实中的反射链远比这样要复杂的多,神经元的数目和连接的数目都会更多。像这样的由刺激本能响应而引起的条件输出,就是先天性反射(链)。
再来看A与C的连接W-AC强度是比较虚弱的,它没有B对C的输出影响那么大,(它们的连接可能是由于后天因素刺激而产生的,当然现在我还不能确定这样的产生新连接的机制是否存在,也许是受到外界刺激而产生的某种“尝试性生长”机制在起作用),但我们可以通过Hebb学习规则使A与C的连接W-AC得到强化。
Hebb学习规则的原理可以概括的说:“当两个彼此连接的神经元同时响应的时候,它们之间的连接强度将会加强”
Hebb突触强化过程示意图
1、与靶神经元连接强壮的神经元的激活,可以使得靶神经元激活。
2、与靶神经元连接微弱的神经元的激活,不能使得靶神经元激活。
3、两个输入神经元同步激活,可以使得靶神经元激活。
4、持续进行同步训练,当靶神经元激活的时候会强化所有使其激活的突触连接强度。
5、原来输入微弱的神经元,经过训练,连接在靶神经元上的突触变的强壮,也可以单独使靶神经元激活。
那么我们可以利用这个规则,想象一下,当B激活C的同时,A也对C进行刺激输入,那么C会把A的刺激“看”做一个有效的输入,而强化它们的连接W-AC。久而久之当这种同步持续,伴随着B的引导,A与C的连接会得到足够的加强,已至于后来单独出现A的输入也会引起C的激活,C的激活会引起输出端的D的激活,那么这样我们就建立起了一条新的反射(链):激活A导致D被激活,也就是一条后天性条件反射(链)。
下面讲一下复杂一些的Hebb突触强化学习过程
如图-2所见这是一个抽象化的蜜蜂脑神经网络
A:感应外部条件信号输入的神经元,看见了红花
B:感应外部条件信号输入的神经元,看见了蓝花
X:感应外部条件信号输入的神经元,得到了蜂蜜,或者说是一种奖励信号,一般在行为后产生信号
C:感应外部刺激而响应的本能神经元
D:一个中间神经元
E:一个中间神经元,和W-AE 、W-DE组成与门
F:一个中间神经元,和W-BF 、W-DF组成与门
G:一个抑制性中间神经元,参与一侧抑制,协助E被选择,抑制旁边的神经元不被激活
H:一个抑制性中间神经元,参与一侧抑制,协助F被选择,抑制旁边的神经元不被激活
I:输出神经元,靠近红花
J:输出神经元,靠近蓝花
W-AD:是神经元 A与D 的连接突触强度
W-BD:是神经元 B与D 的连接突触强度
W-AE:是神经元 A与E 的连接突触强度
W-DE:是神经元 D与E 的连接突触强度
W-BF:是神经元 B与F 的连接突触强度
W-DF:是神经元 D与F 的连接突触强度
假设其中一种颜色的花中有蜂蜜,而蜜蜂在几次尝试后学会了应该靠近哪一种花,这一切发生在神经元D上的W-AD、W-BD强度变化中,在几次尝试后,因为在行为后奖励信号C参与下,W-AD、W-BD的某一个将不断变强,这都是Hebb学习规则的作用,以至于以后单独看见某种花就马上做出反映是否应该靠近它。而整和模块中神经元的作用是作出行为选择,使某一个输入信号更加“显眼”,让运动系统作出唯一选择,这是一种“赢者”赢得一切的路线形式。
评论