人工智能技术新进展

2012-12-16 23:59 · buyou

人类的大脑是一个高度复杂的器官，在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作。这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向，这种趋势虽然有利于大脑研究的不断深化，可是同时也会带来知识碎片化的结果。

人类的大脑是一个高度复杂的器官，在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作。这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向，这种趋势虽然有利于大脑研究的不断深化，可是同时也会带来知识碎片化的结果。解决办法之一就是将各个方向的研究成果全都整合到一个大脑模型当中。可是这种用各个不同的“零件（指各个研究方向取得的研究成果）”简单拼凑出一个人工大脑的方式是无法表现出大脑的精髓的，人类大脑最重要的功能就是可以行使复杂的行为（complex behavior）。就好像工程师们可以制造出汽车、电脑是因为他们之前已经掌握了汽车和电脑的工作原理，所以如果科学家们要构建出一个人工大脑模型，那么首先也得知道我们大脑的工作原理，具体来说就是要先了解大脑里每一个部分负责的运算任务，以及这些运算功能在神经网络系统上的实现原理。Eliasmith等人向我们介绍一种大规模的人体大脑运算模型，这种大脑运算模型就能够模拟各种复杂的人类行为，这一成果标志着科学家们在人工智能研究领域又前进了一大步。

资料图

Eliasmith等人开发的这个人工大脑模拟模型叫做语义指令结构统一网络（Semantic Pointer Architecture Unified Network），简称Spaun系统，该系统能够观察图像，并使用配套的模型手臂做出相应的动作。Eliasmith等人开发的这套Spaun系统可以完成八种各不相同的任务，在所有这八种任务中都会包含对各种图形（主要是数字图形）的介绍，以及根据图形做出相应的动作（用人工臂画出“看到”的数字）。在这些任务中既包括简单的图像识别任务，也包括记忆性的任务（按照看到数字的先后顺序重新写一遍），还包括强化学习任务（比如赌博任务）和更加复杂的认知任务（类似于智商测试题一类的任务）。Spaun系统会依靠它所拥有的那250万个神经元细胞来完成这些测试，这些神经元细胞按照我们人类大脑的组成方式形成了多个子系统（subsystem），这些子系统分别对应了我们人类大脑的不同区域（brain area），最后这些子系统之间又互相联系起来具备了大脑最基本的功能。

人工大脑看到的视觉图像信息首先会被“压缩”处理，去除掉不相关的、或者冗余的信息。Eliasmith小组在对图形信息进行压缩处理时使用的是一种多层次有限波尔兹曼机（hierarchy of restricted Boltzmann machines）的算法，这种算法属于一种前馈神经网络系统（feed-forward）的运行机制，每一层有限波尔兹曼机处理都可以得到一种图形特征信息，经过多轮（层）有限波尔兹曼机处理之后就可以得到整个图形的所有相关信息。然后，将这些图形信息一一分配给人工大脑里与真正人类大脑视觉中枢（ventral visual stream）对应的各个子系统，它们分别对应初级视觉皮层（primary visual cortex）和次级视觉皮层（secondary visual cortex）、纹状体外皮层（extrastriate cortex）和颞下皮层（inferior temporal cortex）。在运动功能方面，Spaun系统也采取了一种类似的方法，他们将简单的动作命令，比如画出数字“6”，也分解为很多个简单的动作，然后将这些动作组合起来就可以画出一个“复杂的”6。所有相关的运算全都基于最佳控制理论（optimal control theory），其中还包括辅助运动中枢（supplementary motor area）和初级运动中枢（primary motor cortex）的运算。这种对信号的压缩处理同时伴以动作的人工大脑模型解决了大脑在与环境发生相互作用时需要处理的“广度难题（curse of dimensionality）”，以往的人工模型在处理这类问题时总是不知道该如何处置大量的感觉信息，同时也不知道在面对众多动作备选方案时应该做出哪种选择。

Spaun系统的认知装置（cognitive machinery）实际上包括两个相互交叉的组成部分，它们分别是相当于人类大脑额前皮质区（prefrontal cortex, PFC）的记忆工作系统（working memory system）和相当于人类大脑基底神经节（basal ganglia）和丘脑（thalamu）的动作选择系统（action selection system）。这套动作选择系统控制着人工大脑当前的状态，同时也部分受到了强化学习（reinforcement learning）理论和当前流行的基底神经节（basal ganglia）模型的启发。Spaun系统的记忆工作系统采用了一套全新的算法，这套算法借鉴了计算神经科学（computational neuroscience）领域的神经系统算法和来自数学心理学（mathematical psychology）领域的卷积记忆理论（convolution memories）。这套神经系统算法使Spaun系统拥有了一个网络化的信息存贮机制，而卷积记忆理论又让Spaun系统可以将以往的信息和最新接收的信息有效的结合在一起。所以Spaun系统可以有效地做出重复行为，比如写出一列数字中的第一个数字和最后一个数字，这是其它人工大脑模型无法比拟的。

Eliasmith等人还使用了另外一个记忆工作系统来自动推测以往和当前信号之间的关系。这种自动推理功能意味着最初级的句法功能（syntactic generalization），Spaun系统呈现出的数字识别并再现功能预示着这种句法功能在将来的某一天一定会实现。这种再现功能与符号运算（symbolic computation）功能有着直接的联系，这种符号运算在计算机科学（computer science）和联通理论（connectionist）著作里非常常见。Spaun系统使用这些计算方法居然还通过了最基础的智商测试考核。

在Spaun系统里对应PFC的那些子系统起到了连接抽象运算、符号运算和单个神经元细胞活动的作用。说到卷积记忆功能，Eliasmith等人做了一个非常有意思的预测，他们估计神经元细胞激活的速率（在单位时间内出现的动作电位的平均数量）会随着不断的连续完成记忆工作而逐渐加快。这一预测非常有价值，值得开展试验进行验证。科学家们在对猴子开展的电生理学试验工作中也早就采用了让猴子连续完成记忆工作任务的试验方式，所以我们可能早就已经积累了大量这方面的数据了。

在Spaun系统的每一个模块当中，实际的信息都是通过大量被激活的神经细胞来完成处理的。而在生理条件下借助神经网络开展的高水平的运算与依靠单个神经元细胞开展的低水平的运算之间的这种联系在Spaun系统中是依靠所谓的“神经工程结构（neural engineering framework）”来重建的，这套神经工程结构系统尤其善于在活化的神经网络里完成任意数学矢量运算（arbitrary mathematical vector operation）。这套系统假定信息会按照神经激活速度的线性被读取，然后再以非线性的方式将信息转换成神经活动功能。这样每一个子系统里处理的信息都会被分配给每一个神经元细胞，这种模式也非常符合大脑电生理研究工作得到的结论，比如我们的大脑对不同的感觉刺激（输入）信号或运动输出信号的响应速度是不一样的等。

基于Eliasmith等人的开发思路，当这套Spaun系统在某些方面不能很好的模拟真实大脑情况时我们一点也不感到奇怪。比如这套系统多个部分的响应活性在好几个方面（其中包括最基础的统计范畴）都和大脑的实际情况有明显的不同。我们现在还不知道将来这些问题能够被改善到何种程度，也不清楚这些偏差在多大程度上其实只是我们大脑内部基础响应水平不一致情况的真实反映。Spaun系统的最大问题还是它硬连接（hard-wired）的本质以及不能学习新任务（功能）的特点。不过Spaun系统的结构具有非常大的灵活性，并不拘泥于某一项任务，而且在Spaun系统中有多个部分都是具备学习功能的，比如图形信息多层处理系统和动作选择系统都有这种学习的潜力。至于说更广义的学习能力，比如学习一项全新的任务，这也许是Eliasmith等人故意留下的一个空白。实际上，Spaun系统所欠缺的恰恰就是我们在对自身大脑认识上还有所不足的部分。Eliasmith等人已经将大量的大脑研究成果纳入了这个Spaun系统，这件工作本身就已经向我们展现了一个大脑工作理论，当然其中并不包括与学习相关的机制。在统计学家George Box看来这个Spaun系统也许是错的，不过这个系统绝对是有用的。此外，Eliasmith等人也提供了一种大规模的、自上而下开发人工智能系统的可能性。Spaun系统的出现为这方面的工作设立了一个新的标杆，也提供了一条新的途径，不要只想着如何将尽可能多的神经细胞或信息量集中在一起，注意力应该集中在尽可能的重现大脑功能，行使更复杂的行为这方面。

关键词：人工智能 Spaun Eliasmith