设为首页 | 加入收藏

 

 

  服务电话:021-88888888

新闻动态

Relevant training

Relevant training

Relevant training

当前位置:首页 > 新闻动态 > 新闻动态

来源:网上彩票

沃森的工作方式也是如此。借助非结构化信息管理框架(UIMA),沃森设计了几百个不同的系统。沃森系统中很多的个体语言组成与大众使用的自然语言理解系统是一样的,这些系统要么直接对《危险边缘》的提问给予回答,要么至少简化某些提问。UIMA就像一个“专家经理”,需要智能整合不同系统的运算结果。但它远远超越了那些早期系统,如Nuance的前身研发出的系统,因为就算它的个体系统没有提供最终答案,这些系统还是能为最终结果献出自己的一份力量——只要能缩小解决方案的范围就足够了。UIMA能计算出得出最终答案的概率。人脑也能这样——在问到母亲的姓氏时,我们对自己的答案会很自信,但是要说出很多年前偶然遇到的那个人的姓氏时,我们就没那么自信了。

因此,为了找到一个能够理解《危险边缘》中固有的语言问题的优雅方法,IBM的科学家将他们能得到的所有艺术语言理解状态模型结合在一起。有些人利用隐马尔可夫层级模型;有些人采用隐马尔可夫层级模型的数学变体;另外一些人则运用规则方法直接编码一套可靠规则。UIMA根据每个系统在实际使用过程中的表现,以最优的方式对不同系统进行整合。但是公众对沃森系统有一些误解,他们认为IBM创造沃森系统的专家们太过关注UIMA,即他们所创造的专家经理。有些评论家认为沃森系统并没有真正理解语言,因为很难知道理解位于哪个部分。尽管UIMA也会借鉴自己以前的经验,但沃森对语言的理解并不仅仅位于UIMA,而是分散在很多组成部分中,包括使用与隐马尔可夫层级模型同样方法的智能语言模块。

在决定应在《危险边缘》游戏中下多大的赌注C6网上彩票投注时,沃森技术的某个特定部分会使用UIMA的信心指数评定系统。虽然沃森已特意为这种游戏升级了系统,但核心语言—知识—搜索技术却能执行更多的任务。有人肯定会认为掌握不常用的专业知识,如医学知识,要比掌握那些玩《危险边缘》游戏所需的大众化知识更难。然而事实却恰恰相反:专业知识的脉络更加清晰,结构更加完整,而且相对来说,信息歧义程度较低,所以沃森可以非常容易地理解这些精准的自然语言。IBM公司目前也正与Nuance公司联手打造面向医学用途的沃森系统。

沃森在玩《危险边缘》这个游戏时的系统对话非常简单:出现一个问题,沃森寻找相应的答案,从技术上来讲,就是提出问题并给出答案。在一个对话中,沃森并不需要回顾所有对话者之前的谈话内容(Siri系统则需要回顾部分内容:如果你要求它给你的妻子发条短信,第一次,它需要你指认你的妻子,但以后就不需要你重复指认了)。虽然回顾对话中的所有消息——这显然是一个需要通过图灵测试的任务,是一个额外却很重要的任务,但是任务难度并不比沃森的提问回答任务高。毕竟,沃森已经阅读了数百万页的读物,其中自然包含了很多故事,所以它能够追踪复杂的序列事件。沃森也应该可以追溯自己以往的对话,并在下次回答问题时将其列入知识库。

《危险边缘》的另外一个缺点是问题的答案都比较简单。例如,它不会要求竞猜者归纳《双城记》(A Tale of Two Cities )的5个主题。针对这个问题,沃森会找到讨论小说主题的相关文件,并整理出自己的答案。通过自己读书找到答案,而不是抄袭其他思考者的观点(即使没有书面文字),这又是另外一个问题。如果要让沃森自己读小说找到答案,目前来说,对沃森而言显然是一个更高水平的任务,而前者就是我所谓的图灵水平测试任务(需要指出的是,大部分人对此也没有自己的原创观点,而是吸收借鉴了同辈或者专业人士的观点)。现在是2012年,不是网上怎么买彩票2029年,所以我不会期待沃森可以回答图灵智力水平测试这一难度的问题。而且我还要指出:概括小说主题这种级别的问题并不是简单的任务。对于谁签署了《独立宣言》这样的问题,我们可以对其给出的答案作出正确或者错误的判断。但是对概括小说主题这样高难度的问题,我们无法轻易判断其答案的正确性。

值得注意的是,虽然沃森的语言能力低于受教育者的语言能力,但是它却可以成功打败在《危险边缘》中表现最好的两个选手。成功的秘诀在于:借助其拥有的完美回忆功能和准确记忆能力,沃森可以将它的语言技能和知识理解能力完美结合。这就是我们要将个人的、社会的或者历史的信息储存在沃森系统内的原因。

我并不打算论述我的推测——到2029年计算机能够通过图灵测试,但是从目前诸如沃森系统取得的进步来看,图灵等级的人工智能应该能够实现。如果有人可以研制出为图灵测试优化的沃森系统,那便离我们目标的实现又近了一步。

美国哲学家约翰·塞尔(John Searle)最近提出了一个论点:沃森不具备思考的能力。他援引了自己名为“中文屋”(Chinese room)的思想实验(将在第11章详细阐述),说明沃森只是能够熟练地运用那些符号,却不能真正理解那些符号背后的意思。实际上,塞尔并未正确地描述沃森这个系统,因为沃森对语言的理解不是基于对符号的理解,而是基于分层数据过程。假如我们认为沃森系统的智能过程只是熟练地运用符号的话,塞尔的评价就是正确的。但如果真的是这样的话,人脑也就不能思考了。

在我看来,那些批评沃森只会对语言进行数据分析,而不能像人类那样真正理解语言的批评家是非常可笑和滑稽的。人脑在处理各种各样的假设时,也是基于数据信息(新皮质层级结构的每一层都是如此),并通过分层数据分析的方法处理信息的。沃森和人脑都是借助分层理解来学习和作出反应。在很多方面,沃森的知识要比单个人的知识丰富得多,没有哪个人敢说自己掌握了维基百科内的所有知识,而维基百科内的知识只是沃森知识库的一部分。与此相反,每个人掌握的概念层次要比沃森多,但是这种差距是可以跨越的。

Wolfram Alpha是衡量处理组织化信息计算能力的重要系统,这个知识引擎(与搜索引擎相对)是由英国数学家、科学家沃尔夫勒姆博士与他的沃尔夫勒姆研究中心(Wolfram Research)的同事一起开发的。例如,如果你问Wolfram Alpha (在Wolfram Alpha.com这个网站上) “0 ~1000000范围内有多少个质数”,它会回答:“78498。”它并不是从系统中搜寻答案,而是自行算出答案,并在答案的下方列出计算所用的公式。如果你在一般的搜索引擎页面上输入同样的问题,它只会给出你所需算法的链接,并不会直接给出答案。之后你还需要将那些公式输入Mathematica这样的软件中进行运算,虽然后者也是沃尔夫勒姆博士开发的,但是与直接询问Alpha相比,后者要做的工作(需要理解的东西)明显要多得多。

实际上,Alpha包含了1500万条Mathematica 语句。Alpha 从将近10万亿字节的数据中计算出答案,沃尔夫勒姆研究中心的员工们仔细整理过这些数据。你可以向Alpha询问很多实际的问题,例如:“哪个国家的人均GDP值最高?”它会回答:“摩纳哥,人均212000美元。”再如:“史蒂芬·沃尔弗拉姆多大了?”它会回答:“在我写下答案的当天,52岁9个月零两天。” Alpha 也是苹果Siri系统的一部分。如果你向Siri提一个实际的问题,它就会启动Alpha来处理你的问题。Alpha 也负责处理微软公司必应搜索引擎接收的一些提问。

沃尔夫勒姆博士在自己最近的一篇博文中写道:Alpha现在处理问题的准确率可以达到90%。他同时写到,以大约18个月为半衰期,Alpha的错误率也大大降低了。Alpha是一个令人印象深刻的系统,它不仅采用人工编程的方法,还采用了人工搜索数据的方法。这就解释了我们发明计算机的原因。随着科学、数学方法的发现和汇编,计算机在处理此类问题时要远远强于单纯的人类智力。Alpha系统已经收纳了大部分科学方法,而且还在不断更新着从经济学到物理学各种各样知识的最新发展状况。在我和沃尔夫勒姆的一次个人谈话中,他估计如果沃森使用的那些智能方法正常工作时正确率大约为80%,Alpha则可以达到90%。当然,这些数字都具有一定的自我选择倾向,因为使用者(例如我自己)已经知道Alpha系统擅长哪类问题,同样的因素也影响智能系统的评价。沃森在《危险边缘》这个游戏中回答问题的准确率可能是80%,但即使只有80%,也足以打败该游戏最强的人类竞争者。

就像我在思维的模式认知理论中提到的那样,这些智能的方法需要理解我们在实际生活中遇到的那些非常复杂但又很模糊的层级信息,人类的语言当然也包含在内。智能系统的完美结合则需要在准确的科学知识和数据的前提之下,运用思维的模式识别理论(据我看来,思维模式识别是人脑的工作机制)对不同层级的智能进行综合。这样我们就可以用计算机阐释人类,智能在日后也能继续发展。对生物智能而言,虽然我们的大脑新皮质具有很强的可塑性,但是新皮质自身的物理特性限制了其潜力的发展。将更多的新皮质植入我们的前额无疑是一个非常重要的进化创新,但是目前我们还不能轻易增加额叶的容量,即使只增加10%也很困难,更别说扩大1000倍了。从生物意义上说,我们不能完成这项创新,但是从技术层面来讲,这项创新是可行的。

创造思维的策略

我们的大脑拥有数十亿个神经元,但什么是神经元呢?简单地说就是细胞。如果神经元之间没有建立连接机制,大脑就没有知识。神经元之间的连接决定了我们可以知道什么,我们到底是谁。
蒂姆·伯纳斯·李

现在让我们用上面讨论过的知识来构建人工大脑。首先,我们需要构建一个符合某些必要条件的模式识别器。接下来,我们会复制识别器,因为我们拥有记忆以及计算源。每个识别器计算出模式被识别出的概率。这样,每个识别器考虑了观察到的每个输入的数值(某种连续变量),然后将这些数据跟与每个输入对应的习得数据和数值变化程度参数进行比较。如果计算出的概率超过了临界值,识别器就会激活模拟轴突。我们用遗传算法优化的参数就包括这个临界值以及控制计算模式概率的参数。识别模式并不需要每个输入都有效,因此,自联想识别就有了空间(某个模式只要展现出一部分,我们就可以识别整个模式)。我们同样也允许存在抑制信号,即暗示模式根本不可能的信号。

模式识别向该模式识别器的模拟轴突发送有效信号。此模拟轴突反过来又会与下一个更高层次的概念级别的一个或多个模式识别器建立连接。下一个更高层次的概念级别连接的所有模式识别器就会将这种模式当成输入。如果大部分模式被识别,每个模式识别器还会向低层概念级别传递信号——这表明剩余的模式都是官方授权正规彩票平台“预计”的。每个模式识别器都有一条或多条预设的信号输入通道。当预计信号以这种方式被接收时,模式识别器的识别临界值就降低了,也就更容易识别。

模式识别器负责将自己与位于概念层级结构上、下层级的模式识别器“连接”起来。需要注意的是,所有软件实现的“连接”都是通过虚拟连接而并非实际线路实现的(类似于网络连接,本质上是记忆指针)。实际上,这类系统比生物大脑系统更为灵活。人脑中出现新模式时,就需要对应生物模式识别器,还需要实际的轴突枝晶链接与别的模式识别器建立连接。通常人类的大脑会选取一个跟所需连接十分类似的连接,并在此基础上增加所需的轴突和树突,最后形成完整的连接。

哺乳动物的大脑还掌握另一种技术,即先建立很多的可能性连接,然后再剔除那些无用的神经连接。如果一个皮质模式识别器已经承载了某种旧模式,而生物新皮质又为这个模式识别器重新分配了最新信息,那么这个皮质模式识别器就需要重新构造自身的连接。这些步骤在软件中很容易实现。我们只需要为这个新的模式识别器分配新的记忆存储单元,并基于新的记忆存储单元构造新的连接。如果数字新皮质想要将皮质记忆资源从一个模式系列转到另外一个模式系列,它只需将旧模式识别器纳入记忆,再重新分配记忆资源即可。这种“垃圾回收”和记忆再分配是很多软件系统构建的显著特征。在数码大脑中,在我们从活跃的新皮质剔除旧记忆之前,数码电脑首先会对旧的记忆进行复制,而这是生物大脑无法做到的。

很多数学技术可用于构建这种自组织层级模式识别。基于多种考虑因素,我最终选择了隐马尔可夫层级模型。从我将其应用在最初的语音识别和20世纪80年代的自然语言系统中开始,我对这一模型已有数十年的研究。从整个领域来看,隐马尔可夫模型在处理模式识别问题时比其他方法的应用范围更加广泛,而且它还被用到理解自然语言的研究当中。许多NLU系统用到的技术在数学意义上与隐马尔可夫层级模型非常类似。

需要指出的是,所有的隐马尔可夫模型都是层级性的,其中一些包含的层级较少,例如只包含3层,从发音到音素再到词汇。为了模拟大脑,我们则需要根据要求建立许多新的层级结构。而且,大部分隐马尔可夫模型并不是完全智能的。尽管有一些连接的重要性为零,这些系统却有效地减少了初始连接的数量,不过,系统仍有一些固定的连接。20世纪80年代到90年代开发的系统已经能够自动剔除某个固定等级之下的连接,它们也可以建立新的连接,从而更好地对数据样本进行建模,学习新知识。很关键的一点就是允许系统根据自己学到的模式灵活地调整自身的拓扑。我们也可以利用数学上的线性规划为新的模式识别器指定最优连接。

我们的数码大脑还允许一种模式反复出现,尤其是那些经常出现的模式,这就为我们识别常用模式,或是表现形式不同的同一种模式提供了坚实的基础。但我们还需要设定冗余界限,以保证系统对常用低级别模式的储存不会占用太多空间。

冗余规则、识别临界值和对“这一模式是预计的”临界值设定的影响,是影响自组织系统性能的重要参数的几个例子。最开始的时候我是凭直觉设定这些参数,之后再用遗传算法对其进行优化的。无论是生物大脑还是软件模拟的大脑,大脑的学习能力都是一个值得重视的问题。在前面我已经提到,一个层级模式识别系统(不管是数字的还是生物的)可以同时学习两个优选的同一级别的层级结构。为了使系统完全智能化,我首先会采用之前已经测试过的层级网络,该网络在识别人类语言、机打信件和自然语言结构任务时,学习能力已经得到了训练。不过,虽然这个系统可以识别自然语言写成的文件,但一次只能掌握一个层级上的信息。系统学到的上级知识会为下级知识的学习奠定基础。系统可以反复学习同一个文件,每次阅读都会学习到新知识,这跟人们的学习过程有些类似——人们也是在对同一资料的反复阅读中加深对它的理解。网络上有数十亿页的信息,仅英文版的维基百科就有400万篇文章。

我还会提供一个批判性思维模块,这个模块可以对现存所有的模式进行连续不断的后台扫描,从而审核该模式与该软件新皮质内其他模式(思想)的兼容性。生物大脑没有这样的模块,所以人们能够平等地对待所有的片段性信息。在识别松散的信息时,数字模块会试图在它自己的皮质结构和所有可用的信息中寻找解决方法。在这里,解决的办法可能仅指判断这松散信息中的某一部分不正确(如果与该信息相对立的信息在数量上占优势)。不仅如此,该模块会在更高概念层次上,为解决这种信息的矛盾性提供方法。系统会将解决方法视为一个新的模式,并与引发这个搜索的问题建立连接。该批判性思维模块会一直在后台运行。如果人类大脑也有这样的模块,那该多好。

同样,我也会提供一个识别不同领域内开放性问题的模块。作为另外一个连续运行的后台程序,它会在不同的知识领域内寻求问题的解决方案。我前面已经指出,新皮质内的知识由深层次嵌套网状模式组成,因此具有隐喻性特征。我们可以用一种模式为另外一个毫不相关领域的问题提供解决方法。

我们回顾一下第4章提到的隐喻的例子,用某种气体分子杂乱无章的运动来隐喻某种进化过程中杂乱无章的变化。虽然气体分子的运动没有明显的方向,但是聚集在高脚杯内的分子如果有了足够的时间,最终会跑出高脚杯。这也解决了智力进化过程中的一个重要问题。就像气体分子一样,具有进化意义的变化并没有明确的目的。但是我们能看到这种变化正朝着更复杂和更高级的智力方向发展,最终达到进化的最高端,即新皮质具备层级思考的能力。因此我们能够弄清楚某个领域内(生物进化)没有目的和努力方向的进程是怎样完成一个精确目标的。以此为基础,我们也就可以了解其他领域内相似的进程,例如热力学领域。

我之前已经提到过查尔斯·赖尔的论断——经过长时间的流水侵蚀,岩石会被侵蚀为山谷,这促使查尔斯·达尔文作出了自己的论断,即经过不断的变化,物种的生物特征也许会发生天翻地覆的变化。这种隐喻性的搜索又是另一种持续运转的后台程序。

为了提供结构思维的对等体,我们需要提供能同时处理很多歌曲列表的方法。列表可能就是对问题解决方法必须满足的限制条件的说明。

解决问题的每一步都可能会对现有的思维层级结构进行反复搜索,或者说对现有文献进行反复搜索。人脑一次只能同时处理4个列表(在没有计算机辅助时),但人造新皮质却没有这样的限制。

我们还要借助计算机擅长的智能来完善我们的人造大脑,例如计算机可以准确掌握大量知识,快速、高效地运用已知算法。Wolfram Alpha整合了许多已知的科学算法,并将它们应用于处理已经仔细整理过的数据。如果沃尔夫勒姆博士能够找到降低该系统错误率的方法,这个系统仍然有巨大的发展应用空间。

最后,我们的新大脑还需要拥有一个包含很多小目标的大目标。对生物大脑而言,我们继承了由旧脑快乐和恐怖中心设立的目标。为了促进物种的繁衍生息,这些早期目标在生物进化过程中早已被设定,但是大脑新皮质的出现使得我们可以超越早期目标。沃森就是为《危险边缘》这个游戏而生的。另外一个目标就是通过图灵测试。为了达到目标,数码大脑需要像人类那样,阐述自己的故事,从而成功地假扮成生物人。数码大脑有时还要装聋作哑,因为任何移植沃森知识的系统很快就会露出马脚,让人发现其不是生物人。

更为有趣的是,我们可以赋予新大脑更具野心的目标,即美化世界。当然,这个目标会引发一系列的思考:为谁美化?在哪一方面美化?为人类?还是所有有意识的生物?评价有意识的标准又是什么?

仿真大脑在改变世界进程中的地位越来越重要。毫无疑问,与未进化的生物大脑相比,仿真大脑在改变世界的进程中发挥了更大的作用。不过,我们还需要思考仿真大脑的道德意义。我们可以从宗教传统中的黄金法则开始讨论这个问题。

版权所有:C6网上彩票投注

网上彩票 版权所有
网站地图 粤ICP备12345678号