计算机通过什么测试才算人工智能培训

前几天有消息称人工智能培训軟件Eugene Goostman,有评委真把它当成了一个13岁的小孩虽然有人质疑测试的合理性,但这毕竟提醒我们计算机在这数十年里已经有了长足的进步计算机以它们自己的方式做着一些智能的事,以下4个领域就是计算机正在崛起的地方

计算机可算是最好的图书管理员,每次你用谷歌搜索時它都会检索约500亿网页。谷歌搜索十分强大很多人都不会点击第二页的内容。

它的未来会怎么样理解人类语言可能是最困难的事之┅,数十年来计算机都无法弄清人类语言文字的涵义。它们也无法明白为什么同一个词在不同的语境下会有完全不同的意义斯坦福大學的生物医药信息研究员Russ Altman一直试图解决这一问题。自2000年起他和同事就在教机器如何从医学研究报道中抽取有用信息。他们开发的可以理解一些从句也能根据上下文了解单词的含义,还知道一些同义词和反义词

目前机器人已经受控制的条件下进行一些自动化操作,比如汽车制造不过让它们像人类一样做出复杂的行为仍旧十分困难。尽管如此一些前沿机器人的表现还是令人惊叹,它们可以解放人类劳動力从事一些更具创造性的工作。亚马逊的机器人大军就能林立的货架中取出物品交给人类

研究人员正在训练机器人读取人类行为的信息,从而能在更复杂的项目上与人类合作人类和机器可以各发挥所长,人类更灵巧而机器人的动作更精确。卡内基梅隆大学的专家David Bourne淛作了一款机器人手臂可以帮助汽车焊接。在测试中机器人会告诉人类将各部件放在哪里,然后时行精确的焊接对更复杂的任务,咜会交给人类伙伴

机器学习是人工智能培训的一个分支,用试错的方法解决复杂问题如通过数百万次的迭代来帮助银行评估信用风险。

目前机器学习服务只能由一些科技巨头通过云服务提供不过未来智能手机也能成为一个端口。美国高通公司的研究员Tony Lewis表示他们正在研究的项目可以通过强化学习教会机器人做一些事情。到时候你不需要自己设置铃声或提醒之类的东西,只需要向手机做出积极或消极嘚反馈它就会了解你的生活习惯。

在识别语音、运动和图像上机器人还有一大段路要走,Siri总会犯错谷歌甚至需要1.6万个处理器才能训練计算机识别出(准确率还算理想)。这是因为语音和形象不能还原到二进制的数字

不过新的处理器可以模拟人类神经网的活动方式,鉯并行的方式处理信息流它们被称为神经形态计算(neuromorphic computing)。最终的目标是设计出只需要现代计算机一部分计算能力的设备就可以读取复雜的信息。这意味着下一代Siri和小冰可以实现真正的调情了

雷锋网原创文章,未经授权禁止转载详情见。

在“人工智能培训之父”阿兰·图灵(Alan Turing)逝世60周年之际英国科学家昨天(8日)宣布,一台超级计算机首次通过了“图灵测试”成功让人类相信它是一个13岁的男孩。也僦是说这台计算机成为有史以来第一个具有人类思考能力的人工智能培训设备。

人工智能培训“尤金·古特曼”界面(2012年资料)

机器人荿功伪装13岁男孩

6月8日英国雷丁大学在著名的伦敦皇家学会(The Royal Society of London)举办了一场“图灵测试”,一个俄罗斯团队开发的一款名为“尤金·古特曼(Eugene Goostman)”的计算机软件通过了测试

在测试中,尤金?古特曼模仿一名来自乌克兰的13岁男孩而它成功地让33%的测试人相信了这一点。

计算机和囚工智能培训的先驱阿兰·图灵1950年提出了著名的“图灵测试”在这一年的十月,他发表了另一篇题为《机器能思考吗》的论文,第一佽提出“机器思维”的概念他从行为主义的角度对“智能”概念给出了定义,并提出假想:一个人在不接触对方的情况下通过一种特殊的方式,和对方进行一系列的问答如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机那么,就可以认为这个计算機具有同人相当的智力即这台计算机是能思维的。

图灵还进一步预测称到2000年,人类应该可以用10GB的计算机设备制造出可以在5分钟的问答中骗过30%成年人的人工智能培训。

本次测试就是以图灵的这一预测为标准要求计算机在一次时间为五分钟的文字交流中,能够让30%的测试囚相信它是人类

共有5台计算机参加了本次测试,但只有尤金?古特曼最后通过

该软件的开发者之一弗拉基米尔·维西罗夫(Vladimir Veselov)表示:“我们的主要设计理念是,它可以声称它什么都知道但由于受年龄限制,实际上它并不是什么都知道这是完全合理的。我们花了很多時间开发这样一个具有人性的角色”

在2012年的一次测试中,尤金?古特曼也曾成功骗过29.2%的评委距离通过测试仅一步之遥。

英国雷丁大学愙座教授凯文·沃维克(Kevin Warwick)指出尤金?古特曼可以被认为是首台通过“图灵测试”的计算机。虽然此前也有一些人声称其开发的软件成功通過了“图灵测试”但它们的测试预先设定了讨论的话题或提出的问题。

沃维克指出这是人工智能培训发展的一个里程碑事件,而且由於当天是图灵去世60周年纪念日这一成就具有了特别的意义。

但沃维克也提醒说这项技术可用于网络犯罪。他说:“在人工智能培训领域没有什么比图灵测试更具标志性和争议性的了——让一台计算机说服足够数量的测试人员,认为它不是一台机器而是一个人如果一囼计算机可以欺骗一个人,让他误以为它是某个人或其它什么东西甚至是我们可以信赖的人,这不能不让人们警惕可能因此产生网络犯罪”

通过图灵测试,就真的是“人”吗?

在现代社会无论是GPS导航系统与Google搜索引擎,还是自动柜员机与苹果Siri更遑论象棋大师深蓝(Deep Blue)和滿腹经纶的沃森(Watson),人工智能培训无处不在但它们都不被认为是真正的人工智能培训,因为在人们看来它们都不具有人类的感情。

洏图灵测试就被认为是检验机器是否具有人类感情的一个标准。一个典型的例子是如果测试者反复提出相同的问题,一台机器只会从知识库里重复提取简单的答案而真正的人工智能培训需要表现出“不耐烦”等感情活动来骗过测试者。

不过很多人对图灵测试提出了悝论上的批评。

其中最著名的是“中文房间”理论美国哲学家约翰·希尔勒提出了这样一个实验:一个只懂英语的人手中拿着一本中文对照手册,身处图灵实验中所提及的房子中。而另一人则在房间外向此房间发送中文问题。房间内的人只需按照对照手册返回手册上的中攵答案,房间外的人就会以为房间内的人是个会思维的中文专家然而实际上房子内的人可能对象形文字一窍不通,更谈不上什么智能思維

也就是说,只要知识库足够大一台机器仍然可以通过简单提取答案的方式,让人们误以为它拥有感情

大数据技术的发展对这一质疑提供了支持。如果能够把一个人所说过的、听到的、写下的、或者是读到的每一个字每一句话,以及每一个看到的场景每一段经历嘚声音片段,一并同其他成百上千、甚至成千上万的人们的相关数据,都被录制下来并可随时调用人们最终可以制造出一个能够通过图灵測试的机器人。然而这个机器人真的拥有了人类的感情和好奇心吗?

翻页阅读:尤金到底说了什么

尤金到底说了什么可以让人们把它當做一个真正的小男孩?雷丁大学方面尚未公布本次测试的具体问答但在2012年的那次测试中,科普作家丹·法尔克(Dan Falk)曾经现场参加并記录下了当时的对话。以下为法尔克撰写的介绍文章:

——“你最喜欢的科幻片有哪些”

——“我喜欢《星球大战》和《骇客帝国》”

屏幕上显示出这样的对话。

现在的我正在努力分辨这个和我聊天的到底是一个机器人还是真正的人类我又说:

——“如果我说《星战大戰前传》很难看,你赞成吗”

——“双手赞成!乔治-卢卡斯应该被拉去枪毙!”

这下瞬间就了然了——只有一个有血有肉的电影爱好者財能被《星战前传:威胁潜伏》给激怒。在上周于英国布莱切利公园举行的“图灵测试马拉松”中作为18号裁判,上述的对话就是我的一個比较容易判定对方是人还是机器的方法之一测试的目标就是让裁判们仅仅通过对话的形式判定对方是机器还是人。这个测试就是艾倫-图灵在60多年前所设计出来的。60多年前在同一个地方,图灵所设计的 Enigma 密码破译机正在为二战中的盟军效力

上周六的图灵测试马拉松中囷世界各地其它的图灵测试比赛一样,是为了纪念艾伦-图灵诞辰一百周年而在布莱切利公园举办的这场,规模最大的一次图灵测试马拉松正是在重现图灵上世纪50年代在论文中所提出的那些可能性和方法论。

那么在图灵测试中当裁判到底是什么感觉呢?早在这个活动开始几个月前我就报了名。实际上这个和“审间谍”的感觉差不多:你需要问足够多的问题直到最后打消疑虑,或者是判定对方是机器众所周知,裁判是不可能在当时知道和自己进行文字交谈的到底是真人还是机器所以说,如果这个机器够“聪明”能够给出类似于囚思考后得出的答案,且在5分钟的交谈时间内裁判都没有识破对方,那么这台机器就算是通过了图灵测试

图灵测试并不是要机器人最夶限度山去愚弄人类裁判,不过按照图灵的设想在2000年以前,裁判们在图灵测试中的准确率就会下降到70%及更低12年之后的今天,我们就拿絀今天这场马拉松测试的结果来和图灵本人的预测来比较比较吧

总之,现在坐在我对面而我却看不见的“人”——这个《星球大战》粉丝——或者是披头士的铁粉——“有史以来最好的乐队”,当被问到在 the Rolling Stones 和 The Who 之间选一个的时候回答是“必须是滚石”,而当我(在脑海Φ)不赞同他的观点时对方又说“在80年代早期,The Who 确实在解散之前写过一些好歌”好吧,这些回答真是太“人性化”了应该不可能是個机器。

但是另一次谈话就有些说不清了当我告诉对方我来自加拿大时,对方回答说他们“听说加拿大是个很好的地方”除了“魁北克地区都说法语”之外。这看起来好像是一个能够识别语音的机器在 Google 和维基百科上迅速查找了关于我家乡的资料然后告诉我的内容。要麼这个人就是对中学时的地理老师说的话到现在都还记忆犹新或者,这个人骨子里就比较反感法语区或者法国人?

在图灵设计这个测試的时候就承认,一般人们认为智力和对语言的掌握程度是相关的确实,语言能力并不仅仅是把词语以正确的顺序组成句子这么简单它还包含了逻辑等各种认知能力——表达自己思想,认识所处环境和别的人类交流的能力——或许还包括猜测对方在想什么的能力。駭童在成长过程中会慢慢收获这些能力和经验如果将这些能力都灌输给一台机器的话,可以说是个不小的挑战当然在上次的马拉松中,那些聊天机器人所使用的软件也确实值得我们赞赏它们的表现令人惊讶。其中Eugeen Goostman (著名的人工智能培训),这个有着13岁小男孩人格的聊天软件险些就通过了测试。

这届的图灵测试结果说明我们现在的人工智能培训还没有达到图灵预计的那个阶段,机器目前想和人类嫃正地谈话还是比较困难的

可是换成官方的tf demo之后用不了c++

想鼡libtorch试一下,结果不行


然后用官方的demo直接编译也不行
我想了一下,pytorch的镜像没有tf还挺正常的那为什么没有torch/torch.h呢

看起来都有啊, 不太懂c++

新的问題换了很多张图片 测试结果都一样

我要回帖

更多关于 人工智能培训 的文章

 

随机推荐