开源科学与人工智能
发表于 2015-08-15 22:38:27 由 king

时间:

08月22日 周六 14:30-17:30

视频:1,2

 

地点: 北京 海淀区 百万庄图书城

借集智俱乐部新书《科学的极致——漫谈人工智能》上市之机,我们与悦读时光一同邀请三位集智俱乐部成员也是该书的作者分享他们自己的探索故事,并探讨人工智能的现状与未来。 

活动内容: 

1、讨论:人工智能的现状与未来 

近年来,随着深度学习技术的突破,人工智能再次成为万众瞩目的话题。有些人认为人工智能的发展最终会毁灭人类。有些人则认为人工智能的发展会使得人类得到永生。 

人工智能始终是集智俱乐部多年来探讨的热门主题之一。他们的观点是什么?你的观点是什么?请来与三位嘉宾共同探讨这一主题。 


2、集智俱乐部与开源科学 

集智俱乐部,英文名: Swarm Agents Club ,简称“ SA Club ”,成立于 2008 年 , 是一个从事学术研究、享受科学乐趣的探索者的团体 。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的 “ 没有围墙的研究所 ”。 

当今世界,科学家是高度专业化的职业。他们乐于在期刊上第一时间公布自己的发现,不完全是出于利他的冲动,而是为了在科学体制内获得持续的回馈。科学家们取得专业学位,获得资金支持,求职,晋升,无一不与他们对大众公开的科研发现的数量和重要程度直接相关。 

政府从公众那里获得税收以支持科研;科学家及时公布发现以造福社会,这个理想循环是现代科研体制的基本逻辑。比起十七世纪的贵族豢养的科学家体制,现代逻辑是个进步,它曾促进了人类知识的创造和交流。然而,随着互联网技术的发展,现有体制积弊渐深。职业压力导致科学家进行学术造假,利润驱使出版集团为了收取高昂的订阅费用,不愿意公开原本应该免费的知识。 

通过三位嘉宾的个人探索经历分享集智俱乐部的开源科学精神。 

3、现场签名售书 

有50本图书等着你来拿! 


主讲嘉宾: 
张江,北师大系统科学学院副教授,集智俱乐部创始人。 
袁行远:彩彻区明科技有限公司CEO,彩云天气创始人,集核成员之一。 
玉德俊:中国石油研究院工程师,集核成员之一。

 

 

2015822日,集智俱乐部与一起悦读俱乐部成功主办了一次在北京百万庄图书大厦的读书交流活动。这次活动主要以访谈和问答互动的形式进行,访谈嘉宾为人工智能专家庄亦可,主讲嘉宾为张江、玉德俊和袁行远。访谈话题广泛涉及人工智能、开源科学、机器学习等,问答互动环节也提出了很多极具启发性的问题。以下是这次交流活动的主要内容。

 

主办:集智俱乐部、一起悦读俱乐部

时间:2015822日下午 1430-17:00

地点:北京西城百万庄图书大厦B1多功能厅

主讲嘉宾:张江(张)、袁行远(袁)、玉德俊(玉)

主持嘉宾:庄力可(庄)

活动主持 :张霞

记录和整理:小木球、邹哲、张江

 

 

 

关于《科学的极致》

 

庄:非常荣幸与书的三位作者和在座各位探讨人工智能这个话题。“人工智能”这几个字我听着非常亲切,因为我在2000年前做博士课题时做过相关课题,当时也很流行,但一段时间后又不流行了,但现在又非常流行了。所以当一起悦读俱乐部推荐这本书(《科学的极致:漫谈人工智能》)给我时,我发现是我的专业,就欣然答应了。看过书后很惊讶,在座的有的是集智俱乐部的成员,有的是一起悦读俱乐部的文艺青年。人工智能方面的书很多,而这本书不一样。我用很快的速度就读完了,我的感受是,第一,这本书的可读性很强。由于人工智能涉及的范围非常广,有的领域很晦涩,难以理解,但这本书可读性很强,是科普方面非常好的一本书。所以我觉得要把这本书推荐给大家,如果大家对人工智能有兴趣的话,读完这本书一定会受益匪浅。第二点,关于人工智能领域,我刚刚已经和三位作者沟通过了,由于人工智能经历了很多发展阶段,要做一本科普书的话,应该会很厚,涉及的方面也很多。这本书展现了经典的部分,也展现了最新的部分。那么关于这本身最终的组成、作者的初衷和想法,先请集智俱乐部主创成员张江谈一下当时的想法和创意。

 

 

张:我是张江,现在北师大系统科学学院当老师。大家知道系统科学和人工智能分属两个不同的学科,我读硕士期间曾经做过一些人工智能,主要是机器学习方面的内容。对于人工智能,大家比较熟悉的是在工程技术上的应用,但我对其背后的科学原理性的知识更感兴趣,所以我选择了复杂系统这一学科。我们写这本书主要有以下考虑:在我们集智俱乐部做的活动中,从历史来看,关于人工智能的活动是比例是很高的,大家对人工智能有一个共同的兴趣,所以定了这样一个主题(人工智能)。但是写哪些呢?作为一本人工智能的科普书,需要介绍各种流派和其中的具体内容,但是我们发现头绪很复杂。因为各种流派、技术非常多,就会很无趣。所以我的想法是:寻找真正打动我的东西是什么?我发现,是最开始,甚至是“人工智能”这个名词创立之前,数学家们的梦想——想要创造一个像人一样思考的机器。所以我们把一大部分精力聚焦在人工智能创立之前科学家们是怎样摸索的。我们发现,很有意思的是,一开始是一小撮数学家在研究,可见人工智能诞生于非常基础的数学,因此有相当笔墨是在这一块,在前人工智能阶段。另一方面就是最近,正如刚才庄老师提到的,人工智能又火起来了,为什么呢?这是因为有一些新的技术,例如机器学习这块的突破。考虑到这一点,我们的一部分笔墨是放在后面。所以我们主要谈了人工智能发展脉络的前和后,而对于中间其实是主体的内容,我们这本书谈得并不多。因为这个没必要,大家随便找本教科书或者科普书都能看到,所以这是我们的一个特点。另一个特点是我们融入了很多个性化的东西。因为作者来自集智俱乐部,集智俱乐部谈人工智能(的角度)与高校肯定是不一样的,里面包括了一些故事,带入故事进来,趣味性会更强。后面两章还包括了集智成员结合人工智能做的一些应用,例如彩云天气、瓦克星计划,这些都是很个性化的东西。

 

 

什么是人工智能

 

庄:三位能否就人工智能的概念与大家简单沟通和分享一下?为什么我会提这样一个想法呢?因为本书加入了很多有趣的、个性的东西,揉入了个人的想法。比如我之前提到的可读性好,他们会把张三丰、张无忌学武功的故事揉到作品里去。但是(对人工智能)我们还是要有一个清晰的概念,不一定要有科学清晰的描述。我看了书之后,发现张江对图灵机的描述很有意思,能否请张江讲一下什么是人工智能?

 

 

张:人工智能的描述性定义其实并不复杂。用一个人工的系统,通常而言是计算机,来模拟实现人脑的思维,这样一种技术就可以称为“人工智能”。但是这个从科学角度讲是很虚的,因为每一点都不好刻画,比如什么叫作模拟人脑的思维?从目前来看,一个最科学的划分是20世纪50年代,计算机理论的创始人图灵所提出来的图灵检验,这是一个简单的思想实验。如果我要判断一台机器,比如我就是那台机器,看我是否具有人工智能。那么人们会选择一个人作为比较,比如就是我身边的袁行远。将我们俩分别关在两个小黑屋里,通过网线与测试者连接,测试者无法看到被测者的相貌特征,只能通过分别提问,我们给予一定的回答。一段时间内,如果无法区分两个屋子里哪一个是人,哪一个不是人,就说明这个机器具有了人工智能。这是我目前知道的最靠谱的判断标准。

 

 

庄:判断机器是否具有智能,最经典的就是图灵测试。我们在黑箱里进行测试时,可通过语言、输入方式,根据其是否能回答问题,判断是否是机器或者是人。我们书中也举了很多例子,20世纪50年代到60年代机器人通过算法下跳棋,可以达到洲际冠军的水平,IBM给“深蓝”做测试,在国际象棋上战胜了卡斯帕罗夫,说明机器有一定智能性。还有一个例子,美国有一个智力游戏,类似于现在的“一战到底”这类综艺节目,不仅要有广阔的知识面,还要有逻辑推理能力,而且不是直接回答问题,在这个节目中,机器也战胜了人类。我们现在的机器,在很多方面,包括语音、图像和感情理解上都达到了相当高的水平。所以人工智能涉及的领域很宽泛,这本书开启了我们了解人工智能之门,所以我建议大家有兴趣的话可以读完这本书。

 

在座还有其他两位作者,其中袁行远做了一个彩云天气APP,在书的最后一章里有介绍。通过深度学习,产生了这个APP,我们是否可以请袁行远就人工智能最新的领域——深度学习这方面与大家交流一下。

 

 

袁:我先接着刚才的话题阐述一下我的想法,说一下关于智能的个人观点。智能,我觉得是一个连续的谱,比如从蚂蚁到猴子,在进化中越来越聪明。如何度量这个聪明呢?图灵测试认为机器和人一样。但有些东西是一个连续的谱,人类之后可能有更多的智能。智能是一种信息的处理能力。我们生物在自然界活动时可以预测将来发生的事情,如果实际与预测一致的话则收获安全感,不一致则对世界的认知有偏差。对世界的认知可以作为另外一个衡量智能能力的维度。例如刚才提到的下棋这件事,你可以预测每一步,并且计算是否容易胜利,通过很多步骤的训练。例如IBM做“深蓝”时,把所有国际冠军棋谱都学习过,存在数据库当中,通过这样的方式来预测每一步之后的情况。现在随着计算机技术的发展,可能我们考虑更多测试的东西。下棋是一个较固定的任务,如果让机器看报纸,识别人脸或声音,人可以轻松做到,比如判断一张图片里有没有猫和狗,而这些是计算机原来非常难以完成的任务。现在通过更多的数据,通过深度学习,使机器对世界有了更深的理解。人类婴儿很容易分辨猫和狗,目前深度学习最大的突破就是在图像识别对各种信息分类鉴别时具有了很强的能力。现在很多识别的事情计算机也能实现,那它是怎么实现的呢?例如之前的“深蓝”,有许多规则是人工把这些决策写入到程序,是很多专家把经验总结为规则。现在通常不这样做了,我们的训练用数据来说话。有一个笑话是微软亚洲研究院说的:每当我们开除掉一个语言学家时,我们的语音识别率就能提高一个百分点。因为我们需要让机器从数据中总结规律,这是一个发展的趋势。之前机器识别图像的错误率在20%~30%2013年论文中发现错误降到13%2014年降到了5%,而人类的错误率大约是4%。这与图灵测试相比是另一个维度,能够更稳定地预测环境。

 

下面,话题终于可以转到我们的彩云天气预报软件上面来了……

 

 

彩云天气与机器学习

 

庄:我先稍微打断一下,袁总讲的内容很多,都是人工智能领域最新的话题,说了机器学习和深度学习。我通俗地讲一下,人获得知识是通过别人教我们、按照规则学到的。人工智能本质上是信息的获取,信息的加工和表达。万变不离其宗,都是这三个阶段。袁总刚才讲到,原来通过规则获取知识,现在用计算机网络和云计算,不需要老师,通过数据自己学习。比如猫的例子,给一千万张图片,让机器自己总结,让机器自动分类猫和狗,那么机器就具有一定智能了。以前告诉它猫的叫声、外貌、能抓老鼠等特点,现在只给图片,规则让机器自己获取。为什么可以预测呢?这个功能是怎么来的?现在不通过定义,而通过不同算法直接聚类,知识获取的方式不一样了。“深蓝”是通过教的,把棋谱输给了计算机,然后找了4个国际象棋大师来训练,“深蓝”的计算能力很强,一秒算两亿步,可以穷尽所有可能。但下围棋就不一定能赢了。人工智能在不同阶段获取知识的方式不一样。如何用海量的数据对天气进行预测呢?下面我们回到袁总的话题上来。

 

 

袁:庄老师讲得很好。2012年集智俱乐部办过一个统计学习读书会,讲到了非监督学习(unsupervised learning),不用做各种标识。但是怎么样获得的东西比较好呢。两个标准。一方面是在生活中出现的很多,最有意义的是出现最多的。例如猫的图片,YouTube上有30%是猫,因为美国人很喜欢拍猫发到网上。另一方面是尝试对事情进行简单描述,能够把复杂的事物抽象化。如果我们能描述很多的东西,并且抽象出来的东西很简单,根据这两条标准就能自动学习到很多。天气预报原理呢?以前的是根据气压值等,列出气体状态方程,通过初始条件,解微分方程来计算获得风向,是目前主流方案。我们用了另一种方案,我们采用精度非常高的数据,通过采集高密度的点的信息,累计了两千万张左右气象雷达图。我们可以把气象雷达图分为两种,一种是经过移动会下雨,另一种则相反,可以把所有的云分成两类。同时可以有不同时间段,1小时后会下雨,2小时后会下雨的,把云分成多类。这个特别好的是不依赖人工的经验。以前天气预报人员需要培训,需要看多普勒雷达数据写报告,但这个预测不能够针对每一个点,比如百万庄是否会下雨?机器可以不知疲惫地计算,人就要不断地值班帮你看。所以我们的程序不是一个强人工智能,但能够帮到大家。通过一些大学生聚在一个小咖啡厅里,聊天、捣鼓出来的东西能让上亿的用户看见。中国气象局50多年来也没有向私人机构买过气象数据,但是它却会因为集智俱乐部孵化出来的一个小的人工智能的项目把钱给我们,让我们的预报结果出现在气象局官方的APP里,出现在高德等各大媒体里,想想也是件很神奇的事情。

 

 

庄:我们有很多外出旅行的经历,经常淋成落汤鸡。很多时候我们要知道这个地方,比如在一个公园或景区,短时间内会不会下雨,我们要不要带伞?现在获得这些雷达资料后,可以很快告知一小时内有没有雨,这个很实用和神奇,涉及到大家日常出行。举这个例子是为了说明人工智能的很多应用与我们的生活息息相关。比如我之前说的人脸、生物、指纹、虹膜、行为等识别,都属于人工智能范畴所涵盖的内容。还有机器学习、图灵测试在书中都有很多的篇幅。非常难得的是张江能把集智的一群人集中到一起,编出这本书来。我也很惊奇什么样的机制和体制能让集智俱乐部长期存在,且凝聚力是怎么来的?怎么在这么长时间里能组织开展这么多活动?我想听听你们的看法。

 

集智俱乐部与开源科学

 

 

张:说来话长,大约要追溯到2003年。集智俱乐部是我还在读博士的时候,与师兄、师弟、师妹做的一个分享复杂性科学包括人工智能的一个网站,直到2008年都没有线下的活动。2008年我处于人生的间歇年(Gap year),在间歇年你会做一些不靠谱但自己非常感兴趣的事。当时在北京的线下活动非常火,豆瓣也是当时火起来的,大家看电影、听音乐、交友的活动非常多,我们科学青年是否可以整一个俱乐部呢?我们也可以很文艺呢。所以当时找了很多科幻电影,搞了一个“蓝色七月电影节”,参加的人也很多。但时间长了,发现还是讨论我们关心的问题——科学——更有意思。因此就开始务正业,开始讨论各自的专业知识。当时聚会经常只有3-5个人。当时在一个中关村办公室,是一间中科院微生物研究所的即将废弃的办公室里组织活动。没有投影,我就自己花1万元买了一个,让大家分别讲。开始非常小众,之后人越来越多,办公室越来越挤。当时在文艺圈的朋友介绍了一个地方,叫做叁号会所。它们正需要聚集人气。这个地方很酷,在一个国营兵工厂里。后来这里就成为了我们的固定地点,之后活动更加规范化(regular),每两个星期一次,聚集的人也越来越多,俱乐部也发展起来,并形成了集核的制度。之后一直演进,一直到2014年每周组织活动,像做家庭作业一样。2014年是一个重要的爆发点,主要有这样几件事情:一是集智有一些成果出来,我们的团队成员有一定的合作,在国际顶级刊物SCI上发了很多文章,有了一些科研的产出;另一个事件是袁行远这边把彩云天气做了出来,并且成立了一个公司,出现了有社会影响力(impact)的事情。2015年也有几个标志性的事件,一是我们以集智俱乐部的名义,在图灵公司的帮助下,出版了第一本书;另一个是终于开了一次年会,7月份在南京刚刚开完。我们当时正式邀请了20人左右,到场近100人,超乎我们想象。

 

总结一下,能取得一定的成绩和小小的名气,主要是因为我们开放的姿态。我们的所有成果和讨论全都是没有任何保留的,不考虑知识产权,全部发布到网上,这样吸引更多人关注,也吸引很多人进来。科学更需要人的头脑的碰撞,才会产生创意性的东西。这使我们可以绕开传统的高校科研,我们的成员来自各个高校和研究院所,以开源的精神发展,才会有今天这样小小的成绩。

 

 

庄:玉先生是否补充一下作为集核的主创成员之一的体会?

 

 

玉:讲到智能,我给大家分享一下我这几年看到和关注的一些智能的进展。大家是否看过电影《AI》和《我,机器人》,以及阿西莫夫的机器人三定律?关于智能,(其他几位嘉宾)刚才做了很多定义和阐述,我看到对于智能没有精确的定义,一种是像人一样思考,还有一种是在一定环境下能否做出理性决策。人的决策很多要依赖情感,这与理性违背。我们现在对于判断可以做得很好,对于刚才说到的大规模图像识别,现在机器人可以画出很漂亮的画,潜意识中有大量猫和狗,画出来的星空里有很多猫和狗的痕迹。现在日本对于机器人做了很多研究,例如型号为阿西莫夫的机器人,去年日本一个公司开始卖家用机器人,人民币一万元左右,可以做家庭看护和聊天,外形仿真人。日本软银集团投资的(Pepper),软银和阿里关系比较好,发布会上马云也在。

 

刚才说到集智,我在书里写了一个我长久以来感兴趣的东西:怎么造一台计算机。我本科是学石油管道的,后来硕士做的是自然语言处理。但我对智能一直很感兴趣,具体有一些想法并作尝试。我想做的是,想用最简单的,不一定要用金属,也可以用木头做,比如用积木做计算机。我大约是2009年加入集智的,参与了很多活动。集智的开源,大家的历次活动PPT都能看到,我的这个计算机就想做一个开源的东西。大学计算机专业毕业后都不知道课程干什么用,其实我告诉你,整个课程就是告诉你怎么造一台计算机。你花半年到一年的时间,我们就可以造一个机器比如学习机出来。这是我下一步想做的,大家可以一起玩的东西。

 

 

 

 

庄:下面我们进入问答互动环节,在座的各位有没有什么问题想跟我们三位作者沟通一下?

 

人工智能的未来

 

 

问1:未来人工智能会给我们人类带来福利还是灾难?

 

袁:我们坐在这里,靠这个吃饭,显然希望它带来福利(笑)。这个问题之前很火,知乎上有一篇文章,说超级智能特别特别猛,呈指数上升,人类要么灭绝要么永生,一个非常宏大的论调。我比较欣赏的观点有两点,一个是关于刚才那个非常宏大的论调,不一定是真的,因为之前人工智能经历过好几次这样的跌宕起伏。在20世纪60年代的时候,我们认为马上就要成功了,然后却沉寂了,目前我们也可能是这样。这个问题其实很难,因为人大脑里有很多细胞,它们之间的连接又是阶乘级别,所以这个事情的难度不一定是人类能够handle的,我们不一定真的能够搞定强人工智能这件事情,这是第一点。第二点,假设我们能够搞定这个事情的话,我们作为从业者来看,类似于我们培养一个小孩,他可能比我们更强,但他做善还是作恶,取决于父母的教育,我们希望做出一个善良的东西,而且概率也是比较高的,因为大部分人都往这个方向努力。所以我还是保持一个比较乐观的态度。

 

 

玉:这类似一个信仰问题。行远持一个乐观的态度。在我看来,强人工智能是我们技术发展到一定阶段的必然产物,无论你认为是好或坏,会到来的就会到来。根据物种演化的理论,可能我们这个物种就被抹杀了,但我觉得该来的就会来。

 

 

袁:即使我们做出人工智能,它还是人类,将来称霸宇宙时,还是会打着人类的旗号。

 

人工智能发展与复杂性问题

 

 

问2:我感觉刚刚讲得内容太浅。是否可以讲些更前沿的进展,现在人工智能最新能达到什么程度。另外,在复杂性方面,我看到你们很多文章都讲过这个,希望能看到更新鲜的话题。

 

 

袁:我们深入的话题一般会在读书会讨论,因为我们会提前通知大家去读某个论文。如果星期六下午我们去,就会直接讲公式,看那个demo是什么样子的。欢迎关注我们的微信公众号,可以得到更强的东西。我可以讲一下我们最近的一次读书会,是关于人工智能的一些进展。我觉得比较有意思的,一个是现在比较火的从deep learning往下延伸的叫时序循环的神经网络(recurrentneuralnetwork),其作用是来处理和语义相关的东西。一个旧的新闻就是,放一张图像,它可以用语言来描述它,比如大象走过草坪,给它一张图像,计算机可以把图像翻译成语言。它是怎么做的?把图片先变成一个向量,向量通过一个简单的卷积神经网络,先将unsupervisedlearning变到一个向量空间上,这边再training一个语言机,一个叫Long-Short TermMemory的一个模型,叫LSTM,那个神经网络的输入是一个语义模型,就是它把之前维基百科上的英语全部都做一遍,然后它把刚才的一个映射到图像空间上的一个向量给映射到语义空间上,通过输出保持语序。可以看到,这是一个比较好的进展,可以把一张图翻译成文字,运用的也是深度神经网络的东西。另一个是Deep Mind的成果 ,通过CNN来下围棋。如果把围棋当成整体图像来识别,识别围棋的Pattern,谷歌的一个工作声称可以做到业余6段,但还有很长距离要走。另一个Nature文章,是做弹珠球游戏,开始是随机地打,设置得分最高为目标,输入仅仅是电视屏幕,而非规则,输出即是动作。这个程序能把红白机200多个游戏打通关。这几个进展合在一起就可以实现真正的同声传译,Skype已经在运行西班牙到英语的在线翻译。我试过中文translatorpreview版本,识别度只能达到40%,而且它很不实用,需要联网,说一句后要等很久对方才能听到。但通过我们现在的技术,应该很快就能形成真正的同传。这是我对现在前沿发展的了解。

 

 

问:红白机不是遗传算法吗?

 

 

袁:不是,它用的是CNN,是做的叫分类器的东西,与遗传算法不同。遗传算法是随机的,而我看到的论文是做了从图像到得分的直接公式,可以求导,可以做梯度下降的求解,速度比遗传算法要快很多。我们也提到遗传算法的应用,但是一个encode之后的遗传算法,不是把所有神经元进行随机,而是先压缩,再换算到一个空间上面去,它声称用基因编码去做,这个算法是可行的。如果对神经网络的Matrix来做可能实现不了。但是实际应用中梯度下降是最快的。

 

 

张:我来补充一下提问中关于复杂性的这个部分,我们的书第1章就提到人工智能的发展历史。大致来看可以分为两大段,第一段是自上而下的人工智能,填鸭式的教学方式,把所有知识输入给它。20世纪80年代末期,由于知识获取的瓶颈而进入低谷。到了90年代,自下而上地学习兴起,这正与复杂性圣塔菲学派兴起同时,通过简单规则实现涌现和智能。如果从复杂性的视角来看,为什么神经网络从80年代提出来,到2000年以后又有一次瓶颈,现在深度学习又兴起了呢?我认为,这是一个二级结构涌现的问题。人工系统的学习,首先要搭一个架子,之前第一代神经网络就是在这个架子下运行很好,但局限是框架环境没有变。现在深度学习放入了一个新的框架,故是一个二级结构的涌现。因此,第一代神经网络到第二代神经网络就好比从小学到大学,学习器的环境发生了质变。我觉得人工智能背后如果说有理论基础的话,那么它就应该是复杂系统。

 

机器翻译的现状与发展

 

 

问3:我之前涉及过人工智能的研究。我想问一个关于机器翻译的问题。对于同声传译,制约顺畅交流的问题在哪?是因为计算能力,还是模型?现在最前沿的水平到达什么地步了?大小语种的差别达到什么程度?大概需要多少年可以应用到普通人,我们自己可以拿着手机就和外国人交流,而不需要去学?

 

 

袁:从我自己的想法来谈这三个问题。第一个,制约的瓶颈。是这样几个步骤,首先是语音识别,然后是翻译,再然后是发声。语音识别和TTS发声两项已经OK了,现在的瓶颈就是翻译。现在国际上有一个评分的标准集,比如一句话包含30个词,有多少命中。大家主要在刷这个测试集,刷到什么水平呢?确实存在大小语种的问题,如英法翻译,可以到达一个高中生语言水平,即基本可以理解,但有些小的错误。如果是英中翻译,则可以想象成一个词汇量超大但是小学生语法水平的人。那么进展的瓶颈怎么解决呢?我以为还是需要高质量的训练数据来实现,即data-driven的形式。从哪获取中英对齐的数据呢?例如字幕组的翻译,还有维基百科等。但最重要的应该是要形成正向反馈的过程,翻译的同时进行修正,要形成越用越好用的情况,现在还不是这样。我乐观地估计,要达到同声翻译的水平,还要10年左右。

 

 

庄:其他嘉宾有补充的吗?那我自己补充一下。语义理解,到目前为止没有解决得特别好,翻译和理解都是,因为语言所涵盖的范围太大了。例如古文到白话文的翻译,学贯中西才能翻译得好,让计算机达到这样学贯中西的水平,需要一个渐进的过程,我认为10年还不够。我用过很多软件,例如863的项目,甚至于要推广的项目。但专家一测都通不过。因为语义有很多转义,如果不是一种穷尽集,则真正要达到人的同声传译的能力和素养,特别是小语种,正常人都很难达到,怎么让机器具有这个功能?学习样本在哪里?如何更正?我认为时间要更漫长。尤其是小语种,因为这是必须要有一定积累才可能完成的过程。

 

 

袁:我再说一个刚才想起来的一个进展,就是一个深度学习的语义理解。它的效果是,刘翔和跨栏存在某种关系,那么,刘谦和____?让计算机去填空,对应之前的那种关系。计算机就可以填出:魔术。还有医生和病人,那么老师和____?计算机可以填出:学生。这种已经可以实现。机器通过扫描很多话语,从语义集中获得。令人欣喜的是,把向量投射到平面上,用英语投射,可以发现在空间上有相似分布。LSTM在翻译上有很大的潜力,可以靠统计来实现。所以,深度学习还是有很大的余地。LSTM翻译似乎还没有人搞中文和英语的翻译,也没有相应的开源软件。如果有兴趣来做,还是有很大前景和潜力的。

 

 

人工智能工作的方式?是否会替代人类?

 

 

问4:第一个问题是,人工智能是通过先进的统计方法做到的,需要很多数据来支持,即已有的经验。那么很多东西是未知的,例如天气,有很多的不确定性。以后的人工智能可否不依赖于数据来实现,尤其是偶然的小概率的事件是否可以预测?第二个问题是,人工智能发展对人和社会带来很多方便,会不会让人越来越懒它,比如天气预报员是否有一天会下岗?人也不需要学习和思考,会不会限制大众的学习思考动力?

 

 

袁:先回答预报员的问题,现在气象学院的人不仅仅是培养看雷达图的能力了,更多是要培养计算机人员了,今后会创造更多的职位,就是操作机器的人。例如火车司机不断现代化,变成开飞机的那种操作了。

 

 

玉:第一个问题是问人工智能是否不需要依赖数据来预测吗?(提问者:机器是否必须依赖于模型?它只是依赖已有的东西重复来做。将来能否像人一样,对未知的事情做预测?)开始以为是说学习,学习并不是将来的事都装进我们的数据里面,而是从现有的数据中寻找Pattern(模式)。预测的是将来的事,这是关于统计这块。你是否想问:能否不依赖于以前的知识,推导出新的知识?历史上做的定理的证明和公理的推演,只能在严格定义的形式体系下做。但现在主流的还是基于数据的学习。第二个问题,历史上有过一个职业叫做打字员,但现在已消失。有很多岗位消失,也有很多岗位会被创造。

 

 

张:以前机器取代体力劳动,我们现在觉得很自然,因为创造了很多跟信息处理有关的岗位。现在人工智能开始帮助我们缓解信息过载,我们觉得是他们抢了我们的饭碗,但事实上人类可以把时间投射到更有意义的事情上面。我认为,在遥远的未来,很有可能人类只需要做一件事,那就是睁眼看就够了,也许观察才是最有意义的事情。

 

 

彩云天气项目中的深度学习

 

问5:关于彩云天气项目,可否分享一下用深度学习做和之前偏微分方程的方法的区别是什么?其亮点在哪里?比如长期预测?

 

 

袁:传统的方式,比如美国的WRF,判断一天是否下雨的准确度在60%左右。但精细化地处理需要达到的效果是,80%的准确度且对每一平方的地区每一分钟是否下雨。传统的预测缺陷在于人去构建模型,极大地依赖于人的经验,里面很多参数要猜出来。机器学习最牛的地方是不用关心机理,只要提出结果。以前学习总是要老师教你,而且写答案时需要每一步的证明都写出来,现在突然出现一种魔法,只要把天气的信息给你,结果能告诉我们一会这儿下不下雨。只需要拿历史数据作为训练集,神经网络相当于程序写程序。特别神奇的是,这种矩阵计算的结果竟然比人想出来的还好。这是令人震惊的事情。我看过这么多天气雷达的数据,我自己的预报还不如计算机预报的准。

 

 

庄:我补充一下通过神经网络预测这个问题。很多人炒股票,是根据历史数据。我们是不是可以用深度学习来对股票预测一小时或者半小时?如果真的能准确的话,那都能成为亿万富豪。其实深度学习是有应用领域的。因为气象预报中,是有主因素的,用这个来判断已经足够了。但不能说用深度学习能解决所有的问题,因为它在特定领域是有一定限制的。我读博时,同寝室的同学尝试用数据挖掘做股票5分钟后的图形,所有高级算法都试过一遍,但还是失败了。

 

 

袁:计算机来预测股票,比如量化交易,还是有先例的。这个比较难,不过也说不定会有成功的人。

 

 

玉:我在企业上班,从另外一个角度来谈一谈,就是成本。比如石油管道,一年要输送一两百亿方,每隔一定距离有一个压缩机构,一个泵,每天消耗的能量就有好几万或者几十万。我现在要预测能耗。我们有物理模型可以解,但是实际上设备都有工况图,会随着运行时间和不同情况会偏移。我们需要到现场关掉一组一组检测才能修正,时间和成本极高。现在神经网络可以达到90%的准确度,成本得到很大的节约。

 

 

票房预测、聚类如何实现?

 

问6:我做票房研究,美国是用人工智能结合舆情研究。我看到的资料可能比较老。美国的一些机构利用提供舆情的网站,比如Twitter。把网名对一部电影的看法分为很简单的几类,例如好中差三分,但准确度并不高。随着舆情研究的发展,可否利用网民的数据,例如微博、微信,可以提取到更多更有用的知识来进行更准确的预测。结合更高级的人工智能,是否能达到更好的效果?第二个问题是:之前说到识别猫的图片,通过聚类来实现。具体的实现是怎么做到的,能给业外人士科普一下吗?

 

 

张:我来回答第一个问题,利用社交媒体数据来预测流行度,现在有一个大的新兴学科可以作为参考:计算社会科学(Computationalsocial science),有很多技术,不仅仅是人工智能、机器学习这些。目前的进展是有一个很有意思的文章,通过Facebook点赞的数据,来推测你的性格,比你老婆更了解你。这里没有用到很复杂的深度学习,简单线性回归即可做到,主要是利用的大数据。之前预测效果不好,可能是因为数据源比较单一,现在是大数据,因为你会把你的习惯不知不觉地透露给社交媒体,如果把这些数据收集过来,可能做到比你自己还了解自己。

 

 

袁:猫的实验,根据YouTube的数据,可以看作一个聚类的问题。如果把神经网络的顶层看成类别时,什么可以引起顶上的Cell激活呢?就是猫的图像。就像克里克提过的NCC的概念,祖母细胞(Grandmothercell),当你看到她的照片时细胞就会激活。计算机里有各种事物,某个组被激活则代表这个事物。对应到谷歌的研究来看,看过大量视频后,自动就把很多概念放到一起,大量视频中能够抽象提取的东西就是猫。

 

通用计算模式

 

问7:图灵提出的通用计算模式,系统科学在研究许多复杂的系统,可以像图灵一样提出一个通用的计算模型吗?人工智能三个学派,是否会有一天归为一起,提出一个像图灵机一样的非常基本的机器?很多特别复杂的系统,例如人的决策,就像下棋,把人生的各个决策像下棋有很多权衡和看很多步,系统科学是否方便人类做更多决策?

 

 

张江:我推荐你看看这本书的第5章,从算法复杂性到通用人工智能。马库斯·胡特(Marcus Hutter)是一个不为人知的人,这篇文章的作者李熙是北大哲学系的博士,他跟我谈起了Hutter的研究,我才了解到,原来Hutter提出了一套通用人工智能的理论。这么多人工智能研究,很少沿着图灵往前走,但马库斯·胡特的理论做到了。如果用一句话概括,那么Hutter就是用一个数学公式定义了什么叫作智能。原来图灵的体系其实是把推理讲得比较透,主要是演绎,但归纳问题却没有任何讨论。所以神经网路开发很多方法来做,20世纪50-60年代,所罗门诺夫(Solomonoff)提出了通用归纳的概念,结合克尔莫格罗夫(Komologrov)复杂度,将图灵的工作往前推进了一大步。之后,胡特可以在此基础上提出了通用的人工智能。你有兴趣可以深挖一下。关于复杂系统的统一的理论框架,我一直在追寻这一套理论,但现在差得还很远。复杂系统目标都还不太清楚,现在提这个问题还太渺茫。

 

 

人工智能与硬件

8:人工智能让机器像人一样。今天提到的都是算法方面,用程序跑,结果和人类思考的结论一样。硬件层面从芯片角度来说,功耗越来越高。人脑功耗不那么多,那么人工智能在硬件上是否也需要有突破,从硬件角度怎么看人工智能的发展趋势?

 

 

玉:我说一下业界对芯片的处理和我自己的想法。业界主要做的是不断加快速度,我们有摩尔定律,2000年之后,用硅来做芯片,现在也有人做蛋白质和量子的计算机。这些都受限于物理规律,已达到一定极限。从研究和大应用角度来说,做大规模的并行计算。但这样做能解决的问题,大规模并联和人相比,还说不清大脑里千万个神经元直接的pattern,需要将问题也能拆分,才能通过并行来算,但是我们人脑思考会有一个先后关系或者逻辑关系的,这个是不好处理的。关于芯片的处理,我做过一个小尝试,不一定所有的芯片都要用硅,我想是否可以像生物一样演进,自己造自己,但可以改变自己的硬件和软件,不断自我演进,可能会做得更好。

 

 

技术奇点

 

92010年之后有本书《奇点将临》出版,讲2045年到来,您信吗?人工智能和人类是否有不可逾越的差距?

 

 

张江:奇点我相信,但我不相信人工智能会战胜人类。放宽时限也不相信。奇点(Singularity)在数学上借鉴奇异性,因此应该念“奇怪”的“奇”,而非“奇数”的“奇”,在这里纠正一下。《奇点》一书的作者定义奇点为:当计算机的算力超过人类的时候,这里面有很多不确定性的因素,例如计算能力的具体定义是否合理,这些尚存在争议。我读到过一些文献,有些人拿技术发展的数据,芯片和整个人类的发展,拟合出指数增长现象。而有人发现,在某个时间点,增长率本身也会指数增长,那么这个点也许就是奇点。如果这个计算是正确的,那么奇点是可能存在的,预测时间取决于计算方法等细节信息。这个点是客观的,但奇点来临会发生什么?数据里没有答案,这就很主观了。我认为奇点来临时,可能不是人工智能超越人类,而是人与机器的融合,这是我的信仰。现在有一个前沿领域:脑机接口,已经实现了脑机互联。以后可能无法说清人和机器的区别,也许机器和人已经融为一体,很难说谁超越谁。另外,人工智能是一种技术,所以看人工智能就需要把它嵌入到整个科学技术这个更大的框架背景之下。凯文·凯利写过两本关于技术的书,认为技术有自己的生命,技术作为一个系统和人的关系,就像人和自然的关系一样。人要适应自然,自然会对人做出一个像上帝一样的自然选择。那么机器,或者说技术,也要适应人类,人类相当于机器的上帝,会对技术做出人的选择。综合来看,简单说人工智能不会超过人类,至少我个人相信单纯的超越是没有意义的。

 

彩云天气与雾霾预测

 

10:请问彩云天气,大家更关心空气质量,对于空气质量的预测,目前研究根据遥感影像和卫星做反演,通过深度学习可否做短时间预测?

 

 

袁:美国大气海洋管理局做这个数据预报,有两个计算,一个是天气,一个是化学污染物。通过这两个合成,也是解方程的方式,把它们带进去求解。南京大学也做过城市区域污染的量化,有过很多的尝试。不同的是,是否可以通过机器学习来完成?我们已经在给高德地图提供天气数据,是实况的。如何实现预测未来呢?我们假设风力、GDP、卫星灯光、森林覆盖率等因素与它相关,结合天气情况,像温度、湿度、风速、风力,靶向PM2.5的变化度。目前已经在运行,线下测试,比如预测明天的PM2.5,误差点在5%10%。而用基线的方法误差会到20%30%。用深度学习的一些方案,可以得到显著提高,我们已经验证了。可能今年9月我们会在App集成这个功能。

 

 

问:墨迹可以提供3天的,他们是怎么做到的?

 

 

袁:墨迹是靠人判断的,空气质量预报员。

 

智能与自指

 

11:能否说一下智能跟自指的关系?

 

 

张江:一看这位就是集智的铁杆粉丝。我们这本书的第4章,叫《一条永恒的金带》,打开后你会觉得内容奇奇怪怪。实际早在图灵、哥德尔、希尔伯特时代,科学家们就在讨论一个形式系统是否是完备且一致的。通俗来讲,就是讨论一个形式系统是不是完美的。哥德尔给出了一个证明,说这是不可能存在的,数学体系和机械化体系一定存在缺陷。这个证明里面的关键环节就是利用了自指的技术。所谓自指就是类似于说谎者悖论。更有趣的是,自指不仅被数学家用于证明不可能性,后来还发现和生命的自复制问题有关。现在人们已经破译了生命自复制的整个过程,其逻辑的最小内核与自指语句有一个相通性。我个人的看法,从人的角度来说,智能是大脑的一部分功能,最主要的人与动物的区别就是有自我意识,这是一件特别明显的事儿。你早上起来知道自己是在现实里而不是在梦里,这是因为你知道你自己知道你自己知道你自己知道……这像一个圈,这也是一种自指的特性。那么我们发现人的自我意识是可以通过自指程序来复现的。因此意识的最小内核就是一个自指。关于人对外界的反应,我个人的看法是,自指仅是一个起点,一个内核,就像一个种子,放到适宜的环境生长,可能会出现智能。这是一个可能性,不过现在没什么人沿着这条思路去探讨,我们集智俱乐部有一些小众的讨论。

 

 

问:那生长出来的还是人工智能吗?

 

 

张:很有可能生长出来的是智能,但不像人。我们在做人工智能的时候会有一个评判标准是让机器像人,但其实这属于人类沙文主义,你就把人当成具有智能的东西,但很有可能桌子它有它自己的智能,这个东西就不好界定了。

 

 

 

总结陈词

庄:提问结束,最后请每位做一个总结发言。

 

 

袁:很高兴认识大家,你们非常有活力,北京有很多科学青年,而南京文艺青年多。

 

 

张:如果大家真的对人工智能感兴趣,首先还是要先去读一些人工智能的正统教科书;如果希望对人工智能有一定了解,并且希望看到一些不一样的观点和视角,那么推荐大家看我们这样一本个性化的书;如果对开源科学和我们集智俱乐部的话题感兴趣,欢迎参加我们的活动。

 

 

玉:无论人工智能还是其他,如果感兴趣,你都可以尝试一下,只要你试着去了解它,会发现并不一定像想象中那么难。欢迎大家尝试。

 

 

 


嘉宾简介

 

庄力可,先锋软件集团副总裁,先锋博士后科研工作站站长,北京研究院院长。国家十五科技攻关项目专家组成员、国家LINUX标准工作组成员、中国人工智能学会理事、IEEE会员。

 

张江,集智俱乐部主要发起人和核心成员,2014~2015年度集智轮值主席。现在北京师范大学系统科学学院任教,副教授。主要从事有关计算机模拟和人工智能的教学工作以及复杂系统的相关研究工作。研究兴趣包括异速生长律、开放流网络、注意力流与互联网等。

 

玉德俊,集智俱乐部核心成员。现在中国石油规划总院担任工程师,主要从事企业信息化咨询研究工作,关注信息技术如何提升企业竞争力。个人研究兴趣主要包括计算机系统构造、计算理论等。

 

袁行远,集智俱乐部核心成员,彩云天气项目发起人,北京彩彻区明科技有限公司CEO2009年山东科技大学数学系毕业。2009~2010年任普加网搜索与数据挖掘技术经理,2010-2013年在淘宝网担任数据挖掘与并行计算方向高级算法工程师。北京LEAD阳光志愿者俱乐部副主席。

 

 

2012-2022 www.swarma.org, all rights reserved