2015年集智年会——南京
2015-07-17 22:07:43  年会 南京 
 
时间:  07月25日 ~ 07月26日 每天09:00-18:00
地点: 南京 鼓楼区 南京大学鼓楼校区-费彝民楼 江苏省南京市鼓楼区北京西路7号
 

集智俱乐部(Swarm Agents Club),成立于2008年,是一个从事学术研究、享受科学乐趣的探索者的团体。集智核心成员与科学委员成员除彼此间保持日常的密切交流外,每年举办年会,交流各自在科学探索中的心得及相关领域的前沿进展。2015年年会在南京大学举行,主题是:“注意力的科学”。 

所有PPT的下载:http://vdisk.weibo.com/s/3nFsznjLKb/1439175220


日程安排 开幕式

 
9:00-9:30
开幕
主持:王成军
9:00-9:10
开幕致辞
杜骏飞
9:00-9:20
欢迎致辞
巢乃鹏
9:20-9:30
会议致辞
张江
 
 
日程安排 议程 I: 深度学习与大数据(主持:吴令飞)
 
9:30-9:50
穹顶之下的人工智能—基于机器学习的雾霾预报
袁行远
9:50-10:10
基于用户反馈的大规模众包天气探测
张健源
10:10-10:30
基于深度神经网络的精细化短时降⾬雨预报
肖达
10:30-10:50
深度学习:卷积神经网络实战
曹旭东
11:00-11:30
茶歇
11:30-11:50
人类星际移民:未来设想(新墨西哥州9:30pm,July 24th)
马磊
11:50-12:10
基于递归定理的自复制机实现初探
玉德俊
12:10-12:30
基于L-系统的植物形态数据库
苑明理
12:30-13:30
午餐
 
 
日程安排 议程 II:注意力与集体智慧(主持:曹旭东)
 
14:00-14:20
互联网上的注意力流
张江
14:20-14:40
注意力动力学与分布式知识生产
吴令飞
14:40-15:00
计算社会科学的基因
王成军
15:00-15:20
通用先验的选择
李熙
15:20-16:00
茶歇
16:00-17:00
集中讨论
全体与会成员
7月26日,星期日,费彝民楼A座
 
日程安排 议程 III: 复杂系统、人工智能与基础物理(主持:王成军)
 
9:00-9:20
科学实践的认知维度
王东
9:20-9:40
自私可能有利于多机器人协作
谢广明
9:40-10:00
信息熵、不确定性原理和音乐分析
肖华
10:00-10:30
茶歇
10:30-10:50
生命游戏的一个具体应用
章彦博
10:50-11:10
Dennett意识学说的时间拓展
李晓煦
11:10-11:20
广义相对论一百年
王雄
11:20-12:20
集中讨论
全体与会成员
12:30-13:30
午餐
议程1:注意力动力学 
我们越来越依赖互联网解决个人与社会的各种问题,从组织社会运动到对抗自然灾害。然而,有一种无形的稀缺资源在限制着互联网用户的行动能力,这就是注意力。人工智能之父、诺贝尔经济学奖获得者H.A.Simon早在1970年代就明确地提出,信息时代的注意力管理非常重要。在每个人都被各种移动计算设备和媒体渠道包围的今天,我们越来越强烈地感觉到,人类社会正在由“实体经济”进入“注意力经济”发展模式,正如经济学家Goldhaber在1997年预测的那样。与发展注意力定量科学理论的强烈时代需求形成鲜明对⽐的是相关实证研究较为稀少。同时,一些与注意力相关的领域, 例如“计算广告学”、“社会计算”、“人类计算”、“计算社会科学”,都尚未明确地提出将注意力作为研究的对象。本议程为对注意力有兴趣的科学家们提供了一个跨学科交流的机会。 

议程2:深度学习与大数据 
深度学习技术始于上世界70年代末的一系列人工神经网络研究,但其中一些基本概念实际上在更早之前就被提出了。如今,深度学习在工业界和学界都倍受追捧,它被视为实现人工智能最具潜力的方法之一,特别是在图像与声音识别,自然语言学习,以及计算广告学等领域。深度学习的成功源于神经网络算法的发展、海量数据的出现和基于GPU技术的计算能力的提升。在本议程中, 一些目前正在使用深度学习技术解决实际问题的科学家将汇聚一堂,共同讨论深度学习的基本原理,应用范围和存在的局限。 

议程3:复杂系统、人工智能与基础物理 
集智的使命是“营造自由交流学术思想的小生境,孕育开创性的科学发现。”每一个集智成员,都是这个使命的身体力行者。在过去的一年中,分散在全球各地的集智成员除了完成自身工作以外,一如既往地探索着自己感兴趣的科学问题。现有集智成员的兴趣主要集中在三大领域:复杂系统,人工智能,与基础物理。本议程提供了这样一个机会,让集智成员交流各自在科学探索中的心得及相关科学领域的前沿进展。
 
 
 

会议全记录如下(小木球整理):

开幕主持人:王成军
  
  9:10开幕致辞 巢乃鹏:
  表示欢迎和感谢。介绍南京大学新闻传播学院,支持集智年会。跨学科应当跨文理大学科才能够产生重大重要的成果。例如薛定谔《生命是什么》。希 望人文学科与其他学科有广泛的合作。集智年会是成军、令飞、张江一起主导的,希望在这个机会畅所欲言。期待,除了数理计算机学,希望更多的学科参与到讨论 中。不是来争论是非,而是是否有更好的视角,更好的研究和观察的角度。期待有更好的帮助和成果的产生。祝开办成功。(王老师也是物理学专业,之后做新闻传 播学研究。)
  
  9:18 张江 会议致辞:
  感谢巢老师、成军、令飞的筹办,感谢南大的支持。我先简单介绍集智俱乐部的发展情况。最早可以追溯到2003年,搭建“集智俱乐部”网站。强调一种自下而上的,去中心化的集体智慧,分享复杂性研究和文献。很快吸引了全国各地的关注者。直到2008年,和早期的2位成员,建立一个实体俱乐部。在中科院微生物所废弃的办公室开始一轮轮的讨论,大约2周一次的活动频率。2008年底有西马建立了“叁号会所”,并吸引了更多人的关注。直到2013年会所突然被拆,不得不更改到现在的林业大 学北路的韵味咖啡和五道口706青年空间展开活动。集智俱乐部在初始的时候准备主要关注系统科学这块,后来逐渐加入了更多的经济学、生物学等等的讨论。我们有个小册子,基本介绍。集核12人和外围科学家及活动主持人。会员统计至少达2000人以上。这个数字是怎么统计出来的呢?我们印制了2500小册子,每次活动都会发一些到太下,我们假设每个人领过一次就不会再领了,所以发出去的册子数有2000+。之后,集智俱乐部结出了一些丰富的成果,包括我和吴令飞合作的一批SCI论文,2014年彩云天气成为集智孕育的第一个产 品,2015年也有一篇媒体报道。另外第一本书的出版《科学的极致》介绍人工智能,在先锋书店开展推介会。打着开源科学的大旗,进行原创性的科学研究。。。进 一步推进科学的创新。希望牛顿的苹果光顾每一个人。
  
  25日上午 第一场 深度学习与大数据 吴令飞主持
  吴令飞:主题不是科普,而是原创性的科研。上午:机器学习deep learning,深度学习。深度学习是什么,会给我们带来什么?小亮点:11:30新墨西哥的马磊“星际移民中心”带来奇特的视野。下午:物理建模的角 度研究复杂网络和人类行为“注意力与集体智慧”,知识的生产,注意力的流动。明天:哲学的方向,以及工程的方向。北大谢光明机器人团队等等。明天下午,签 售图书。[成军:每人20分钟,上午11:20-12:20下午有1小时的集中讨论。]
  
  1. 袁行远 (彩云天气):穹顶之下的机器学习,空气质量预报
  明天空气会变好吗?
  为什么雾霾会突然晴朗,为什么又是却会持续很长? 问题:寻找一个方案来预测未来的情况。如果做雾霾分析,从哪里开始呢?首先看看国外,欧洲ECMWF,美国大气海洋管理局,日本。。国内:矮马预报,国内 影响力最大。实现办法:南京大学WRF表示均匀格点表示天气情况的数据。化学污染物浓度计算表示二氧化硫的情况,是通过数据预报和化学方程计算,结果预报 结果令人赞叹。据传言新浪天气通与之合作。
  我们的尝试是什么呢?彩云的雾霾报告。空间尺度上和时间尺度上更细一些。
  数据从哪里获取呢?全国空气质量实施发布平台……flash.十分不友好。一个有好的借口应该有经纬度和数据情况,现在彩云做了一个解析,然 后放在高德地图上(彩云提供的)。空气污染的时空分布。雾霾和每一天的时间高度相关,夜间最重。全球气象情况,风(美国大气海洋管理局的数据进行可视 化)。寻找雾霾与风象之间的关系。目标:预测气象条件对空气质量的影响。风速-PM2.5具有相关性,温度没有相关性。预测的趋势在大体上能温和,细节不 行。误差随时间变化的曲线,到24小时的平均误差与实测值相差十几到二十几,之后有赖于天气预报的精确度。展望:做成RNN的模型。未来展望:做雾霾成因 的分析。森林覆盖率和雾霾的关系。如果有一个靠谱的模型,就能知道通过什么样的方式才能彻底消除雾霾。
  Q&A:
  Q:怎么决定采用哪些数据。假设是基于什么做的。A:先验的知识,数据是否容易获得。Q:北京的空气质量与政府的行政指令相关,是否可以放进去?A:两会,春节,烧秸秆等事件放进去。 
  Q2:你们获得的数据是二手的,只要统计数据和行政指标挂钩,可能污染指数的真实性与受到政绩影响。森林覆盖率是否与经济的发达程度有关,是否地形丘陵与经济不够发达,和美国的灯光数据结合看,应该和工业指数关系比较大。A:华南地区虽然发达可能还和雾霾关系不大。
  Q3:风象是否可以用各向异性来表示?西南部比较少但实际无数据来只是,现在中科院和南大做气溶胶反演。A:补充多个数据远。
  袁:这个工作是由彩云。。。团队完成的。(颜值高的先讲)
  
  2.张建源:基于用户反馈的大规模众包天气探测
  传统的天气预测,可以通过气象部门统计的实况天气,例如1)卫星探测,红外、可见光等,提供大尺度的报告,2)短时间有雷达探测,提供半径 10-500公里的天气情况,包括云层高度、移动速度等天气信息。3)探空气球:高数十公里,给出飞行段各高度层的信息。4)人工监测站与自动检测站,等 其他探测手段。但是还不够(然并卵)。全国有几十万个自动站,但实际距离也很远,对我们的需求远远不够。需要更多的数据和更新的探测方法,在现阶段即可提 供足够数据。方案:“众包天气”,我们在一个没有wifi就不能活的情况下,有可能让每个人探测和发回信息。例如空气果、雨伞探测器、智能小区设备等。额 外的费用很高,数据量不够广泛。需要更多更广泛的数据。不二的选择:人类+手机。例如苹果手机,有温度和风力的探测器。gps,高度计,温度、风力、气压 等,体感天气。好处是空间精度高,时效性好。我为人人,人人为我。用户越多越准确,密度高,用户多,分布在人们需要的地方。离用户如此近,获取地区数据更 便捷更容易,实时修正天气。很快能够给出反馈数据,并且能够更快地改良模型。分级的数据量级反演出一个实际情况,空间分辨率1公里,时间分辨率6分钟。没 25平方公里一个数据即可满足现有需求。图上显示一个时间点的情况,目前用户的诚实度很高。是否可以通过用户图来反演出一个可能的雷达图?处理中遇到的问 题:用户反馈处理的难点——稀疏、不均匀、随机性高、可信度……时间切片:1小时时间段,6小时的时间步。如果数据更多,可切分更细。计算样本可信度,给 出晴雨概率分布。idw反向空间距离插值。例北京,用户反馈大部分在市中心,反演的数据和真实的雷达图还比较温和。用户反馈是稀缺资源,希望共享和开源。 期待移动端的天气探测更普及更精确,获取更多更精确的数据。其他:例如利用商船众包的方式探测海洋天气, 让精细数据遍及所有有人类活动的地方。
  q:用户提供天气信息,如何激励用户提供信息?a:实际获得的数据比想象中多。也希望在软件中给用户正反馈,激励他们参与公共事业。q:法律 问题,2015年5月1日国家气象局禁止民间一切的天气预报。现有的精确化预报是和国家气象局合作的,每一次预报都会出现在国家气象局app上。
  
  3. 肖达 基于深度神经网络的精细化短时将于预报
  (袁行远代讲,价值上亿的研究内容:p)
  如何把天气预报的精度提高?2013年8月份袁和肖达部署,可以通过gpu和机器学习得到短时预报。很奇怪很少人来研究它。把数据拆成几个测 试集来训练。和之前的天气预报有什么不同呢?经验积累-公式。需要人脑来进行经验总结。现在:试图用大量数据让神经网络来学习和了解这个模式。模 型:predictive autoencoder。把输入的信息进行重建。假设:1)降雨之和周围的降雨相关2)在一个地方学习到的模式可以应用到另一个地方。把二维图像变为三 维,并想办法把GPU的内存数据降下去。convPAE精确率增加了30%。把图像的模糊问题解决,通过迭代等方法。将regression转为分类问 题:可以下雨的云和不会下雨的云,等等。中心问题:1小时后会否下雨?展示一些学习后的情况,但和手工相比还不够好。如何对复杂的雨和台风等预测得更好? 需要更多的训练数据,对不同的地点和季节来构建不同模型?不同季节的天气模式是有区别的。颜色标识平均风向,纵轴为时间,北京2014年夏季下雨还比较频 繁,广州的下雨和风向情况完全不同。如何把风向的情况与神经网路合到一起?把光流的features放入神经网络但失败了,为什么?因为风向和降雨可能不 是一个相加的关系,而是相乘的。更疯狂的想法:用降雨预测风向-再预测下一个时间的风向-再回来预测降雨量。目前试图希望cnn代替fnn?神经网络可以 做更多的事情:如何把人类的行为完全从系统中去掉?目标是让用户反馈和预报结果一致。获得的结果比人类本身还好。更重要的,对于机器学习的初学者,如何开 始呢?推荐的方案是,找一个自己喜欢的问题,有足够的数据,有合适的开源工具包,你来解决这个问题,跑这个工具包,并且进行迭代。这样可以得到及时回馈, 这些是书中得不到的。把这个循环打通,你就会越快获得进步。肖达开始是一个人工智能的爱好者,花了1年多的时间尝试各种模型,在彩云工作感觉不错。
  
  4. 10:41 苑明理 L-系统描述植物形态
  /*开源科学的老兵,参与了中文维基的倡导者和核心成员,果核科技的架构师,是集智的核心成员和彩云的总是悄悄做一些奇怪东西的人。*/
  《植物的算法美》已经开始用l系统来刻画植物形态。但尚未见到这样的数据库,要么不可行,要么有难度。猜测难度:植物的两太多,很难做出每一 种的L系统,采样到规则出来需要很大的成本。可否用机器学习的方法把植物的形态做醋来?微软的体感游戏kinect。通过假人参数训练模型。想法:用已知 的系统来训练,然后根据实际图片清晰后再应用于识别的L系统。植物的形态,已有一些先验的知识和公式。主要的刻画方法(康托粉尘):起始符号 a->aba,b->bbb。Morphy系统原型:基于dsl的声明式表示方法,可以生成图像。这个系统绘图和数据表示是分开的,用这种表 示法可以做后面的工作。可以生成无数个图片,然后训练机器学习的程序,能够用图片推出表示法!然后就能够反映出L系统是什么。Q:有没有系统来刻画人体的 多态性。
  
  茶歇10:59-11:25
  
  5,马磊:章鱼喵,probe,舟放之,帝归,luly
  人类星际移民@星际移民中心/星际移民局
  讨论星际移民,选几个有趣的问题
  指行星际而非恒星际
  历史,2013成员增加、大规模网站重建 、内容增加
  主要项目:
  ·星际移民之书:面向大众,比较科普,有点科幻色彩的书。进行设定和科幻。
  ·系外行星档案:中文领域里面系外星系方面最全面的资料
  ·国际圆桌:在线讨论会
  ·星海航纪:博客,科幻故事和科普
  主要内容:
  为什么要星际移民:making life multi-planetary.外面的世界那么大,为什么要躲到摇篮里?又近又像的是火星,有稀薄大气,有地质活动。所以,我们要去火星。
  火星历法:参考大流士火星历。火星年,每个火星回归年定位一个火星年,一个太阳年平均有668.6火星太阳日。火星怨念开始,对应的是地球上 的公园1970年4月28日。为什么呢?如果这样规定的话,人类第一个降落在火星上的探测器就是在火星元年到达的。月份划分,并没有天文学意义。24个 月,每个月28天,偶尔几个27天,每个月4个星期,都从星期日开始。(由于太卡,镜头被可怜滴关掉了!)
  系外行星档案:系外行星探测,凌日法,当行星处于地球和太阳之间时,可以通过亮度变化看是否有行星,用来考察宜居性。考察宜居带:是否有液态 水。一些论文提出了不同的指标,例如地球相似性指数:取值0-1,1为地球,0.8-1之间表示非常想象。火星0.7,在银河系最想地球。例如开普勒 452b,0.83/0.89/〉0.9,不同评价体系获得的结果不太相同。故我们制定了另外一套分集方法,类似于GPA分级。火星归为b类,金星c,水 星d。452b为A**,因为有两个参数未定,所以尚不能定论。
  关于我们:星际移民之书。行业,科技,指南等等。系外行星档案主要是一些专业知识,费米悖论等。星际移民时间线:行星资源公司成立。星际移民局驻地球办事处。
  令飞:很多事情大家还在问为什么和要不要的时候,有些人已经在考虑怎么做,这样在大家发觉能做时,发现已经有人拿出完整方案了。这就是科学家 的作用。Q:什么时候去?207几-21xx年吧。Q:运输工具?太空电梯,船票,时间表和技术路线?A:技术都在,关键在于怎么刺激大家?Q:如何将火 星改造为一个自生态系统?A: 如果想变得非常适合人类呆,实际是有可能的。
  
  6,玉德俊:题目:基于递归定理的自复制机初探
  /*石油大学计算机系,去了著名的垄断企业。*/
  目标:从零开始制造计算机。主要讲计算能力在软件上的思想。希望对计算的本质有更多的了解。
  冯诺依曼提出来,但很少人跟进。1,自复制机器的悖论。生物都是按照物理和化学定理运行,并可自再生。但现在的机器不能够自再生。机器到底是 否能够制造自己?答案是肯定的。系统里要包含对其自己本身的描述。2,递归定理——自指。程序是对数据进行操作的。如何包含对自身的描述?把自己的复制扔 给自己,即可以复制了。蒯恩:表示一个可以生成他自己的完全的源代码的程序。在代码中,包括数据和运行代码,将数据本身去掉引号后可以变成运行代码。例 如,打印自己的语句。3,冯诺依曼:自复制自动机理论:theory of self-reporducing automata. 人工的生物的自复制机和如何构造自复制机。设想的特点1)可以任意长,2)可以自复制,3)可突变,且不影响自复制能力,4)突变后的机器可以连在一起。 以上这些都是可以达到的。M=P+G,母自动机漂浮在零件海里。包含的结构:x+Φ(x)。
  M’=A+B+C+D’=, 把母体包含在子体中并让子体运行新的函数 。demo4,把外部的代码纳入自己的一部分。4,后续的相关研究:1)基于元胞自动机,2)lipson基于实际硬件,模仿生物系统哦你。通过可自由吸 附的零件,进行自我复制。2005,2007.可以根据太阳能版自我构建。5,与类似结构的对比。进化出可以修复自己程序的程序 。Q:机器制造机器已经很普遍了,有什么不同?A:可以做但还没有见到。Q:零件海 还比较高级。A:宇宙是可以计算的吗?
  
  7,曹旭东 卷积神经网络
  /*清华退学,现微软副研究员*/
  All models are wrong, some are useful——George e.p. box.
  深度学习和神经网路
  基础模块从图灵开始到上世纪结束都一定奠定了,1980年back progagation已经做出来了。为什么要用一个新的词汇来代替神经网络呢? Dropout?大数据和超级计算?pre-training&Boltzmann machine……上世纪末神经网络一度臭名昭著。然并卵。故需要一个新的名字来替代:P。
  Deep learning likes teenagers’ love(sex),很多人谈它,但没有很多人了解他。2006年Hinton,2012,Alex。Google&VGG比赛,远超第二名。设 计的深度发生了明显的变化,3-4层——〉7-20层:所以deep learning 的key是深度?通过加深的方式即可通过很少的参数来记住。多深算深呢?(人脑6层左右)“deep learning炼金术”,搞很神奇的东西,但没人说清楚为什么。应该有一个简单的理论来指导。
  卷积神经网路是什么?——模仿人类的视觉。底层视觉检测边缘,然后角点和实线,然后……每一层的卷积做不同的事情。有的时候加了一层就会丧失 学习能力,有的时候不需要加一层。所以需要加一个合理的约束。所以把加深变成一个优化问题。第一个约束:patternA,B,以及位置关系可以覆盖,如 果窗口太小,则无法被学到。一个神经看到的区域越大,其代表的pattern和concept也越大,在加深的过程中若窗口不变则学习能力越来越差 ,直到不能学习位置。为了量化,我定义了一个指标。第二个约束:necessity of learning.在不断加层次时,随着区域的增加,涌现新pattern,故需要加新的层来学习新的pattern。当最顶层的神经元不会看到更大区域 时,就不用再增加层了。一些特殊的例子:三角和方块的学习,因为位置关系是随机的,随着视野加大,学习到的就是随机间距的关系,则没有意义了。AP的例 子,在地层次的位置不要加层,而是要抹掉底层的信息,只要学习全局的信息。故以此可以把神经网络学习的问题转化为一个约束和优化的问题。
  参加了一个比赛:第二名,获得了$45k。www.kaggle.com/c/datasciencebowl.数海洋中的浮游生物。
  
  下25日午。微信群直播既要(图片略)
  下午主持人:老鱼。
  主讲人:张江
  自我介绍:真实身份:北师大系统科学院教师,虚拟身份:集智的发起人。上午大家讨论的都是很靠谱的内容,下午从我开始不靠谱的内容。我的题目:注意力流。 我们换想一下非常远的未来,人应当如何面对虚拟世界?未来的人可能会废弃体力劳动甚至是脑力思考,那么剩下的唯一功能是什么呢?动一动你的眼球:注意力。1971年郝伯特西蒙就提出了注意力这件事,它说,未来将会出现信息过载,于是信息将不再有价值,而有价值的将是人的注意力。接下来,高徳哈勃提出了注意力经济这个词,认为注意力交易将替代货币交易,形成硬通货。高徳哈勃有很多有意思的观点,比如他提出注意力可以形成一种控制。“大家快看 这里!”(主讲人指向教师的某一个角落,所有人都看哪个方向),这就是一种控制,因为你在听我讲课,而我拥有你的注意力后,就会将它引导到任意的方向,拥有注意力就拥有了支配力和控制。所以说,注意力是一种资源。目前互联网时代,注意力已成为一种资源。下面的内容是我和令飞一起长期做的内容。我们认为注意力是虚拟世界一种“能量”。例如在黑客帝国电影中,未来的机器统治了人类,但却没有把人都杀死,因为机器需要从人中提取能量服务于它们。它们控制人类的方式就是创造一个虚拟世界(The matrix),而人躺在装置里进入虚拟世界,同时还为机器提供能量。这个情节仅仅是个隐喻吗?我认为不是。我们可以计算一下,一天24小 时,你自打醒来以后,就有几乎100%的时间都在面对大大小小的屏幕。你也正在向黑客帝国所描述的那样,将注意力能量投射到网络中。如果我们把01程序比喻成生物体,则虚拟世界就是一个生态系统,竞争到CPU时间的程序获胜。那么谁又决定了CPU时间应该分配给哪一个程序呢?最终是“人”,决定了时间,是人,促进了这个虚拟系统的演化。人相当于虚拟世界注入的能量的流动。这不仅是 一个比喻,更可以进行量化。比如我们可以把网络中的节点代表网站,连边表示人的跳转操作。受到生态系统流的启发,我的一个学生将印第安纳大学网站浏览整个互联网的数据利用 刚才的方法构建出流网络,进行可视化。这个可视化可以告诉我们很多信息。这种注意力流具有守恒性,比如入流和出流是相等的。之后,在这张图上我们可以对各个网站进行分类。我们也可以看到网站的中心性即重要性,越中心的节点在整个生态系统中的作用就越重要。我们看到,这张图中最中心的网站是google。虽然它的流量不大,但提供了整个互联网的入口。这个网络可以分成3个层级,中心 20%的网站却吸引了45%的流量,中间60%仅仅吸引了20%的流量,外围的网站吸引了剩下的流量。另外我们也可以看注意力流网络演化的形态。通过几个月的数据追踪,我们发现,google一直在中心,youtube向中心,而yahoo等向外围走,这说明youtube的影响力正在提高,而yahoo和MSN的影响力正在减退。下面我们来讲另外一类研究,我们的问题是,假如给你一个网站的点击流数据,你是否能够刻画出他们的特性?例如娱乐网站的 粘性,信息类网站的便利性等等。我们得研究集中在百度贴吧,这里面有很多的贴吧,我们得问题是,哪一个论坛粘度最高?图中显 示,每条线是一个贴吧,每个点是一小时的情况。首先,每个贴吧都很好的符合了幂律关系。结果发现幂指数C,恰好反映了粘性。研究发现通过自组织方式形成的贴吧,粘性更高。例如 集智今天来了这么多人,令人惊讶,这就是自组织。我们接下来的问题是,一个贴吧的粘性,跟这个贴吧流网络网络的结构相关吗?开始我们尝试过寻找各类网络结构和贴吧的粘性是否相关,但都失败了。结果发现耗散的模式,可以来刻画网络的粘性成都。具体地,我们用一个伽玛指数来刻画流网络的耗散模式,即我们可以从用户流失的 情况就可以看到网站的粘性情况。故,通过耗散模式可以对网站粘性程度进行刻画。从此,我们可以做一个新的类比。我们可以把整个生态系统和互联网作类比。这 不是一种信息的流动,而是注意力的流动。通过网络的性质,我们理应可以看到更多的东西。例如用户使用得“爽”,怎么进行定量化。旭东问我余生只能做一件事?别人的 目标是做人工智能出来,但我的目标是做一个能够把注意力吸引到的东西,一个最好玩的游戏,或至少是一个可以做出这样游戏的理论。(FIN)
  提问:你所说的粘性就是指让人离不开的东西吗?这和毒品有什么区别?令飞答:毒品没有生产力,我们通过注意力可以完成到产出的东西。
  提问:是否考虑到注意力的聚集?张江:这是相互的。信息是吸引注意的。
  
  第二个讲者:吴令飞:注意力动力学与分布式知识生产。
  老鱼评价:令飞是一个充满了淳朴热爱的科学有为青年。
  短短20分钟难以讲很细,注意力与分布式都不是新词。时间分配,在科研道路上发现了项目管理和科研经理人的特长,占用了不少时间。其他写书, 开发一些好玩的东西。剩下的时间,也完成了不少的事情。我和张江长时间合作,考虑注意力与能量的关系,并发现一些结果。并发在一些很好的杂志并被报道。我 们下面讲将来的事情。Q&A社区,是个高效的群体智慧系统。有些人喜欢挑战难度很高的问题,有些人躲开竞争,去回答没有人回答的新问题(分别称为 大象和老鼠)。从此逻辑做了两方面工作,通过建模,做了网络动力学。大象和老鼠的行为可以推导出一些和现象符合的东西。但仅此不够。我们检查了假设,把人 群分为两类,并考察两种人的混合,发现最优的比例1:2发展最好。偏离这个比例则发展的不够好。第二个概念:流距离的概念。flow lenght li。类似于小世界网络,但这里考虑方向。在实际系统里面,利用流距离。每一个问和答都能形成一个流动,求助-知识流动。这个网路有阶层。划分阶层发现, 会形成一个结构,每个人会帮助稍低而非太低的人。即形成一个链结构。形成comfort zoon。最终形成注意力流的链式结构。下一个是关于新闻的分享。这个流注意力关系可否在新闻领域应用?用几何学表示,红色表示新闻,越老越蓝。36天以 来,新闻尺度的大小恒定,注意力有限。构成一个移动的新闻注意力流。如此即可以预测新闻衰减。获得的衰减方程预测与前人一致。如果把新闻放在同一个起跑线 上,新闻就像一个气泡一样,从中间开始,之后消失。如果按时间播放,则形成一个固定的pattern。另外一些工作,关于知识的生产。1美国物理学会所有 期刊记录2,德国统计计算机领域50年论文。发现随时间,文章越来越长,合作者更多,被引用越来越少。故科学非常需要大规模合作的阶段,个人成为螺丝钉。 那么后面的机制是什么?过去100年每过20年,越难以看到更早的论文。左边06年的nature,重正化的数据,发现步长越来越长,节点可能会塌缩到一 个。小世界和???是矛盾的,发现人在真实的移动和在网络上的移动都很像。从重正化角度看,一个是幂律的,一个是指数的。故可以根据这些指标进行聚类。故 能够找到小的集团。下面工作的方向,1,张江2014年提出几何图模型,可以展示类似的pattern,2,模糊化并对应后,可以给出网站浏览的推荐。最 后,写了本书,可以在线看到。google scholarnetwork可视化,已经有人在用。本人背景:美国在ASU。远景:认为学生和导师应该是project进行开源模式,张彦博和肖华,下 面有讲。广告:计算社会科学。社会信息学,秋天开一个会,和圣塔菲合作开,主持两个分会。王成军和张江一起。另外一个会……关于science of science.未来趋势1)数学模型2)数据。(fin)
  第三位:王成军
  题目:计算社会科学的基因——21世纪的科学
  1介绍,2,如何认识计算社会科学3,科学的四重境界,4,可计算性,5,定义计算传播学,6,通往计算传播学之路。计算社会科学已非常普 及,因为2009年一批社会和计算科学家发表了文章,认为,这个领域正在涌现,是基于大数据,采用网络科学的视角,试图揭示个人与群体行为的模式。计算语 言学,引起注意在80年代,以及数据科学,社会计算,普世计算等。以及可视化,大数据,计算广告学,数据新闻学等。其他领域也可以看,对于政治学、经济 学、社会学的意义。为更严格地讨论问题,用计算社会科学构建了一个引文网路哦,发现随着时间变化,相关论文数量的变化。发现从1988年到2005缓慢发 展,2007年之后大幅度提高。引文增长更快。主题能够很好滴连贯到一起。形成类似学术共同体的情况。引用最多的文章,1997science,1998 nature。第一个小世界,第二个无尺度网络。第三2002pnasu,关于计算社会科学的。能够占领比较综合类的期刊。具体学科中,社会学,计算机 学,物理学,以及心理学。研究脉络上讲,(表格见ppt)。主要是多主题建模和网络科学。其中强调一点互联网数据,社会科学会成为21世纪科学的中心?因 为社会现象是最难解决的科学问题之一。因为卷入了海量的异质性个体的互动。我们在使用大型网络时,实际也处于大型试验中。在社会科学领域走的阶梯。在第二 个阶梯上是有缺陷的,社科领域经常用“大词”,例如机制,但解释力都很弱。也是很脆弱的。理想:从原则可以推导出机制,之后推导出模式和定律。例子:引力 研究。四重境界的统一。很多人试图建立动力学模型是第三层,第四层是或缺的。计算机领域人认为可以找到算法和函数,则认为此问题本身是可以计算的。物理学 为什么会比生物学发展要快?生物学为什么有漫长的博物学?生物学到DNA被发现,才找到可计算性。社会科学中经济学发展比较好,因为社会学用货币来衡量。 心理学是靠实验,但分组比较不如货币这样的连续测量。传播学自己的基因呢?统计语言学,网络科学,计算机科学发展起来。均因为数据的易得。网络科学的基因 是什么?度分布等。定义计算传播学。期待可以被应用到实用领域。(FIN)
  提问:老鱼:注意力和信息,投入注意力是否可以对社会的方向和投入产出模式提供指导?答:想办法测量各种信息,比如一年生产了多少信息,出版 物等,算到数值,做了一段时间后,发现并没有带来更多的东西。现在信息泛滥情况下,试图从注意力的角度来看。从国家社会层面如何抓取注意力数据,还是一个 挑战。互联网抓到个人的行为,但累加到社会层面,真正能在多大程度上获得数据则成为问题。系列化的注意力的数据抓到,则可以做很多工作的。
  李熙:通用先验的选择
  所谓“通用”人工智能,不是针对某一具体的环境,而是在多种环境中追求效用达成目标的能力.首先从哲学角度考虑——归纳问题,从有限个数据 (点)中能够学出真实环境(线)吗?答案是否定的。波普尔认为科学方法论就是遇到问题、提出假设、进行观察或设计实验,检验假设是否正确,之后修正或提出 新假设。假设的提出遵循从简单到复杂的过程.这是一个先归纳后演绎的途径;另外有一种更简单直接的方式,不必关心具体的模型,而是通过综合考虑所有的模 型,进行贝叶斯混合,直接做预测,这是通用归纳所采用的途径。问题是:如何对所有不同模型进行加权平均?方法:分配不同先验概率,给予不同的权重。通常, 如果没有任何信息时,一般采用无差别原则或最大熵原则赋先验。如投硬币,会猜概率是一半一半,对于连续的情况,也会给一个均匀的先验概率密度。但这会遇到 问题,如no-free-lunch theorem。在一函数类中赋均匀分布的话,任何搜索或优化算法,在一类问题表现很好,在其他问题则会很差。2004年有人给出no-free- lunch的充要条件——block uniform“块均匀性”,想要算法有通用性,则要破坏掉块均匀性。首先,什么是“块均匀性”?对于两个函数f,g,如果它们的象的原象的基数相同则认 为是落在同一个“块”里,如果对所有落在同一个“块”里的函数赋予相同的权重就是“块均匀性”。怎么破坏掉块均匀性?Solomonoff通用先验借助算 法复杂性,而算法复杂性可以度量模式的简单性/复杂性、捕捉“随机”或噪音。落在同一个“块”里的函数有“随机”的,也有“有模式”的。将随机的函数赋予 0权重,而只把宝贵的注意力投向真正的“模式”上,简单的模式赋高权重,复杂的模式赋低权重——这样就可以打破“块均匀性”。结果是,不管现实环境是确定 性的图灵机程序的还是不确定性的可计算的概率测度,都可以通过基于Solomonoff先验的贝叶斯混合逼近。而且,因为算法复杂性不依赖于通用图灵机, 这个通用归纳模型也独立于通用图灵机。有了通用归纳模型,Hutter在通用归纳模型的基础上拼接了一个强化学习模型,试图用它来捕捉通用智能。采用这种 方法可以只用一个数学公式量化“智能”——也就是在不同环境中获得效用的能力。获得最大期望效用的策略就是“超级智能体”AIXI。但虽然通用归纳独立于 通用图灵机的选择,拼接了“效用”后的通用智能模型AIXI却严重依赖于图灵图灵机的选择。先固定一个通用图灵机,根据它先定义一个能获得最大智能的策略 AIXI,然后可以构造另外一个通用图灵机,按照根据这个通用图灵机定义的智能衡量标准,之前能获得最大智能的策略AIXI却只能获得几乎最小的智能。所 以这个智能的衡量标准问题很严重。拼了效用后,很难给出合理的“最优性”标准,逃不出探索/开发的陷阱。但可以定义一些好玩的内在效用逃避这个问题,比如 只研究追求“惊奇”——先验与后验的相对熵——的主体,或追求负熵——先验与后验的香农熵差——的主体,或追求有效复杂性、逻辑深度等等。而且,可以把这 种好玩的内在效用移到先验上,比如,先假设一个通用先验,然后根据这个先验可以按照“惊奇”或“负熵”的方式定义个内在效应,然后在不确定的环境中,可以 定义期望内在效用,然后可以对各种环境按照期望内在效用排一个序,然后可以按照这个排序给出一个通用先验,虽然事先假设了一个通用先验,这里又给出了一 个,但这不矛盾,可以借助一个固定点给出。总结一下,通用先验是通用智能的核心。一个好的通用先验要首先打破块均匀性,保障free-lunch,另外要 尽量摆脱掉对通用图灵机的依赖。从哲学角度空泛的说,如果以简单性为“美”、以效用为“善”的话,就是,怎么借助美和善来定义“似真”(先验)。 (fin)
  
  主题:dennett 意识学说的时间拓展 李晓煦
  谁看过《我在哪里?》缸中之脑故事,说,你的大脑被挖出来,用无线电连接,此手术你不知道。意识的主体和意识的内容:是意识的内容反推出了意 识的主体,还是反之?剧透的体验:获得了知识,失去了体验。心理学实验:黑白队打篮球,问篮球数……千万别被剧透。看过视频的同学:可否将此体验通过知识 的方式告诉另一个人,让其获得同样的感受?故,体验和知识是完全不同质的。下面是干货(数学背景)。根据dennet的学说,意识的内容反推出意识的自 我。“我心里感受到”“我头脑想到”。头脑-视觉,听觉。反推意识的自我。感受到的----心脏的不舒服,故早期认为“心灵”在心脏位置。身体实验:以四 肢运动为感受的。跑2500米,不能走神(很轻松地)去想另外一件事。此时意识活动的内容不在试听觉,而在四肢。故此时反推出来的意识自我,是身体的重 心。攀岩时由于重力敏感,故发现你自我不在头脑的位置,而在四肢运动的位置。跑到疲劳点时,又在想另一件事,则会发现“两个自我”。此不是重点,重点是, 跑道上的自我的意识内容的时间周期不是平常的时间周期,会发现跑圈上的另一个自我。这两个自我可以互相对话。没有如此跑过的人,无法体验到这种两个时间尺 度上的自我。《当下的幸福》,《心流》少年派的同感,比不上自己去体验同样的任务。外科医生周围的支持团队,成为意识内容的一体,即外扩的自我体验。佛教 的“大我”,翻译为“外部世界”,概念变成“宇宙自我/量子自我/天人合一”,心理学没有引用到自我的学说。心流:持续长时间的实际生活/体验内容反推出 来的一个自我。标度:自由神像:长时间尺度上的自由选择,相当于短时间尺度上的确定性。知乎上可以找到《从心理学的角度上解释什么是幸福》。人类的心灵: 短时少于7个独立的对象。话题:一本书内容如何还原成一片文章?心流内容反推的自我。一句话即短时记忆能够表达的东西。这三个东西能够还原吗?我看来是不 能的。测量幸福只能测量短时间尺度上的这个人,不能测量长时/心流尺度上是否幸福。上面这个主讲人补充自我介绍:李晓熙。一直教统计,近两三年教认知心理 学和积极心理学。以上是教课的心得。5月份在一个台湾心理学圈子里做了报告,使我有信心以科学而非民科角度来讲这个问题。幸福:不会问幸福,而会问心流, 愉悦感,意义。相关性非常高,可以相加在一起。
  提问L心流这个词?是中文翻译的flow.指15min ,长时间专注地投入一件事。张江:约等于注意力?Q:反推自我。“正念”,可否通过行为方式和意念反推到自我。那么是否有一个相对好的自我和坏的自我?日 常中讲a,b,c概念是一个有机的整体,否则不能分开讲。现在有三个时间尺度上的自我了,人生意义上的自我是超越时间尺度的。
  
  下午的自我介绍和答疑时段
  南大传播学院研究生毕业的学生。刚才讲心流,在心理学,传播学使用比较多。分散注意力会作为中间变量进行分析。
  肖华毕业于武汉音乐学院作曲,之后去美国读音乐技术专业。问题——为什么赋先验要考虑Kolmogorov复杂性?
  通常用无差别原则或不加限制的最大熵原则赋先验的方式都具有“块均匀性”,从而得不到free-lunch。相同“块”的函数赋予相同先验的 话,会把主要的注意力放在噪音——“随机”的函数上。通过算法复杂性可以把握“随机性”概念,从而躲开噪音,只关注pattern,从而打破“块均匀 性”,获得free-lunch。
  工商管理学院的老粉丝,一直跟张江做仿真。认为涌现需要解释清楚。感兴趣的是令飞注意力的事情:社团结构在注意力的流动中的作用是否关注?
  community的作用是否考虑其在注意力流的作用,如何放入模型?
  data science,没有data不谈science.没有网络谈社团则是没有data的。
  社团结构是基于人的。令飞:我们只能谈可定量的东西。
  张江:我理解你说的,一个社交网络中人是节点,注意力流不把人看成节点,人是连边上的流动。实际上人的流动是不加区分的。如果把人的社团结构放入,相当如人之间有关联性,这是个挺有意思的问题,但现在没有开始做研究,即粒子之间的关联性。
  xxx,做生物统计的。注意力网络中如何在scientific network上去做?令飞正在做此事情。一篇文章就是一个流。
  空间充满文章,早期在前,后期在后,生长点是reference,在某个方向上,角度知识的相似性。即在普通的流系统中,流的系数和总长度之间的关系。纯的浏览行为,在创造新的点,又被新的文章流经,构成新的流系统。现在研究还比较小。
  问:可否引用相当于食物链的角度?令飞:即是层级关系,即流有先后。学科的层级,也有底层学科与高层应用学科,和食物链也相近。
  杨绍阳,信息控制学研。见新的东西。
  晃晃微信群提问:@李晓煦 P、E、M的值是如何度量比较的?答晃晃:愉悦感,心流,人生意义的幸福感,是高度正相关的,关系非常小,在统计上某两个是负的,即互抑制的。按照时间切边去投入,这三个变量无法相加。
  说愉悦,和意义,心流是两码事。测量是困难的。因为测量工具总是检测瞬间的。我看来不能够测量,但这不是一个主流说法。技术bvd?可以测量很多数据,可以衡量愉悦点,专注,意义。
  老鱼:很多测量本身也是打断。
  北大2个mm新媒体研究院,关注集智围脖。盖茨研究所关注中国新媒体。。
  研究生,做人口流动和劳工?想法:基于。。算法劳动力的过程,一直想做模拟,不知道怎么弄。搜到了集智。问老鱼:自我复制的过程在社会学是有理论基础的。结构-行动-结构-行动,人自我描述,自我更新的过程。问题。学习编程怎么学才能自己动手做模型?
  晃晃:要是不能测量的话,说谁的P值高谁的E值高是什么意思呢?还有,『高度正相关』、『关系非常小』、『统计上是两个负的』,到底是统计上正相关还是几乎无关还是负相关?
  鱼:今天的观点,如果你对某个问题有强烈兴趣,那么这个问题来带动你去做编程。
  王晨,北大智能控制实验室,替谢广明教授做报告。做水下机器人控制,群体控制,机器人群体和生物的交互。
  做家庭社会学的。问,幸福,从科学的角度上怎么去量化?
  发达国家比发展中国家抑郁的多,因为发达国家通过努力得到的比发展中国家要少,甚至没有,所以就抑郁了。
  问题:意识有个玻璃顶。
  李:过了人均多少美元,钱再多对幸福感无影响。如果到10%则有影响,如果不到10%没有感觉。
  上海,赖恒,做it维护。没问题。
  GDP增长高就很开心,8000美元之前,具体数据我记不清了。
  张彦博,中国科技大学,合肥来。已经问了问题。
  张江:注意力(意识流)可能是我们广义上去讲的各种问题的魂的东西。
  问:人脑比喻成计算机,把人脑比喻成神经网络。这世界本身就是有结构的,分层好的,每个层次上都有区分的个体,还是因为只有这一部分是能够被 人脑思考和观测?如果是后者的话。人脑可以还原成短时记忆这一部分可以看成神经网络。但哺乳动物的神经网络理论上不可能认识它。问题:哺乳动物的大脑是不 能被短时记忆的模式还原的。t+-2不可被表述。
  答:希望在学术生涯中能搞清楚。不是一个神经元负责一个事情,之所以只能记住7+-2,是干扰,不清晰。虽然任务艰巨,但仍然能够最终理解智慧和意识是怎么产生的。现在这个数量级不行,我们可以先从小的和简单的开始。
  @晃晃 ,李晓煦老师已经在群里了,有问题你可以直接问他。他是@lixiaoxu
  罗三水 22:17思想者统计上留胡子概率高于常人,因为要经常摸下巴[偷笑]
  
  
  第二天的报告 7月26日上午9:00
  主持人:王成军。上午场主题:复杂系统,人工智能与物理基础
  下午在广州路先锋书店进行新书签售,以及《开源科学:人工智能和我们的生活》分享。
  清华社会科学学院 王东:科学的认知研究——以自由落体负数解为例。之前的主题准备讲个例子。鸟和鸟类学家的关系。太抽象,改为今天的主题。先举个例子,自由落体运动。 h=1/2gt^2。 解出来会有 -t,上学时会将负解舍去,留下正解,认为没有意义。是否有问过我什么没有意义?最初伽利略发现自由落体运动。为什么负数解没有意义?或者说,什么样的解 有意义?给出的理由:时间是无法倒流的。为什么两个负数相乘得到正数,为什么要这样定义?使用了数学认知理论:人先天有数学能力,这种能力是与动物共享 的。这种先天能力加上后天日常生活中的的认知机制,构成了目前的数学体系。“跨域映射”。是一种隐喻,对描述身体结构的情况映射到数学结构上,发展出了至 少初等数学。加减,数轴等均根据身体经验。那么为何负负得正?看上去很合理,之前负数相乘没有意义,但当数域拓展时,需要通过反转使满足闭合和满足各种数 学定理,认知上通过反转可以达到对称且相关。负数乘以负数是人感知到的一种空间结构,构成了负负得正的定义。伽利略时代不承认负数,认为负数时丑陋的东 西。在经验情况下使用自由落体方程式,是用不到负数的。但是,当数域扩展后,用来刻画时间、空间等,重力方程可以看成一种匀加速运动过程。作为演绎方程, 略去了负数的一部分。为什么说没有意义?是因为我们在时空中运动时可以用正负来感知空间,但是无法同样感知时间。我认为i,我们用从空间中抽取出来的经 验,来刻画同时具有时间和空间性质的过程。这才是真正的为什么,是因为我们用了部分数学。或者说,初等数学本身是源自于部分经验,却用来刻画全部经验,就 出现了问题。对于物体空间性质的把握,结合平面几何,为什么结合形成解析几何?为什么就可以连用在一起?以后有机会再讲,也是有一些基础的原因。开脑洞: 能否根据当代的认知科学理论,反思数学的意义。用现代科学技术,认知科学等研究自身时,也用到数学公式和仪器来帮助。这个过程体系是被数学公式渗入的,研 究对象和研究本身的区别。提问。是否可以做一个跨域映射,隐喻,贝利叶公式的模型或者工具?语义类的有单独一部分人在做,加拿大。。。大学“语义指针”结 合跨域映射与认知来研究。另一方面研究跨域映射还是传统数学。你说的这个很好,但可能做起来比较复杂。目前可能为时过早或者没有人敢去作。其他方面不够 懂。
  自私可能有利于多机器人写作,北大谢广明,由王晨代讲
  北大工学院博后王晨。是其博士学位课题的一部分。图片:放了一个机器鱼到未名湖中,2008年5月1日。发现机器鱼吸引了一群鱼。由此开始想 做生物群体交替的工作。做了仿鲹科机器鱼(如草鱼,鲤鱼),以及仿生机器海豚。区别在于推动模式是背腹式的,难度是需要克服重力。盒子鱼是通过3d打印做 出来的。水下放生机器人,但关节可重构,可以搭载设备。2012,2014年在南北极基地环境测试是否运行。我做的主要是机器鱼的运动控制相关。理论上, 我们做多智能体系的研究。如,反馈控制。传统控制已经无法处理新的问题,现在网络连接的应用,进行控制。多智能体系统(ppt)。最大的特点是所有个体通 过局部关联,形成群体性行为。工程上:单体仿生,外形到运动仿生。是否可以做群体行为仿生。生物群体:如蚁群,白蚁筑巢能力,鸟类迁徙队列,鱼群队形及快 速旋转的漩涡。生物现象,一定数量个体,产生群体协调有序的行为:群集行为。智能群体:个体智能低,群体智能高。couzin模型,2002,jtb。避 免碰撞,从众,避免分散。仿真结果和自然界行为很好吻合。2003对vicsek模型的解释:能使得所有个体方向达到一致:最早的一致性研究。 olfati-saber和murray,2004,典型的模型。另外的研究:为什么群体中的自私个体会合作?比如共同觅食,鱼群和鸟群的头鸟/鱼。现实 中领头和跟随者会变。那么为什么合作?演化博弈研究的核心问题:如何理解合作行为的涌现?2006 science:5种有利于合作演化的机制。仿生可否把为什么合作和如何合作一起研究?控制目标:一致性问题或编队控制问题。编队:典型--环形编队。区 别于以往的控制研究,我们把自私属性引入多智能体系统中。简单例子:引入自私(系统ii),有一个个体不合作。结果:平均时间和平均路程上会提高。引入自 私属性的研究,做了一系列仿真。结论:自私属性个体倾向较低的合作水平。研究系统性能,发现自私系统完成任务的性能会更好。自私程度按照策略度划分 0-1,策略度在0.3-0.4时整体效率最高。
  成军:每个时间点都要进行行为选择,但是生物行为在短时间内有连贯性。最后一个小时再提问。
  肖华,武汉音乐学院:信息熵、不确定性原理和音乐分析。
  我的理想:成为优秀的作曲家和工程师。先问个问题:我们为什么要听音乐?答:爽!从音乐中获得什么?答:爽,感情释放,唤起回忆。你获得的东 西背后的本质是什么?物质?X能量?x假设:信息。信息。信息。重要的事多说几遍。信息的意义:消除不确定性。基础假设:人们为获取信息而听音乐。前方高 能:信息熵(见图)是通过概率分布来计算的。故计算信息熵,如何在音乐中建立一个足够有用的概率分布?播放: 121212。1和2各50%概率。不足够好,因为区分不好。121212 1 2。最后的音时间更长,假设:每个音赋一个时长——无法区分:11331313音之间的相对位置无法分别。如何建立一个足够有用的概率分布?度量空间:距 离,定义等。我对传统的音乐理论不满意,无法嵌入解释。故找另一个突破口。既然熵用来消除不确定性。“不自量力”=不要自学量子力学。基础原理:不确定性 原理。海森堡随性地提出了观点:动量和位置不能同时被测准。不久,有人给了如下公式:见图。指出:海森堡指的是能量的方差之?不符合概率常数?两个构成傅 里叶变化对的函数的归一化的能量分布。。。。。。记不住。然后我们可以用来计算熵。如果是个足够有用的概率分布,则应该能够很好区别以上这些音乐片段的不 同。一键无痛?生成代码?我觉得可以做一个调查,音乐专业的有多少人看得懂Fourier transform。图。我设计了程序研究多声部的音乐,多声部信息熵反而降低了。好的音乐在大小尺度上都会让你爽。我首先完善音乐理论,量化表达,发现 音高和音量并没有关系,但人的感觉是有小2度的差别。加州大学的实验,音乐智能试验,自动模仿各种名家风格的作品,用肖邦风格作品和一首不著名的肖邦作 品,结果学生都猜错了。伦敦大学纷纷吐槽:没有公布技术细节。这!不!科学!大家怀疑他的东西有问题。
  张彦博。中科大物理学院,94年生人。题目改为:生命游戏、细胞自动机与复杂性。
  大杂烩,感觉每个内容深度不够。抱歉。1,生命游戏与房间的整理。生命游戏:网格,有一些规则。迭代后产生有趣的现象,例如一个周期循环的 pattern。东西太散,太多,没有标志物,无法找到。能否有启发性的规则指导整理物品?随机放到某个地方。模拟整理房间,从开始的混乱迭代了6000 多次,形成了某种形式,即聚合起来。存在的问题:理论上,设置的时候,一个agent死亡的状态,摆放时尽量与颜色相同的摆放到一起。形式是非常相似的, 聚合与开始的生命游戏的 规则关系不太大。虽然有问题,但有意义:自组织。通过局部规则,产生宏观的形式。在社会学和城市规划中有隐喻。[这个过程形成的聚类其实不(完全)是生命 游戏的自然后果,而是高斯模糊的后果————By 计算士]可计算算符与复杂性,细胞自动机:通过简单的系列规则,产生了复杂的结构。问题:为什么会产生这个复杂性?直观:复杂的程度在增加。整体比较复 杂,前几行都很简单,为什么越来越复杂?如果把宽度限制住,则复杂性大大减少,而出现明显的周期结构。限定了每一行形式上的复杂程度,使得总体的复杂程度 被缩小。简单-稍复杂-更加复杂。问:不断增加的复杂程度哪里来的?通过形式的迭代。即形式是可以计算的。符合“世界是计算的”概念,形式可以解读成计 算。两个自变量是相同的,则可直接写成。。。,这样写是为了强调一个过程。这个解读有神马作用呢?可以解释复杂的过程。金字塔图(30#细胞自动机),下 一行比前一行要多,故迭代后形成了分形生长的过程。这个表达式可以表达成g[w],意义:我们可以提前预知复杂性的到来。能否逆推F呢?比较困难。压缩和 逻辑深度,概念上是相似的。F的非线性程度可以讨论迭代的复杂程度。2,张江在2004年做过的一个电视机自指实验,产生了一些比较复杂的 pattern。理解:不会产生过分复杂的形式。因为画面变化不会对迭代方式产生非常大的影响,但可以产生小的影响。推断其复杂程度不会超过 30#,110#细胞自动机的复杂程度。另一个原因:亮度溢出。可以一致收敛到不考虑溢出的,是一个线性叠加,是在一个有限的迭代次数里。是由采样方式决 定的。还发现图像上有许多噪点,采样不均,使人感觉到比较复杂。如果采用图形学的图像追踪算法,可以消除这些噪点,使采样更加均匀。重写了算法后,没有考 虑亮子溢出,人像模拟,边缘是模糊的。如果考虑边缘非常清晰的过程,则侧面印证了对其复杂程度的猜想。整体的迭代大部分是线性的。与julia集是不同 的。[大家都看出来的,当年大家觉得很神奇的东西被年轻人否定了,完败---by 计算士]烹饪机器人简介:可以炒土豆丝。94:这个图完全可以被PS做出来的JAKE:和做实验还是有很大差异,不同实验是不一样的。Ps 有很多预定,比如广角镜头远处有形变,不是太线性,故会产生比较复杂的图形。
  中科院生物物理所 果蝇小姐,刘清晴:小虫子与认知科学。
  通过果蝇的脑来研究人脑。研究神经系统疾病。但我们不是搞这一块的。我们搞的比较苦逼:看神经系统的工作机制。干什么呢?理解智能的本质,告 诉大家什么叫意识?但是我们这个学科角度现在回答不了,所以大家也不要问我。但是会给我们一些启发吧。这就是果蝇,如图所示,下面是一颗草莓,果蝇非常的 小。养果蝇:在小瓶子里,每天煮特定食物来喂,房间温湿光控制。为什么用果蝇?系统简单,行为复杂,遗传背景和操作成熟,生命周期短,几天可以成熟。神经 系统,人脑。。。个神经元,果蝇30 0000神经元,比较好搞。很多看似突破的结论,说真话的话,没什么意义。果蝇太简单了,不能代表复杂的人脑。1,举例,帅哥对美女唱情歌。上面蝇是帅 哥。如果接受,则快乐唱歌,如果拒绝,则郁闷喝酒。和人类行为一样。2,举例。人类面对选择,是在进行思考,即衡量和比较。思考中红色前额叶区域比较活 跃,认为是逻辑思考等高级认知行为相关。果蝇中也有相似行为,两个线索用来选择,两个线索中均包含讨厌和喜欢的内容,果蝇就会进行衡量。脑占头的比例不是 很大,红色的负责处理识别信息,粉红色接受嗅觉信息,中间处理感知信息,进行高级运算。其中比较像前额叶的,是绿色两个L型结构,称为蘑菇体。神经纤维, 前伸到脑门分叉,结构比较奇怪。为何奇怪目前不知。这是一个思考的中枢,结构复杂,还受到更复杂的其他神经元的辐射。神经网络更加复杂的联系。遗传操作成 熟:目前技术可以单独抓出特定区域(绿色区域)进行研究,例如感受触觉,或嗅觉的区域。或者标记单个几个神经元,即可以进行操作和观察。如何研究?几个层 次:群体行为学,神经生理学,分子生物学等。但果蝇不是群体动物,故研究不多。我主要研究行为学。今天讲神经网络层面的结果和思考。图上展示神经元,两个 神经元之间是突触结构,信号传递过程。化学物质传递,突触前端--》突触后神经元。化学突触可以类比为电路1和0,图灵机:0和1。人脑是否是一个图灵机 呢?以前的读书会《计算机与人脑》:计算机:可靠的原件组成不可靠的系统。人脑:不可靠的原件组成的可靠的系统。现在,很多实验室研究相关神经环路,主要 关注神经网络的化学组成 ,解析得非常详细。环路已经解析得很好了,但是在模拟方面还是 没有能解决神经环路的功能怎么实现的?是否有什么遗漏呢?电突触。电突触:两个神经元之间通道的形式,可以开启和关闭,受到精细调控。之间小分子物质(带 电离子)可以直接交换。脑电波:分别对应不同的神经状态。比如兴奋和睡眠时脑波不同。神经元同步化,形成脑电波。滤波,降噪。信号传递是有阈值的。神经元 还有一些自发活动,有时候还非常强,是否能够传到下一级形成噪音呢?如果一个神经元有一个很强的自发活动,会通过电突触扩散信号,自身衰减。这就是降噪原 理。电突触具有模拟电路的性质。我们的工作,关注环路。发现电突触参与短时学习记忆的。很希望知神经是怎么计算的,现在还没到这一步。现在神经科学家主要 做:绘制神经连接图谱,以及进行实时定点操作,记录三维的全脑反应。问题:既然神经网络的链接可以画图,又可以任意操作。现在我们有这样的网络,怎么从理 论角度去了解它?
  问题:果蝇求偶过程中对异性有否求偶标准,人类的个体差异是否特别大,而在果蝇中是否特别少?答:审美标准,目前所知根据激素。雄性果蝇会喜 欢追没有受精的雌性,依靠嗅觉。果蝇的个体差异,还是不一样,但实验需要,去提高一致性。自然中的果蝇都不一样。问:脑电波到底是什么东西呢?答:是一个 神经元的同步化活动,场电位。电位差来表示的。一般选择和神经活动不相关的电位作为基线,然后检测电位差。
  王雄:广义相对论一百年
  今年是相对论一百年,有一个情结。全球最好的group都会做一个广义相对论一百年的报告,因此我也要做一个。不是对100年的总结,而是把 近代物理诞生以来的情况进行一个总结。横坐标是复杂性角度,纵坐标是数学深度和简洁程度。横坐标各点:粒子运动,波子运动,生命结构,人脑——复杂性的极 端。我们今天谈纵坐标。珠穆朗玛,高处不胜寒的风景。广义相对论一百年就是这个方向走。2005年世界物理年,纪念爱因斯坦奇迹年。那时候决定追溯这个纵 坐标。1915年前的物理。引力的认识。物质世界到理念世界层层上升的境界。代表人物:第谷,开普勒,牛顿,爱因斯坦。第一个层次pattern的层次, 没有总结出pattern则研究无法继续。天上地上两套独立的东西,牛顿万有引力将其统一,是通过建立万有引力方程。回到方程解的问题。下到上,花费数百 年,上到下,几分钟。另一个星系的人类可能找不到开普勒定律,可能会找到别的定律,找不到这个模型,也可能找到其他模型。all models are wrong, some are useful.人类所观测的东西上升到万有引力,万有引力在逻辑上是有漏洞的,这还是在力学的层次。牛顿知道这是不完美的。直到爱因斯坦的广义相对论,广 义相对论完美覆盖了万有引力定律,还能够表示引力与时空之间的关系。这是人类理智的一个飞跃,是通过数学的定律来指导观测,并预言。是一个最完美的理论的 例子。爱因斯坦说:我希望知道上帝的思想,其他都是细节。相对性原理的不断拓展,蕴含了神奇的力量,逻辑形式不断简约。结构:一个理念加一个时代。理念还 能找到实验的支撑。一个理念加一个实在:光速是不变的,产生了狭义相对论。引力场和匀加速运动等效,产生了。。。理念都能在现实中找到强烈的支撑。数学上 有一个很强的包容性。物理学里没有新东西,只是更大的,更包容的东西。现在强调创新,但在这种认识上不是创新而是不断地重复认知。在时空观上是一个革新。 到了广义相对论,物质和时空的相互作用。1915-2015发生了什么事?主流:量子力学。我这里的观点,从层次上看,真正本质上的突破还是来源于规范场 原理。类似于相关性原理。这种不变是全局的不变,转换成每一个时空点不变。不存在这种超距作用。产生了局部规范理论。这是产生于外尔-杨振宁等。实在的东 西可以从原理中无中生有。实在的东西:电磁场。引力可以从牛顿找 ,也可以从爱因斯坦找。内部对称性和外部对称性。时空和局部对称性。电磁,弱电,强电。不同的群,被统一在大群里。它如何和引力在一起?在数学上找到了一 个结构,但并没有最终整合在一起。100年还有很多别的事情,宇宙学标准模型,基本粒子标准模型,都是很好的。粒子模型理论上一团糟,但在描述自然上非常 精准。与现实非常吻合。老子说:……。在过程中要不断剥离,损掉不重要的东西。科学的发展有时候是矛盾的,很多时候不断加入新的东西。最后,大千世界,现 象很复杂,原理非常简单。如果上帝创造世界,不会说很多话的。伽利略-狭义相对论-广义相对论。自然规律是一种法,众生在不同状态的观察。运动规律和观察 间是这样一个关系:1,物质的运动都受普适规律约束;即法的普适性,2,众生平等。一切运动的物质,又能平等地参悟到普适的物理规律。量子力学是一个过 渡,不是一个本质的东西,可能可以从另一条路来走出来。大部分物理学家认为不能从统一场论来解释。但是物理学可能还是有可能往上走呢。上帝不会希望看到人 类无法领略他创造的东西的:)所有报告完了。谢谢大家参与。
   [xiaomuqiu:令飞的电脑在最后一刻没电了,完美完成了任务!他的电脑是不是已经自发涌现出智能了我们愚蠢的人类还在沾沾自喜呢……事实是……]
  问答:
  王雄:完全没有什么不确定,所有事情都是确定的。不确定是因为速度是发散的,没有定义速度。现在纬度是1又1/2的。
  问:对贝尔不等式等的看法?答: 推导没问题,问题在于前提。自旋对看不到速度。如果爱因斯坦没有发现广义相对论,人们们会将经典理论改成一个量子力学现在这样的糟样子。我是机械决定论。上帝都不知道,不能接受。
  自由意志定理问题在哪里?答:见我书第二部分,不知道,但感情上相信他有。如果在科学内部讲,我认为是没有自由意志的。
  如果把人和物理学分开的话,人是受因果律影响还是还受其他?答:横轴解释大脑思想,纵轴解释世界的情况。横轴走能理解人的思维的活动。人类认知过程同样没有意义。人类认知的路线是没有意义的。我不相信平行宇宙。平行宇宙太奢侈了(终)
  
  稍后还会有视频奉上

2015-07-18 04:30:24
  

希望参加,需要提前报名吗?

2015-07-20 14:49:24
   不需要,可直接前往。
登录后才可以评论,马上登录