显然,机器的深度学习是一个热点研究方向,连Nature也开始触及这个分支了。这与其卓越的表现相关。如在计算机视觉领域,深度学习首先在手写识别领域表现出众。在物体识别(被誉为计算机视觉圣杯)的权威测试Imagenet Challenge中,深度学习遥遥领先于其他经典算法(16% VS 26%),吸引了无数眼球。而Matthew Zeiler深度学习算法在ICCV Imagenet Challnge 中,继续领先于其他算法。
近来在实际运用上,机器深度学习获得了很大的进展。特别在图形的机器识别方面,深度学习的识别模型展示了前所未有的酷派。斯坦福大学和多伦多大学网站已经向读者秀出了一些有趣的结果。多伦多大学网站上有一个Demo 应用,这个 Demo 可以把输入图像转化成文字描述(i.e. 可以识别图形),e.x.你上传一张喵星人玩球的图片,系统能用自然语言的形式输出:猫在玩球!也就是说,机器如人一样地识别了该图形。(斯坦福大学已在Github 里上传了他们的Demo源码)
上个月,Google 在其官方博文中也公布了类似的技术:让计算机“认识”图像,并用自然语言描述出来。(百度IDL的也很厉害,如其另一方向的猫语识别技术。在用技术模拟人脑思维方面,百度技术现在大约已经达到相当于2~3岁孩子的智力水平了。)实际上,微软,IBM、facebook这些巨头都在这方面投入了巨资。
这种识别需要一个复杂的学习过程。它不同于对单个物体的识别,当机器“专注”于识别具体的物体时,容易忽略物体的动...