Google向来以其搜索引擎而闻名,该公司表示,自主学习神经网络的优势是在于他们不需要使用标记数据。例如,为一幅猫的影像添加标签,便是所谓的标记数据,但这种做法会消耗大量能源,而且让教学网络变得更加昂贵。
Google表示,未来该研究还可望拓展到图像识别以外的范围,包括语音识别和自然语言建模等应用研究。
经过训练以后,网络中的一个神经元对猫有着极强烈的反应。/ 资料来源:Google
“我们的假设是神经网络将学会去辨识这些影片中的共同目标。事实上,我们已经发现,一个人工神经元对猫的图片有着极强烈的反应。最特别一点,在于研究人员从未告诉该网络什么是猫,甚至从未替任何一幅猫的图案打上标记。而这个神经网络竟然从未标记过的YouTube影片中发现并注视着一只猫,Google研究员Jeff Dean说。
此外,Google也藉由使用这种规模较大的神经网络,Google也通过将大量网络上的可用未标记影像和少数标记数据混合,并进行标准影像分类测试后,获得了70%的精确度改善结果。
Google的研究人员希望未来能进一步扩大网络规模,以确认性能是否会随着网络规模扩展而提升。Dean在他的博客中表示,目前的网络已经能支持十亿个连接,但仍远不及可支持约100兆个连接的人脑。
Google的研究人员已经在今年6月26日至7月1日于苏格兰爱丁堡举办的国际机器学习大会(International Conference on Machine Learning, ICML 2012)中,提出这份有关神经网络学习的论文。