新智元报道
来源:NYT,arXiv
编译:闻菲、刘小芹
《纽约时报》今日发文,记者走访Hinton在多伦多的实验室,为我们带来Hinton新作“CapsuleNetwork”的更多信息。同时,新智元注意到Hinton和CapsuleNetwork作者之一的NicholasFrosst最近新发表了论文,使用训练好的神经网络创建一种软决策树(softdecisiontree),以此更好地理解神经网络如何做出分类决策。一方面推倒重建,一方面更好地理解,大神Hinton,一直奋斗在深度学习第一线。
年,GeoffreyHinton改变了机器“看”世界的方式。
Hinton和他的两名学生AlexKrizhevsky和IlyaSutskever一起,发表论文《ImageNetClassificationwithDeepConvolutionalNeuralNetworks》,提出了深度卷积神经网络模型AlexNet,在当年的ImageNet大规模图像识别竞赛中获得冠军,将Top-1和Top-5误差分别降到了37.5%和17.0%,比此前的技术要好很多很多。后来Hinton加入谷歌大脑,AlexNet成为图像识别中最经典的模型之一,在产业界也得到普遍应用。
用CapsuleNetwork克服传统CNN缺陷,让机器拥有人类的3D视觉
年,Hinton跟他在谷歌大脑两个同事SaraSabour和NicholasFrosst一起,发表了《DynamicRoutingBetweenCapsules》,提出新的神经网络模型CapsuleNetwork(胶囊网络),在特定任务上比传统的卷积神经网络取得了更好的效果。
虽然CapsuleNetwork还有种种有待提高之处,但正如“Hands-OnMachineLearningwithScikit-LearnandTensorFlow”一书作者AurélienGéron分析的那样,“胶囊网络已经达到对MNIST数据集的最佳精度。在CIFAR10数据集上的表现还可以继续提升,也是很值得期待的。胶囊网络需要较少的训练数据。它提供等变映射,这意味着位置和姿态信息得以保存。这在图像分割和目标检测领域是非常有前景的。此外,路由协议算法对于处理拥挤的场景具有很好的效果。路由树还映射目标的部分的层次结构,因此每个部分都分配给一个整体。它对旋转、平移和其他仿射变换有很强的健壮性。激活向可解释性也比较好。最后,这是Hinton大神的idea,前瞻性是毋庸置疑的。”
今天《纽约时报》发表了一篇文章,NYT记者走访了Hinton在多伦多的实验室,采访了Hinton和《DynamicRoutingBetweenCapsules》论文的一作SaraSabour,阐释了Hinton对CapsuleNetwork的抱负。
你能把图中两个模型组合成一个金字塔吗?看上去简单的任务,大多数人都做不到。来源:NYT
传统的神经网络,训练好可以识别一个马克杯,但当这个马克杯稍有倾斜就识别不出了。这是传统CNN的缺点。而Hinton想要用CapsuleNetwork实现人类的3D视觉。NYT的记者在报道中描述了这样一件事,看上图中Hinton和Sabour手中分别拿着的石膏模型。这两个石膏模型实际上能够组合成一个金字塔,听上去很简单的事情,但是很多人都做不到,包括这位记者,也包括MIT两位已经取得终身教职的教授——一位拒绝尝试,一位坚称用这两个模型无法组成一个金字塔。
Hinton解释,这是因为人类在看东西时,将整个物体视为一个三维整体,而这两个模型恰好用一种不常见的方式将金字塔拆分,因此大多数人难以完成。
Hinton想要让CapslueNetwork让机器拥有人类一样的3D视觉,不管马克杯如何放置,上下颠倒也好,左右倾斜也罢,同一个网络都能识别。
将神经网络“蒸馏”为软决策树,更好理解神经网络分类决策
除了克服传统神经网络的缺点,Hinton也一直致力于理解深度神经网络。
日前,第16届意大利人工智能学会年会(AI*IA)召开。AI*IA同期举行了一个题为“AI和ML可理解性和可解释性”的研讨会(ComprehensibilityandExplanationinAIandML,CEXworkshop)。顾名思义,CEX研讨会