为了深层次地领略神经网络视觉,只需添加反馈循环

renyonggang 45 0

人工智能和深度学习视觉识别系统艺术渲染。图片来源:克里斯蒂娜丹尼洛夫人工智能和深度学习视觉识别系统艺术渲染。你识别物体的能力很强。如果你看到一个杯子在不寻常的光线或在一个意想不到的方向,你的大脑很可能仍然计算,它是一个杯子。这种精确的目标识别对于人工智能开发人员来说是一个圣杯,比如那些改进自动驾驶汽车导航的人。


尽管视觉皮层中灵长类物体识别的建模已经彻底改变了人工视觉识别系统,但目前的深度学习系统已经被简化。也无法识别儿童与灵长类动物(如人类)的游戏。在发表在“自然神经科学”杂志上的一项研究中,麦戈文研究所的詹姆斯·迪卡洛名研究员和同事们发现,反馈可以提高灵长类动物大脑中难以识别的物体的识别能力。增加反馈电路也可以提高人工神经网络系统的视觉性能申请。

为了深层次地领略神经网络视觉,只需添加反馈循环-第1张图片-任永刚博客 - 专注人工智能、智慧城市和5G智能新生态的网站

深度卷积神经网络(DCNN)是目前最成功的模型,用于在快速时间尺度(小于100毫秒)内准确识别物体,并且具有灵感来自灵长类腹侧视觉流动的一般结构。正在查看的对象的可访问和精细表示。然而,与灵长类动物腹侧流动相比,大多数DCNN是简单的。


"长期以来,我们远远没有基于模型的理解。因此,我们的领域通过将视觉识别建模为前馈过程来开始此任务,"解释了资深作者Dicarlo,他也是麻省理工学院的主席。大脑、大脑和机器中心(CBMM)大脑和认知科学与研究的共同领导。"然而,我们知道在脑区域中存在与对象识别相关的反复解剖连接。"


想想前馈的dcnn,第一次尝试捕捉物体的视觉系统部分作为一条地铁线路向前延伸通过一系列地点。额外的,反复出现的大脑网络就像上层的街道,相互连接,而不是一种方式。因为大脑只需要大约200毫秒就可以非常准确地识别物体,所以不清楚这些在大脑中重复的相互联系是否在核心物体识别中有任何作用。也许这些常规连接只是为了使视觉系统长时间保持一致。例如,街道水槽帮助缓慢地清除水和垃圾,但它们并不严格要求人们从城市的一端快速移动到另一端。迪卡洛,首席作者和cbmm博士后Kohitij Kar。


挑战性的认可


作者首先需要识别被灵长类大脑简单解码的物体,但对人工系统来说却是具有挑战性的。而不是试图猜测为什么在对象识别中存在深度学习的问题(因为图像中的杂乱?这是一个误导的阴影吗?作者采用了一种不带偏见的方法,结果证明是关键的。


卡尔进一步解释道:“我们意识到,人工智能模型并不是每一幅物体被模糊或混淆的图像都有问题。人类正试图猜测人工智能模型为什么会受到挑战,但结果是退却了。”


相反,作者提出了一个深度学习系统,以及猴子和人类,使用图像在“挑战图像”中进行归巢,其中灵长类动物可以轻松识别这些图像中的物体,但前馈DCNN遇到了问题。当他们和其他人为这些DCNN添加适当的循环时,挑战图像中的对象识别突然变得轻而易举。


处理时间


Kar使用具有非常高的空间和时间精度的神经记录方法来确定这些图像对于灵长类动物是否真的无关紧要。值得注意的是,他们发现尽管挑战图像最初似乎是人类大脑中儿童的游戏,但它们实际上涉及额外的神经处理时间(大约30毫秒),这表明重复周期也适用于我们的大脑。

为了深层次地领略神经网络视觉,只需添加反馈循环-第2张图片-任永刚博客 - 专注人工智能、智慧城市和5G智能新生态的网站

“通过将更多的层叠加到人工神经网络上,计算机视觉社区最近所取得的成就已经通过循环连接的大脑结构得到了发展,”kar说。Diane Beck是贝克曼研究所的心理学教授,也是智能系统专题的共同主席,而不是研究的作者,他进一步解释道。"因为全前馈深体积网现在非常善于预测灵长类动物的大脑活动,它提出了反馈在灵长类动物大脑中的作用的问题。研究表明,是的,反馈连接可能在对象识别后起作用。他说:“我知道,我知道,我知道,我知道,我知道,我知道,我知道,但我知道,我知道,我知道,我知道,我知道,我知道,我知道,我知道,我知道,我知道,我


这对自动驾驶汽车意味着什么?研究表明,如果要匹配灵长类的大脑,目标识别所涉及的深度学习结构需要重复的成分,并指出了如何为下一代智能机器操作该过程。“回归模型提供了神经活动和行为的预测,”卡尔说。“我们现在可以模拟更多涉及的任务。也许有一天,该系统不仅可以识别一个对象,比如一个人,而且还可以执行人脑可以轻松处理的认知任务,比如理解别人的情绪。”


打赏 支付宝打赏 微信打赏

发表评论 (已有0条评论)

还木有评论哦,快来抢沙发吧~