人脑是怎样认知图像的?——十种模式识别认知理论简介导引
2007-09-16 9:03
在许多科幻电影中都会看到,机器人健步如飞,寻找和发现敌人,比我们人类看的远、看的准,力大无比,智慧超群,总是在最危险的时候挽救人类。其实,这些目前还仅仅是科幻,在现实世界中办不到。原因之一就是我们还不能“教”会机器人像我们一样认知景物。
为什么我们不教会机器人像人类一样认知景物呢?
不是不想教,而是我们迄今还没有搞清楚人类视觉系统工作机理,更谈不上将此机理转变成可计算的认知模型应用于机器人视觉了。
人们在认知景物时,常常寻找它与其它事物的相同与不同之处,根据使用目的进行分类,人脑的这种思维能力就构成了模式和识别的能力。
所谓模式,是指若干元素或成分按一定关系形成某种刺激结构,也可以说模式是刺激的组合。当人们能够确认他所知觉的某个模式是什么时,将它与其他模式区分开来,这就是模式识别。
例如,有人想把一大批图片分成人物、动物、风景、建筑物、其他等五种类型分别保管,上述五种类型就是五个类别,也就是五个不同的模式,分类的过程叫做模式识别。
模式有简有繁,繁杂的模式往往是由多个子模式组成。认知心理学家西蒙认为:“人们在解决数学问题时,大多数是通过模式识别来解决的,首先要识别眼前的问题属于哪一类,然后以此为索引在记忆储存中提取相应的知识,这就是模式识别。”
我们之所以关心模式识别认知理论,是因为它是建立图像(景物)理解数学模型的思想源泉。例如 :
传统的模式识别理论有人把它分为五类:模板匹配模式;原型匹配模式;特征分析模式;结构描述模式;傅里叶模式。现在图像理解中主要的数学处理方法,几乎都是源于五种传统模式识别理论而建立的,或是基于它们的变形。
近二十多年来新提出的模式识别理论有人把它分为五种:视觉计算理论;注意的特征整合理论;成分识别理论;相互作用激活理论;视觉拓扑理论。其中,马尔(Marr)的视觉计算理论是当前计算机(机器人)视觉的主流理论。其它的理论,也被众多探索者们作为创新的源泉。
然而,无论上述那一种模式识别理论,都存在着或多或少的片面性,迄今为止尚未形成一个较具有说服力的、普遍认可的模式识别理论。这正是制约图像识别(计算机视觉)数学模型发展的根本所在。
下面我们将各种模式识别理论分别介绍之。
|
No comments:
Post a Comment