视觉心理学家试图发现的东西。
正如格式塔学派已经认识到的那样,视觉中的一个重要操作就是图形背景分离。要识别的物体称为“图形”,其周围环境称为“背景”。这种分离也许并不总是轻而易举的事,仔细观察图9你就会知道,如果你从来也没有看到过这幅图,你会很难看出有什么可识别的物体。但过了一会儿,你就有可能意识到,图画的一部分代表一只达尔马提亚(dalmatia,南斯拉夫地名)狗。在这种情形,图形背景的分离被有意复杂化了。
还可能构造一幅模棱两可的图形背景分离图像。请看图10。第一眼看来,它像一个花瓶,但继续观察就可能看成是两张脸的侧视图。本来花瓶是图形,而现在人脸的轮廓线成了图形,原先的花瓶就成为背景了。但是,这两种解释很难在同一时刻看到。
大脑在决定哪些视觉特征属于某个物体时,要依赖于大体上符合格式塔知觉定律的明显的视觉线索。因此,倘若一个物体较坚实(接近性)、具有明确的轮廓(封闭性)、朝一个方向运动(共命运),而且整个为红颜色(相似性),那么,我们就很可能认为这是一个运动的红球。
对一个动物来说,出色地完成此类任务是至关重要的。否则,它就很难发现天敌或猎物以及苹果之类的其他食物。它必须能把图形和背景分离开来。所谓的伪装物就是试图混淆这一过程,伪装的作用是破坏表面的连续性(如战士穿的迷彩服),并产生一个易于混淆的轮廓,从而使真实的轮廓伪装起来。颜色也可能与背景混杂在一起。一只蹑手蹑脚移动的猫不时地停下来,就是为了避免给猎物提供任何运动线索。正如有人所认为的那样,我们由进化获得的良好的颜色视觉,使我们的灵长类祖先能够在纷乱的绿色背景中发现红色的果实。能给我们带来众多视觉乐趣的东西,可能就是最初发现食物和识破伪装的装置。
我们对最早阶段视觉加工知识的了解,部分来自于对眼和脑的研究(参见第十章)。需要执行的最早操作差不多是去除冗余信息。眼中的光感受器对落人眼睛的光强起反应。假如你观察一面完全均匀而光滑的白墙,那么你眼内的所有光感受器将会对光作出同样的反应。有什么理由将所有这些信息传递给大脑呢?对眼底视网膜来讲★JingDianBook.com★,最好是先对这些信息进行处理,使大脑知道哪里是空间上光强变化的地方——墙的边缘。如果整个视网膜区域没有光强变化,那么就不发送任何信号。大脑从“无信号”就可以得出“无变化”以及墙的这一部分是均匀的推论。
正如我们在后面章节将会看到的,在某种程度上,大脑对不同类型信息的处理是在不同的平行通路中实现的。因此,对如何观看形状、运动、颜色等过程分别进行研究是有道理的,尽管这些过程具有某种程度的相互作用。
让我们先从形状开始,很明显,抽提轮廓对于大脑非常有用。这就是为什么我们对线条图能如此容易地产生反应的原因。即使没有任何隂影、纹理、颜色等特征,你仍然可以对某景物的线条图形作出解释(如图11)。这说明,大脑中某些元素对精细的细节有较好的反应,另外一些对细节较少的部分起反应,而其他元素则对空间上的粗略变化起反应。你如果仅仅能看到后者,这世界就会模糊得像焦距没调准一般。心理学家常使用“空间频率”一词。高空间频率相应于精细的细节,低空间频率对图像在空间上的缓慢变化起反应。
请看图12。你很可能将它看成是具有均匀灰度的一些小正方形的组合体。现在,如果把它弄模糊(摘掉眼镜、半闭着眼睛或将它放到房内的远处),你就可能认出是林肯的面孔。图的细节(小正方形的边缘)干扰了识别过程。当视觉变得模糊时,这些细节就不那么显眼了。这时,尽管由于图像中只有较低的空间频率信息,因此图像仍然有些模糊,但是你却能认出他的面孔了,当然,一般说来,不论低空间频率或高空间频率对解释图像都有帮助。
大脑面对的最为困难的问题之一,是从二维图像中抽提深度信息。我们需要深度信息,不仅是为了确定物体与观察者之间的距离,而且还要识别每个物体的三维形状,使用两只眼睛是有帮助的。但常可利用一只眼睛或看它的照片就能看出它的形状。大脑使用哪些线索从二维图像中获得三维信息呢?一个线索就是由入射光的角度产生的物体隂影。请看图13。你可能将其中的一排看成是平面上的四个凹陷物,而将另外一排看成四个突起物。这样的深度印象就来自人射光的隂影。
偶尔,这种解释也可能是模棱两可的。凝视一会儿该图或者将页面倒置,你就会把凹陷看成突起,或把突起看成凹陷(注意,这种变化是同时发生的)。你的大脑最初认为,照明光来自某一侧,但倘若照明光实际来自另一侧,那么同样的隂影就会对应不同的形状,正如你所看到的那样。
另一个令人信服的线索是“从运动恢复结构”。这是说,如果一个静止物体的形状难以看清楚(经常是由于缺少某些三维形状线索),那么稍微转动一下该物体就容易识别了。在讲课时,如果把一个由小球和辐条制成的复杂分子的模型投影在屏幕上,就不易理解。但如果播放它的转动模型的电影,其三维形状就会一目了然。在电视节目《生命的故事》的片尾,你可能看到过这种情景。在那里,dna分子的模型随空中的音乐而旋转。
要进行三维观察,只看三维空间中的每个物体是不够的。你还必须观看三维空间的整个场景,以便弄清楚哪些物体离你近,哪些物体离你远。即便是二维图像也存在两种很强的深度线索。
第一个线索是透视,它可以用埃姆斯变形房间(因发明者阿德尔伯特·埃姆斯(adelbertames)而得名)进行生动的演示。这种房间只能用单眼从外部通过小孔去观察。这样,就可以排除任何立体视觉线索。这个房间看起来像个长方体,但在实际上它的一边很长。与正方形房间相比,它的一个墙角要高得多,也离我们远得多。当我在旧金山“探索者博物馆”(exploratorium)通过小孔观看这样的房间时,我看见一些在房间内跑来跑去的小孩。在房子的一侧他们显得很高(因为这时他们离我很近),而在另一侧则显得很矮(这时他们离得很远)。当他们从一边跑到另一边时(实际上是从近处墙角跑到远处墙角,再跑回来),他们的大小会发生惊人的变化。我当然明白,孩子们是不可能通过这种方式改变身高的。但这一错觉是如此逼真,使我无法立刻摆脱它。每个孩子的表观大小是由墙的虚假透视作用产生的。与其他错觉类似,这一错觉很难通过“自上而下”(即大脑的最高水平对这一错觉形成基础的理解)的作用进行校正。
另一个有力的线索就是遮挡。即一个靠近你的物体部分地遮挡远处的物体。我们在图5中就已看到过这种情景。一个女孩的面孔位于窗玻璃的框架之后。利用这一线索,大脑就能推断出,被遮挡物的各个不同部分应当属于同一物体,就像本章开头我们讨论过的那样。
线条能产生两种与遮挡有关的神奇效果。图2所示的卡尼莎三角属于第一种。白色三角形的虚幻边界是由黑色缺损圆盘的直线边界的延伸形成的。另一种效应如图15所示。
这种情况的幻觉边界主要由于了组线段的端点排成了一条线。机场中的“线”出现的原因有多种,如物体(如衬衫)的图案或斑马的条纹以及隂影等。一个遮挡背景的物体经常会截断背景中的线。在这种情况下,线段端点产生的虚幻轮廓将会勾画出这一物体的轮廓,就像图15那种故意设计的图形那样。正如心理学家拉马参准(v.s.ramachandran)所说:“虚幻轮廓的感觉可能比真正的轮廓还真实(对我们更重要)。”
另外一个距离线索是纹理的梯度变化。如图16所示。你只要看到这种草地的图,就会立刻产生草地逐渐离你而去的印象。这是由于,页面上的草叶自下而上逐渐变小的缘故。你的大脑不会将它看成是一面平坦而垂直的墙,在它的下面草长得比较高,而上面草长得比较矮:而是把它看成一个伸向远方的具有均匀高度的草坪。
还有一些深度线索。一个是物体的表观大小。一个熟悉的物体,当它离我们较远时它在视网膜上的像就会变小。因此,如果该物体的表观尺寸较小,大脑就认为它离我们较远。另一个深度线索是远处的风景通常看起来比较蓝。所有这些线索都被艺术家们所利用,特别是在文艺复兴时期透视现象被发现以后。卡那来特(canaletto)的威尼斯风景画便是很好的例子。
让我们转向讨论深度信息的主要来源(1)。它通常被称作“体视”,依赖于双眼观察同一物体时景物图像的微小差异。19世纪中叶,物理学家查尔斯·惠特斯通爵士(sircharleswheatstone)最早向人们清楚地演示,恰当呈现的双眼图像可以给人生动的深度印象。(怀特斯通还有一件趣事使人记忆犹新。有一次他在伦敦皇家学会等待发表星期五晚上演说时,因高度紧张而逃跑。从此以后,每个演讲者都要按惯例在演讲前被锁在一间小房子内等一刻钟。)怀特斯通还发明了体视镜(战后因设计简单而普及)。它使每只眼睛分别观察拍摄角度略有不同的照片成为可能。拍摄位置的差异就会产生并非严格相同的景观。大脑检测两个景观之间的差异(这在技术上称为“视差”),结果使照片上的场景显现出明显的深度感,似乎就出现在你的面前。
当你观察眼前较近的真实景物时,你可以通过闭上一只眼睛親自体验一下什么是体视。对大多数人而言,此时的深度感并不像同时使用双眼时那么强。(当然,由于上面提到的其他深度线索的存在,即使闭上一只眼睛,你仍可具有较好的深度感。)另一个明显的例子就是建筑、城市、风景等的写生或摄影。在这种情况下,两只眼睛就能使大脑推断出画面是平面的。实际上,用单眼仍然可以获得较生动的深度感觉。只要你站在一个没有玻璃反光的位置,并用手挡住图画的框架。这些动作去除了图画表面的某些平面线索,使得艺术家在图画中用于表达深度信息的线索产生较强的效果。
离你较近的物体的体视最显著,因为此时双眼视差最大。显然,要使双眼看到同一物体的景象,物体差不多就要在你的正前方。它不能向一侧偏离太远,而使鼻子遮住一只眼的视线。靠捕食为生的动物如猫、狗等,通常双眼都在前方。这样它们就可以利用体视抓捕猎物。而对于其他动物,如兔子,双眼长在头的两侧更有好处,这样,它们就可以在宽广的视野内发现天敌。但与人类相比,它们的体视能力很有限,因为它们双眼的视野重叠很少。①
运动情况又怎样呢?视觉系统对运动感兴趣的原因是明显的。当你看电影时,尽管银幕上看到的是一系列快速呈现的静止画面,而你却具有运动物体生动的印象。这种现象称为“表观运动”。在这种相当人为的情况下,视觉系统可能会出现失误。汽车或马车轮子的辐条有时看起来会向相反方向转动。一般说来,它发生的原因已很清楚。这大体上是由于大脑把一幅图像中的一根辐条与下一幅图像中离它最近的那根辐条联系起来引起的。由于轮子在不停地转动,被联系在一起的可能并不是同一根辐条,而是其他邻近的一根。由于所有的辐条看起来完全一样,大脑很可能把相邻两幅图像中两根不同的辐条联系在一起。如果联系在一起的两根辐条所在的位置完全相同(相对于汽车),则轮子看起来就会是静止不动的。如果转速稍微放慢一点,则轮子的辐条看起来就会向后转动。特别是旧式电影中,这种现象时有发生。当汽车减速时,辐条看起来就改变方向(相对于汽车的运动)。心理学家们已经做了大量实验,试图确定获得好的表观运动所需要的条件。
另外一种运动效应是理发店标志牌错觉(barber”spoleillusion)。因为圆柱上有螺旋条纹,当它绕长轴旋转时,条纹看起来不是在转动而是在顺其长轴方向运动,通常是向上运动。(这将在第十一章中作充分讨论j因此,我们的运动知觉并不总是直接的。在这种情况下,你看到的并不是每个条纹的局域运动,而是大脑错误地把它想像为整个模式的全局运动。
大脑的运动知觉由两种主要过程进行处理。它们可以粗略地被称为“短程系统”和“长程系统”。前者发生在比后者较早的加工阶段。短程系统并不能识别物体,而仅能识别由视网膜接收并传递到大脑的光模式的变化。它可以抽提运动的“基元”,但并不知道是什么物体在
【打 印】 【来源:读书之家-dushuzhijia.com】