与机器视觉有关的学科有许多.本节主要讨论一些与机器视觉密切相关的领域.关于机器视觉与其它学科的关系,我们不作详尽的讨论.
图像处理是一个发展比较成熟的领域.图像处理技术通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成.图像处理包括图像增强、图像压缩和模糊校正与非聚焦图像等课题.机器视觉系统把图像作为输入,产生的输出为另一种形式,比如图像中物体轮廓的表示.因此,机器视觉的重点是在人的最小干预下,由计算机自动恢复场景信息.图像处理算法在机器视觉系统的早期阶段起着很大的作用,它们通常被用来增强特定信息并抑制噪声.
计算机图形学是通过几何基元,如线、圆和自由曲面,来生成图像,它在可视化(Visualization)和虚拟现实(Virtual Reality)中起着很重要的作用.机器视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征.因此,计算机图形学属于图像综合,机器视觉属于图像分析.这两个领域在其发展的早期阶段是没有什么联系的,但是近十几年来发展的越来越相近了.机器视觉使用了计算机图形学中的曲线和曲面表示方法以及其它的一些技术,而计算机图形学也使用机器视觉技术,以便在计算机中建立逼真的图像模型.可视化和虚拟现实把这两个领域紧密地联系在一起.
模式识别主要用于识别各种符号、图画等平面图形.模式一般指一类事物区别于其它事物所具有的共同特征。模式识别方法主要有统计方法和句法方法两种,统计方法是指从模式抽取一组特征值,并以划分特征空间的方法来识别每一个模式。句法方法是指利用一组简单的子模式(模式基元)通过文法规则来描述复杂的模式。模式识别方法是机器视觉识别物体的重要基础之一.机器视觉识别物体还经常需要其它的技术.我们将在物体识别部分简要地讨论统计模式识别的主要内容.
人工智能(artificial intelligent, AI)涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景.人工智能有三个过程:感知、认知和行动.感知把反应现实世界的信息转换成信号,并表示成符号,认知是对符号进行各种操作,行动则把符号转换成影响周围环境的信号.人工智能的许多技术在机器视觉的各个方面起着重要作用.事实上,机器视觉通常被视为人工智能的一个分支.
人工神经网络(artificial neural networks, ANNs)是一种信息处理系统,它是由大量简单的处理单元(称为神经元)通过具有强度的连接(connection)相互联系起来,实现并行分布式处理(parallel distribution processing, PDP).人工神经网络的最大特点是可以通过改变连接强度来调整系统,使之适应复杂的环境,实现类似人的学习、归纳和分类等功能.人工神经网络已经在许多工程技术领域得到了广泛的应用.神经网络作为一种方法和机制将用于解决机器视觉中的许多问题.
神经物理学与认知科学长期将人类视觉作为主要的研究对象.机器视觉中已有的许多方法与人类视觉极为相似.目前,许多机器视觉研究者对研究人类视觉计算模型比研究机器视觉系统更感兴趣,希望机器视觉更加自然化,更加接近生物视觉。我们在第二章介绍人类视觉的一些研究成果,使读者在研究机器视觉时或多或少能从生物视觉机理中得到启发.不过,我们的重点在于研究机器视觉系统,因此,不讨论机器视觉与神经物理学或认知科学的联系.