机器视觉
机器视觉图像检索
2013-03-25 16:14  浏览:47
随着社会的信息化发展日益深入,互连网日益普及,越来越多的图象和视频信息都是以数字方式存储的,如何有效地管理和利用这些以图象和视频的方式存储的信息也逐渐成为一个非常重要的问题。机器视觉与图像处理软件的关系又是怎样的呢?

  基于内容的图像检索,即CBIR(Content-based image retrieval),是机器视觉领域中关注大规模数据内检索数字图像的研究分支。基于内容的图像检索的研究还涉及了图像处理(Image Processing)、图像检索(Image Retrieval)等多个研究领域。其研究的目的是直接根据图象和视频本身的信息,抽取检索特征,建立索引树,再根据一定的相似性衡量标准,实现检索。

  目前在图象数据库和视频信息系统中,检索主要是根据随图象和视频信息一起存储的文本描述进行的,通常这些文本十分简洁,主要含有拍摄时间、地点、拍摄者等信息。对图象本身的内容描述也是十分简短的,难以满足实际检索时多方面的需要。

  对于支持基于内容的图象检索的数据库而言,必然支持两种主要的数据结构:物体和场景(objects and secenes)。场景是一幅图象,其中可以含有一个或更多个物体,也可以没有物体,物体是场景的一部分。例如,汽车是交通场景的一个物体。这两种数据类型需要按照它们的视觉特征来表示,包括颜色、纹理(texture)、形状(shape)、位置以及作为线条图草图(line sketches)时的边界之间的关系。

  常用的图象特征是颜色和纹理,此外对于物体检索而言,图象特征还包括几何特征如形状、尺寸和位置,此外还有基于草图的特征,例如刻画出图象中物体形状和方向的简单线条图特征。目前的图象检索方法主要根据彩色直方图特征和纹理度量特征,比较简单的方法有基于主颜色和颜色直方图的检索,更复杂的方法需要结合区域的位置关系(如上半个图表示天空和云彩,下半个图表示地面上的景物等)和几何形状(如圆形、线条框或轮廓等)信息按分层的方式综合起来,此外还可以根据用户的反馈信息利用机器学习的方法改进基于内容的图象检索算法。


发表评论
0评