计算机视觉理论

tamoadmin 球队新闻 2024-04-26 27 0

计算机视觉理论

计算机视觉是一门多学科交叉的科学,它的理论基础涉及到了统计模式识别、图像处理、计算机科学以及神经生物学等多个领域。以下是计算机视觉的一些关键理论:

1.计算机视觉的基本定义和目标

计算机视觉理论

计算机视觉是一门研究如何使机器“看”的科学,更具体地说,它是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。这里所指的信息是对缺斗路拉事短Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

2.计算机视觉的发展历程

计算机视觉的发展始于20世纪50年代的统计模式识别,开始的研究主要基于二维技术,用于二维图像的识别与分析。60年代,Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述。到了70年代,已经出现了一些视觉应用系统。70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”课程。80年代开始,计算机视觉技术得到了迅猛发展。Marr从心理物理学、神经生理学、临床神经病学出发,对人的视觉理论进行了系统的研究,提出了第一个较为完善的视觉系统框架。之后,计算机视觉领域展开了基于感知特征群集进行三维目标识别的研究。

3.计算机视觉的关键技术

计算机视觉信息的处理技术主要依赖于图像处理方法,经过处理后输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。图像分割是将图像分成若干部分,每一部分对应于某一物体表面,在进行分割时,每一部分的灰度或纹理符合某一种均匀测度度量。其本质是将像素进行分类,分类的依据是像素的灰度值、颜色、频谱特性、空间特性或纹理特性等。图像的增强用于调整图像的对比度,突出图像中的重要细节,改善视觉质量。通常采用灰度直方图修改技术进行图像增强。图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息,去除噪声,恢复原始图像是图像处理中的一个重要内容。

4.计算机视觉的应用领域

计算机视觉的应用主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。工业机器人的手眼系统是计算机视觉应用最为成功的领域之一。

5.计算机视觉的技术发展

计算机视觉的技术发展经历了从二维图像分析和识别到三维视觉理解的研究转变。20世纪60年代,Lawrence

Roberts描述了从二维图片中推导三维信息的过程,开创了理解三维场景为目的的计算机视觉研究。20世纪70年代,David

Marr在MIT的AI实验室提出了计算机视觉理论,这是与Lawrence

Roberts当初引领的积木世界分析方法截然不同的理论。计算机视觉理论成为80年代计算机视觉重要理论框架,使计算机视觉有了明确的体系,促进了计算机视觉的发展。

6.计算机视觉与深度学习的关系

近年来,深度学习在计算机视觉领域取得了显著的成果。2012年ImageNet大规模图像分类挑战赛中,采用的卷积神经网络(CNN)模型的深度学习方法带来了巨大的突破。其后基于深度学习的人脸识别等被广泛应用于各行各业。伴随着计算资源、人工智能的迅猛发展和实际应用的大量需求,马尔视觉理论曾经存在争议的地方有了更明确的解析。例如,对马尔视觉提出批评的“主动视觉”(Active

Vision)和“目的和定性视觉”(Purpose

and

Qualitative

Vision)的学者认为视觉过程必然存在人与环境的交互,认为视觉要有目的性,且在很多应用中不需要三维重建过程。但是,随着深度学习与人工智能发展对计算机视觉发展的促进,当今二维视觉的系列任务已经不能满足实际的应用需求,各种深度相机不断出现,二维视觉任务正在往三维拓展,越来越多的三维点云分析与处理的工作正在大量涌现,逐渐验证了马尔视觉理论的正确性。

综上所述,计算机视觉是一门涵盖了多学科知识的科学,它的理论基础和技术发展都是随着科学技术的进步而不断更新和完善的。