计算机视觉早期研究的应用
计算机视觉是一门研究如何使机器“看”的科学,它试图建立能够从图像或者多维数据中获取信息的人工智能系统。早期的计算机视觉研究主要集中在以下几个方面:
1.图像分析和识别
在20世纪50年代,计算机视觉的主题主要是二维图像的分析和识别。这一时期的研究主要对象如光学字符识别、工件表面、显微图片和航空图片的分析和解释等。例如,神经生理学家David
Hubel和Torsten
Wiesel通过猫的视觉实验,首次发现了视觉初级皮层神经元对于移动边缘***敏感,发现了视功能柱结构,为视觉神经研究奠定了基础。
2.三维视觉理解
20世纪60年代,计算机视觉的研究重点转向了三维视觉理解。例如,1965年,Lawrence
Roberts的《三维固体的机器感知》描述了从二维图片中推导三维信息的过程,这是现代计算机视觉的前导之一,开创了理解三维场景为目的的计算机视觉研究。
3.计算机视觉理论体系
70年代中期,麻省理工学院(MIT)人工智能(AI)实验室:CSAIL正式开设计算机视觉课程。1977年,David
Marr在MIT的AI实验室提出了计算机视觉理论(Computational
Vision),这是与Lawrence
Roberts当初引领的积木世界分析方法截然不同的理论。计算机视觉理论成为80年代计算机视觉重要理论框架,使计算机视觉有了明确的体系,促进了计算机视觉的发展。
4.特征对象识别
20世纪90年代,特征对象识别开始成为研究的重点。例如,1997年,伯克利教授Jitendra
Malik发表了一篇论文,描述了他试图解决感性分组的问题。研究人员试图让机器使用图论算法将图像分割成合理的部分(自动确定图像上的哪些像素属于一起,并将物体与周围环境区分开来)。
这些早期的计算机视觉研究为后来的技术发展奠定了基础,例如特征对象识别和计算机视觉理论体系为现代的深度学习技术和算法提供了理论支持和实践经验。图像分析和识别的研究则为计算机视觉在日常生活中的应用提供了可能性,如人脸识别、图像检索等。三维视觉理解的研究则为计算机视觉在工业自动化、机器人导航等领域的应用提供了技术支持。