眼球壁由三层膜结构组成:前 $\frac{1}{6} $角膜与后$\frac{5}{6}$的巩膜组成纤维层;脉络膜、睫状体和虹膜组成中间的血管层;最内层为网膜层,为视网膜所在处。
1.纤维层:
2.血管层:
3.网膜层:
视网膜:眼睛最里面的膜,布满整个后部的内壁,是脊椎动物和一些头足纲动物眼球后部的一层非常薄的细胞层。它是眼睛中将光转化为神经信号的部分。又称视衣、眼球内膜、眼球神经膜。
由前段至后段分为视网膜虹膜部、视网膜睫状体部和视网膜视部,前两部无感光功能,因此称为视网膜盲部。
视网膜另可由外向内粗分为色素上皮与神经上皮;前者再细分为9层,其中的感光层含有可以感受光的视杆细胞和视锥细胞。这些感光层的细胞将它们感受到的光转化为神经信号,这些信号被视网膜上的其它神经细胞处理后,转变为视网膜神经节细胞的动作电位。视网膜神经节细胞的轴突组成视神经。视网膜不但有感光的作用,它在视觉中也有重要作用。在形态形成的过程中,视网膜和视神经是从脑中延伸出来的。
每个人的视网膜血管结构都不一样,因此可用于生物特征识别。
围在眼球壁内的是眼球内容物,包括房水、玻璃体、和柔韧的水晶体。房水(水样液)是一种清澈的液体,存于两个区域:晶状体暴露的区域,在角膜和虹膜之间的眼前房。晶状体由透明细纤维组成的睫状体内的悬韧带悬吊着。玻璃体是一种由水和蛋白质组成的透明物质,具有果冻状和黏稠性的成分。
晶状体:晶状体由同心的纤维细胞组成,并由附在睫状体上的纤维悬挂着。晶状体包含60%~70%的水、6%的脂肪和比眼睛中任何其他组织都多的蛋白质。
晶状体由稍黄的色素着色,其颜色随着人的年龄的增大而加深。晶状体吸收大约8%的可见光谱,对短波长的光有较高的吸收率。在晶状体结构中,蛋白质吸收红外光和紫外光,吸收过量时会伤害眼睛。
普通照相机中,镜头有固定的焦距,各种距离的聚焦是通过改变镜头与成像平面间的距离实现的,数码相机的成像芯片放置在成像平面上。
人眼中的成像与照相机的成像相反,晶状体和成像区域(视网膜)之间的距离是固定的,对各个距离的正确聚焦是通过改变晶状体的形状实现的。
睫状体中的纤维可实现这一功能,在远离或接近目标物时纤维会分别变扁或者加厚晶状体。晶状体中心和视网膜沿视轴的距离大约是$17mm$。焦距约为$14$~$17mm$,在眼睛放松且聚焦距离大于$3m$时,焦距约为$17mm$。
下面一张图中的几何关系说明了如何得到一幅在视网膜上形成的图像的尺度。
假设一个人正在观看距其100$m$,高15$m$的一棵树。
令$h$表示视网膜图像中该物体的高度,由上图的几何形状可以看出$\frac{15}{100} = \frac{h}{17},h=2.55mm$。
视网膜图像主要聚焦在中央凹区域,光接受器的相对刺激作用产生感知,把辐射能转变为电脉冲,最后由大脑解码。
人眼视觉过程:
光刺激 $\longrightarrow$ 左右眼视网膜接受 $\longrightarrow$ 视网膜神经处理 $\longrightarrow$ 视觉通道
$\longrightarrow$ 大脑皮层处理 $\begin{cases}
1.存储参考图像\2.信息处理 \3.特征提取\4.决策 \5.描述\\end{cases}$
因为数字图像作为离散的灰度级来显示,所以眼睛对不同亮度级别的辨别能力在显示图像处理结果中是一个重要的考虑因素。
模拟图像:
又称连续图像,是指在二维坐标系中连续变化的图像,即图像的像点是无限稠密的,同时具有灰度值(即图像从暗到亮的变化值)。连续图像的典型代表是由光学透镜系统获取的图像,如人物照片和景物照片。
**连续的:**指从时间上和数值上是不间断的
数字图像:
又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。由数组或矩阵表示,其光照位置和强度都是离散的。数字图像是由模拟图像数字化(采样和量化等)得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。
像素的值代表图像在该位置的亮度,称为图像的灰度值。数字图像像素具有 整数坐标和 整数灰度值。
数字图像可以充分利用现代化的数字通讯和信息传输技术
数字图像可以长期保存和永不失真
对图像进行一系列的操作以达到预期的目的的技术称作图像处理。
图像处理的内容相当丰富,包括狭义的图像处理、图像分析与图像理解。
狭义的图像处理着重强调在图像之间进行的变换,是一个从图像到图像的过程,是比较低层的操作。
狭义的图像处理主要满足对图像进行各种加工,以改善图像的视觉效果,或对图像进行压缩编码以减少所需存储空间或传输时间,达到传输通路的要求。
图像处理可分为模拟图像处理和数字图像处理两种方式。
数字图像的处理方法种类繁多,根据不同的分类标准 可以得到不同的分类结果。
根据对图像作用域的不同,数字图像处理方法大致可分为两大类,即: 空域算法和变换域算法。
空域处理方法是指在空间域内直接对数字图像进行处理。在处理时,既可以直接对图像各像素点进行灰度上的变换处理,也可以对图像进行小区域模板的空域 滤波等处理,以充分考虑像素邻域像素点对其的影响。
变换域处理方法首先主要是通过傅立叶变换、离散余 弦变换、沃尔什变换、小波变换等变换算法,将图像 从空域变换到相应的变换域,得到变换域系数阵列, 然后在变换域中对图像进行处理,处理完成后再将图 像从变换域反变换到空间域,得到处理结果。
图像编码就是利用图像信号的统计特性及人类视觉的生理学和心理学特性对图像信号进行高效编码,以解 决数据量大的矛盾。
图像编码的目的有三个:
①尽量减少表示数字图像时需要的数据量;
②降低数据率以减少传输带宽;
③压缩信息量,便于特征抽取,为识别作准备。
分类:
①根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无误差编码和有误差编码两大类。
② 根据编码方法作用域不同,图像编码分为空间域编码和变换域编码两大类。
图像分析主要是对图像中感兴趣的目标进行检测、测量和分类,从而建立对图像的描述。
特点:是一个从图像到数据的过程,可以看作是中层处理。
图像理解是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。图像理解有时也叫景物理解。
图像理解主要是高层操作,其处理过程和方法与人类的思维推理有许多类似之处。
利用计算机系统解释图像,实现类似人类视觉系统理解外部世界。其正确的理解要有知识的引导,与人工智能等学科有密切联系。仍是一个有待进一步探索的领域。
可分为图像处理、图像分析和图像理解三个层次
中心任务就是对图像进行理解
- 对单幅图像的理解
- 对多幅图像的理解
- 对视频图像的理解
- 理解什么?形状、位置、运动
计算视觉(Computational Vision)用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论。
计算视觉可被认为是计算机视觉中的一个重要研究领域。
视觉信息:
视觉信息系统
采集、表达、处理、分析、理解
数字图像处理起源于20世纪20年代。
当时,人们通过Bartlane海底电缆图片传输系统,从伦敦到纽约传输了一幅经过数字压缩后的照片,从而把传输时间从一周多减少到不到3小时。为了传输图片,该系统首先在传输端进行图像编码,然后在接收端用特殊打印设备重构该图片。
该应用已经包含了数字图像处理的知识,但还称不上真正意义的数字图像处理,因为它没有涉及到计算机。
第一台可以执行有意义的图像处理任务的大型计算机出现在20世纪60年代早期。
1964年,位于加利福尼亚的美国喷气推进实验室(JPL实验室)处理了太空船“徘徊者七号”发回的月球照片,以校正航天器上电视摄像机中的各种类型的图像畸变,标志着图像处理技术开始得到实际应用。
数字图像处理技术在20世纪60年代末和20世纪70年代初开始用于医学图像、地球遥感监测和天文学等领域。
其后,军事、气象、医学等学科的发展也推动了图像处理技术迅速发展。
数字图像处理技术已经融入到科学研究的各个领域,成为工程学、计算机科学、信息科学、生物学以及医学等各学科之间学习和研究的对象。
生物医学中的应用
遥感领域中的应用
工业方面的应用
在生产线中对生产的产品及部件进行无损检测也是图像处理技术的一个广泛的应用领域。
如晶振元件缺陷检测、食品包装出厂前的质量检查、浮法玻璃生产线上对玻璃质量的监控和筛选、零件及产品无损检测、焊缝及内部缺陷检查、流水线零件自动检测识别、邮件自动分检、生产过程的监控等。
军事公安领域的应用
通信中的应用
图像通信按业务性能可分为:
文字识别
交通
计算机视觉作为一门学科开始于60年代初。
计算机视觉的基本研究中的许多重要进展是在80年代取得的。
现在计算机视觉已成为一门不同于人工智能、图像处理、模式识别等相关领域的成熟学科。
Marr计算视觉理论(80年代):使计算机视觉成为一门独立科学。
首次从信息处理的角度综合了图像处理、人工智能、心理物理学、神经生理学及临床精神病学的研究结果。
提出了第一个较为完善的视觉系统框架为计算机视觉这门学科形成奠定基础。
马尔视觉理论特点
Marr计算视觉理论二个核心论点:
Marr视觉系统研究的三个层次
$\begin{cases}
计算理论层次:计算目的于计算策略;总的输入与输出 \
表达与算法层次:各模块的输入、输出和内部的信息表达、以及实现计算理论规定的目标的算法 \
硬件实现层次:如何用硬件实现以上算法\end{cases}$
Marr 视觉信息处理的三个阶段
$\begin{cases}
图像低层处理:图像获取;图像预处理包括图像滤波、增强、矫正;抽取要素图;2D表达 \
中层处理(空间表达与建模):恢复其2.5维结构、形状与位置;进行建模与表达;以观察者为中心的可见表面的取向、边界、深度等 \
高层分析:识别、分析、理解、描述;以物体为中心的坐标系中,用体元和面元集合描述形状的空间组织形式\end{cases}$
摄影机自标定和分层重建(90年代):使计算机视觉走出了低谷。