能不能介绍一下视频分割的有关技术?
最佳答案 - 由提问者8个月前选出
1.基于内容检索索引方法
在基于内容检索系统中,快速索引技术是影响系统速度的关键。由于媒体对象的特征描述一般都是高维的,而特征空间中的相近意味着较大的相似度,因此问题的关键就在于如何在高维空间点集中寻找与给定点距离最近的一组点。在计算机科学中,在点集中寻找与给定点距离最近的点的问题叫做最近邻搜索(nearest-neighbor-search)问题,记作NN-Search问题。基于内容检索的索引问题要求寻找与给定点距离最近的一组点(不妨设为k个),常记作k-NN-Search问题。
在一维空间下,最近邻搜索可采用对顺序表进行简单的折半查找来完成,但在高维空间这种算法就难以直接应用了。最早的最近邻查找算法是所谓的桶算法(bucketing algo-rithm)。这种算法将数据集空间进行规则划分(如成格状),每个划分中的数据点存于一个桶中(bucket)。这样,最近邻搜索就转化为在所有的桶中寻找与给定点最近的桶。由于桶算法对数据集空间进行规则划分,因此其对于均匀分布的数据集十分有效。
对于主存中的最近邻搜索来说,一种比较实用的索引方法是k-d-树方法,其思想是按照一定的准则选择某一坐标轴方向作为切分方向,将数据集切分为两个子数据集,再对此两个子数据集递归切分,形成一棵检索树。优先k-d树(priority k-d tree),这种索引结构不仅检索速度快,适用于k-NN-Search问题,而且其空间复杂度与数据集的维数成线性关系,且与二级存储器实现相容,因此是目前解决k-NN-Search问题最有效的一种索引算法。
近似最近邻搜索(approximate nearest neighbor search)也是基于内容检索索引研究的一个热点。由于在多数应用中,用户只要求检索结果中有一个或几个满意媒体对象即可,而并不要求查询结果一定是信息库中满足相似度和检索结果集合大小限制的所有对象。相反地,在多数情况下用户希望牺牲检索的精确度以换取更高的检索速度,这就导致了近似最近邻搜索技术的产生。而大量的实验表明,对于高维数据集来说,即使允许极小的近似(检索误差),也会对检索速度带来很大的提高。
在基于内容检索系统中,为加快检索速度而经常使用的另一个技术是分层索引技术。对于许多检索操作(如二次型距离的直方图匹配)而言,特征间距离的计算往往需要很大的计算量。在这种情况下,可采用一种计算量较小(cheap)的距离度量先对信息库进行检索,得到一组候选的媒体对象集,再对此候选媒体对象集采用原距离度量,以此来降低计算量。
2.内容描述技术
媒体分割和特征提取用来在基于内容检索系统中建立媒体对象的内容描述,其方法和技术直接来源于图像处理与理解和计算机视觉等媒体理解研究的成果。由于目前的媒体理解技术尚难建立通用的系统,因此在基于内容检索系统的实现中引入与领域有关的高层知识将是有益的(即图像/视频库涉及的内容),这将直接影响到系统所采用的媒体理解技术。以静止图像库为例,对于医疗图像库的检索,无疑需要结合专门领域的医学图像理解技术来进行图像的描述和组织。而面孔图像库或新闻人物照片的检索,结合面孔识别技术无疑可大大提高检索的准确率。像这样的专用基于内容检索系统,往往都需要针对系统的要求,专门设计用于检索和描述的特征。
也有一些图像检索系统由于其包含内容十分广泛(如QBIC系统和Virage系统),促使其选择更为普遍的特征来进行内容的描述、组织和检索。目前,对于通用的静止图像检索,用于检索的特征主要有颜色(color)、纹理(texture)、草图(sketch)、形状(shape)等,其中颜色、形状、纹理应用得尤为普遍。
对于视频信息检索,一般说来,领域知识的作用更为明显。除了底层的片段检测(shotdetection)、图像拼接(mosaicing)等不需要语义信息的技术外,要进一步对视频片断进行组织,则需要充分利用领域的知识。如对于新闻节目的检索来说,利用视频信号的某些特点(电视台的台标)可有效地进行信号区分,从而大大简化检索难度。而利用先验知识,可更有效地完成对监控系统视频信号中被触动过物体的检索。
尽管由于不同的应用背景,不同的基于内容检索系统在底层描述中采用的技术也各有侧重,但一般都能在传统的计算机视觉和图像处理技术中找到其出处。可以说,媒体分割和特征抽取所使用的技术是图像处理和计算机视觉各种技术应用的综合。
(1)图像的特征描述
对于通用图像库的检索来说,最常用的特征就是颜色、形状和纹理。
①颜色特征的提取
在传统的注重几何特征的计算机视觉研究中,颜色未得到充分的重视,人们普遍认为颜色不是刻划一个物体的关键特征。然而,相对于几何特征而言,(自己看太多了)
参考资料
http://www.jhsafe.com/safe/article/2/2006/200602281113.html