乳腺X线影像中微钙化点检测新方法
2007-03-09
摘要:提出利用贡献矩阵对图像预处理,利用二维主成分分析方法提取区域特征。先检测感兴趣区域,再检测微钙化点,并提出质量可分级的支持向量机作为分类器,最后利用顺序滤波法对钙化点的检测结果进行修正。实验结果表明,该算法有效地降低了假阳性。
关键词:支持向量机 贡献矩阵 顺序滤波
乳腺癌是一种常见的妇科恶性肿瘤。由于病因未知,所以不能预防。早期诊断和早期治疗是降低死亡率的关键。微钙化点是乳腺癌的早期征兆,所以微钙化点检测是控制乳腺癌的关键。微型计算机辅助诊断已成功地被放射线学者用于乳腺X射线影像医学图像中微钙化点的检测。人们已经提出了很多微钙化点检测的方法。但普遍存在假阳性高的特点。
本文提出首先利用贡献矩阵对图像预处理,突出图像中对分类结果而言的强影响点;然后将图像分割成子区域,通过二维主成分分析方法提取区域特征,利用支持向量化分类器检测感兴趣区域;再提取点的特征(包括矩特征、直方图特征参数等),利用质量可分级的支持向量机分类器检测微钙化点;最后利用顺序滤波器修正检测结果,排除孤立点,可以有效地降低假阳性。
1 微钙化点检测
1.1 贡献矩阵
通过对目标检测问题的研究发现,不同的特征向量对检测结果的影响是不同的。为了更好地利用特征向量解决不同的问题的不同作用,本文引入了贡献矩阵。贡献矩阵与原始特征矩阵维数相同,且该矩阵的每一维数据反映了原始特征向量的该维对分类结果的贡献大小,用该矩阵对原始特征向量进行预处理。
产生经验矩阵的方法有:(1)经验分析法,取决于人的经验,无法通过计算机自动确定;(2)基于结构分析的统计方法,通过对大量图像的灰度特片分布分析,对图像中的目标进行评估,确定出每一部分对分类贡献的大小,从而确定贡献矩阵;(3)反向优化算法,根据前两种方法确定一个初始的贡献矩阵,然后按照这个初始值对样本处理,求出分类结果;反过来根据分类结果修正贡献矩阵,得到一个优化的贡献矩阵,使分类效果达到最好。
本文采用第二种方法构造贡献矩阵。由于微钙化点是一些相对周围区域灰度值较高的亮点,故微钙化点检测问题在分类中起重要作用的是相对领域的亮点,对应贡献矩阵中较大的贡献系数。对于其他的像点,应赋予较小的贡献系数。
利用图像统计特征计算贡献矩阵D,其维数与图像相同。图像的统计特征本文采用统计平均值
对图像中的每个像素,首先计算其2m+1领域灰度均值,根据该像素的灰度值与该均值的差值大小来给贡献矩阵对应的贡献系数赋值dij,且0
准则(2)改写为
J(X)=XTGtX (9)
最优映射轴Xopt是最大化Jx的单位向量,即Gt对应最大特征值的特征向量。一般来说,只有一个最优轴向是不够的,通常需要选择映射轴向的一个子集,即最大化Jx的一组正交向量X1,X2,…,Xd:
实际上,最优映射轴X1,X2,…,Xd就是Gt的对应前d个最大特征值的特征向量。
1.3 特征提取
利用最优映射向量提取图像特征,对于一个给定的图像样本A,
Yk=AXk,k=1,2,…,d (11)
这样得到一组映射的特征向量Y1,Y2,…,Yd,称作图像样本的主成分。需要指出,二维主成分分析的第一个主成分都是矢量,而一维主成分分析的是标量。B=[Y,Y2,…,Yd]为图像的特征,用作后续分类器的输入。
1.4 顺序滤波法修正
乳腺癌的诊断中,专家认为,单位cm2的区域内,要有三个到五个以上的钙化点,才可诊断为乳腺癌。恶性的钙化点多是成簇出现的,所以检测出的孤立点一般是良性的点,而且很多情况下,是噪声,导致钙化点检测普遍存在假阳性较高的问题。为了排除这些噪声点,降低微钙化点检测的假阳性,本文提出了顺序滤波修正的方法。
顺序滤波是一种非线性的信号处理方法。m%26;#215;n邻域内d阶顺序滤波就是取图像中某点的m%26;#215;n邻域内的点,把它们的灰度按从大到小顺序排序,选取灰度顺序为d的点的灰度作为该点的灰度。m%26;#215;n邻域内d阶顺序滤波如式(12)所示:
假如,临床指征的钙化颗粒一般为100~500μm。空间分辨率是每像素50μm的情况下,可见钙化点一般不小于2个像素。对图像采用3%26;#215;3邻域内的3阶顺序滤波,即以每个点的3%26;#215;3邻域中第三大的灰度值代替这点的灰度,从而可保证滤除掉只占1个像素和2个像素的噪声点。
1.5 质量可分级的支持向量机
支持向量机以结构风险最小化代替常用的经验风险最小化作为优化准则,可以在理论上取得更好的泛化性能。人们已经将其应用于微钙化点检测问题。下面以两类模式的分类为例来说明其基本原理。
设样本集(xi,yi),i=1,2,…,n,yi∈{-1,+1},其中yi是模式xi的类别标号,通过满足Mercer条件的核函数K(u,v)将输入模式映射到一个更高维特征空间H中,在此高维空间求取一个线性分类面使两类距离最大(称为最优先性分类面)。
这相当于求解约束条件下的二次优化问题
其中C是对线性不可分样本的分类错误的惩罚因子,αi为每个约束条件对应的Lagrangian乘子。
求解上述二次优化问题,可以从训练样本中得到一系列对应αi≠0的向量,这些特征向量称为支持向量,分类面由这些向量决定
其中SV为支持向量。
支持向量机测试速度主要受支持的向量个数的影响,支持向量个数越多,测试速度越慢。由于不同的支持向量对分类结果的作用大小不同,有的对分类结果影响大,有的对分类结果影响小,甚至有一些是冗余的,所以本文提出可控的支持向量选择算法,利用一定的标准对支持向量排序,选择不同百分比的支持向量子集构成分类器,可以在保证分类精度的前提下,减少支持向量的个数,提高分类速度,实现质量可分级的支持向量机。
通过支持向量机训练阶段得到所有的支持向量,记作支持向量集Ssv={xj},j=1,…,p,训练样本集{xi},i=1,…,q,以每个支持向量为聚类中心,计算每个样本到每个支持向量的距离,样本到支持向量的距离为:
dij=||xi-xj|| (16)
样本的距离最近的支持向量归为一类,即
统计各个支持向量所聚类的样本数,据此对支持向量进行排序,选择不同数量的支持向量,实现可控的质量可分级的支持向量机。
核函数的选择决定了高维特片空间H的结构,常用的函数有三种:
(1)多项式核函数
2 实验结果
在有经验医师的指导下,本文从40幅乳腺X图像中,构造了230幅大小为128%26;#215;128像素的图片,其中存在微钙化现象的110幅和不存在微钙化现象的120幅。利用本文提出的基于贡献矩阵的2维PCA方法提取图片的特征(钙化与非钙化样本各100幅),训练支持向量机。并用另外30幅样本进行测试。检出率达100%,但是将其中两幅不今钙化的图片误断为含钙化的样本。表1给出了部分样本的钙化点检测结果。
表1 9例测试样本微钙化点检测结果
真实MC个数
检出率
修正前FP
修正后FP
1
20
100%
2
1
2
34
97.1%
3
2
3
26
96.2%
4
2
4
23
91.3%
3
1
5
7
100%
0
0
6
22
95.5%
3
3
7
17
100%
2
2
8
38
100%
4
2
9
20
95.0%
3
1
针对微钙化点检测普遍存在的假阳性高的问题,本文提出了一种新的钙化点检测方法。利用贡献矩阵对图像预处理,贡献矩阵是根据图像中的像素对分类结果的影响大小来确定的,用来对图像预处理,能够突出对分类结果作用较大的图像区域,可以弥补经典主成分分析仅仅基于特征值大小选择特征的不足,选择更加有利于分类的特征;与经典的对向量运算的主成分分析方法不同,二维主成分分析方法是直接针对二维图像数据的,大大减少了求协方差矩阵的计算量;提取感兴趣的区域可以排除大量非钙化的区域,从而提高检测速度;通过支持向量聚类的样本数来衡量支持向量对分类结果的作用大小,从而对支持向量排序实现质量可分级的支持向量机,在不丢失钙化信息的前提下,修剪部分对分类结果影响较小的支持向量,能够提高检测速度;采用顺序滤波的方法对钙化点进行修正,可以排除孤立的点,降低微钙化点检测中普遍存在的假阳性。
进入应用查看更多内容>>
- 祛魅固态电池:一文看懂这项大火的技术
热门新闻
相关电子头条文章