《深度学习与医学图像处理》阅读分享——数据预处理部分
本节涉及数据预处理部分和数据增强部分,本节主要分享数据预处理部分,至于数据增强部分不做分享。
首先本书在数据预处理主要有如下几点:
一、插值
首先结合实际环境和应用场景理解,如对图像进行旋转、放大的操作时,如一个2*2的四个像素,假如要放大成4*4的16像素,那么此时可以通过插值算法来进行操作,即我们进行放大操作时,因为会产生未知的像素点,而插值可以由原有的信息来进行预测。
两种常见插值方法:
1、最近邻插值法
这个比较简单,就是把距离最近的输入像素等于变换后的像素即可,所以计算速度很快,同时缺点也很明显,即为放大后的图像带有锯齿
2、双线性插值法
这里有一个公式,实际上可以结合图a来推,这个数学推导不难,总之了解有这么一个结论就可以了,而以此可以升为双线性插值法,相应的,效果会比较好,但是速度会慢一点。
详细效果对比见下图(可以看到图a是有明显的锯齿的)
二、重采样
这里涉及一个概念叫体素间距,场景为:实际上医学中人体部位的真实大小很重要,因此设备与协议之前的差别会导致不同的体素间距,因此要对体素间距进行重采样,保证体素个数可以反映实际成像大小。
这里有一个公式为:真实尺寸=体素个数*体素间距
所以为了保证真实尺寸不变,若增大图像的体素间距,则会导致个数变小,同时变小就出现了一中的问题,那么相应的还得考虑插值。
简单概括就是要改变体素间距和体素个数从而确保真实尺寸,实际上会结合插值和重采样。
三、直方图
说实在直方图这个比较简单,就是一个信号强度的体现,这里附上本书的一张图了解一下即可。
四、数据归一化
这个我觉得大部分做算法的应该都会用得上,比如在做信号处理
时,要对采集到的波形做归一化处理,从而去结合后续硬件软件等。其实概念上就是消除量纲,本书有两个:
1、区间归一化
其实就是把最大值定位1,最小值定为0,其余参数除最大值,映射到0-1即可,这个自己写个函数就能实现
该方法对信号值敏感,对分布不敏感,适用于强度分布不固定的影像,如CT这种不同强度值含义固定的图像。
2、Z—score归一化
这个为映射到标准正态分布,这个的特点和上面的方法相反,适用 于MR图像。
五、连通域分析和形态学方法
这里书中没有详细描述,只介绍了概念,这边就先只给出概念。
1、连通域一般是指图像中具有相同像素值且位置相邻的像素
点组成的图像区域。连通域分析是指将图像中的各个连通区域找出并标记。连通区域分析在图像分析处理的众多应用领域非常常用。连通区域分析处理的对象一般是一张二值化后的图像。2、图像形态学也叫数学形态学,是指一系列处理图像形状特征的图像处理技术,是一门建立在格伦和拓扑学基础上的图像分析学科,是数学形态学图像处理的基本理论。其基本思想是利用一种特殊的结构元来测量或提取输入图像中相应的形状或特征,以便进一步进行图像分析和目标识别
本帖最后由 Zhao_kar 于 2024-5-7 22:10 编辑