之前的文章讲述了肺结节CT影像数据特征提取算法及基于MATLAB GUI设计的肺结节CT影像特征提取系统。本文将讲述几个主要部分的代码实现,分别是预处理、灰度特征提取、纹理特征提取、形态特征提取数据。

一.预处理部分代码

1、读取肺结节CT数据和专家标记的mask数据

function [ sData ] = read_dcm_mask( dcmPath,maskPath,Ng )

function [ sData ] = read_dcm_mask( dcmPath,maskPath,Ng )
%read_dcm_mask.m 读取dcm文件和mask文件为矩阵,为后期使用准备
%第一个程序
% DESCRIPTION:
%此函数处理dcm文件和mask文件
%1.设置dcm和mask文件所在路径
%2.执行函数即可
%INPUTS:
%dcmPath:dcm文件所在路径
%maskPath:mask文件所在路径
%Ng:标准化的CT灰度级数
%OUTPUTS:
%sData:保存了volume和mask以及prepareVolume函数所需参数的一个cell结构

nowPath=cd;
mkdir(nowPath,'feature_extraction');%创建文件夹存放数据
dcmList=dir(dcmPath);               %获取dcm文件列表
maskList=dir(maskPath);             %获取mask文件列表
nDcm=size(dcmList,1);               %取得处理数据数目
%nMask=size(maskList,1);

%获取prepareVolume函数需要的参数,创建cell结构的sData,保存volume和para.
dcm1Path=fullfile(dcmPath,dcmList(3).name);   %获取第一个dcm文件
info=dicominfo(dcm1Path);                      %取得dcm文件部分信息用于参数设置
data.volume=[];
data.mask=[];
para.scanType='Other';
para.pixelW=info.PixelSpacing(1);
para.sliceS=info.SliceThickness;
para.R=1;
para.scale=info.PixelSpacing(1);
para.textType='Matrix';
para.quantAlgo='Lloyd';
para.Ng=Ng;
%sData={data,para}

%开始读取数据
for i=1:nDcm-2
    dcmName=dcmList(i+2).name;
    dcmP=fullfile(dcmPath,dcmName);
    maskName=maskList(i+2).name;
    maskP=fullfile(maskPath,maskName);
    volume=dicomread(dcmP);
    data(i).volume=volume;
    mask1=imread(maskP);%医生标记的ROI区域
    mask=im2bw(mask1);
    data(i).mask=mask;
end
%
disp('数据读取完毕!');
sData={data,para};
save sData.mat sData;
save info.mat info;

% file=fullfile(nowPath,'feature_extraction');
% movefile('sData.mat',file);

 2.获取ROI区域数据

function [ROIdata] = getROI( sDataPath )

function [ROIdata] = getROI( sDataPath )
%function getROI.m 获得ROI区域
% 第二个函数
%DESCRIPTION:
%读取sData数据,对每个volume和mask进行预处理,调用prepareVolume函数
%INOUTS:sData数据的路径
%OUTPUTS:保存ROIonly,levels,ROIbox,maskBox数据的ROIdata.

load(sDataPath);
nFile=size(sData{1},2);

%获取参数
scanType=sData{1, 2}.scanType;
pixelW=sData{1, 2}.pixelW;
sliceS=sData{1, 2}.sliceS;
R=sData{1, 2}.R;
scale=sData{1, 2}.scale;
textType=sData{1, 2}.textType;
quantAlgo=sData{1, 2}.quantAlgo;
Ng=sData{2}.Ng;

for i=1:nFile
    volume=sData{1}(i).volume;  %获得dcm数据
    mask=sData{1}(i).mask;      %获取标记
    %调用prepareVolume函数获得ROI区域数据
    [ROIonly,levels,ROIbox,maskBox] = prepareVolume(volume,mask,scanType,pixelW,sliceS,R,scale,textType,quantAlgo,Ng);
    ROI(i).ROIonly=ROIonly;
    ROI(i).levels=levels;
    ROI(i).ROIbox=ROIbox;
    ROI(i).maskBox=maskBox;
    fprintf('得到第%d组图像ROI数据\n',i);
end
ROIdata=ROI;
save ROIdata.mat ROIdata;

二、提取灰度特征

  肺结节区域对应的灰度直方图,是表现了肺结节区域每一个像素出现的概率的图像。对每张CT影像ROI区域进行计算,得到灰度直方图。然后根据灰度统计的直方图提取8个灰度特征,用这8个灰度特征来描述肺结节的特点,8个灰度特征分别如下表所示,是方差、标准差、最大像素值、最小像素值、偏离度、峰态、能量和熵。

  代码如下:

function [grayFeature] =get_gray_feature(ROIdataPath)
%function get_gray_feature.m  获取图像的灰度特征
%第三个函数
%DESCRIPTION:读取ROIdata数据,得到灰度直方图。提取灰度特征
%INPUTS:
%ROIdataPath:ROIdata的路径
%OUTPUTS:
%grayFeature:灰度特征
% grayFeature(j).mean:均值
% grayFeature(j).variance:方差
% grayFeature(i).maxP:最大值
% grayFeature(i).minP:最小值
% grayFeature(j).skewness:偏离度
%grayFeature(j).kurtosis:峰态
%grayFeature(j).energy:能量
%grayFeature(j).entropy:熵
%

load(ROIdataPath);%打ROIdata数据
mkdir(cd,'histogram');
%featurePath=fullfile('D:\wuProgram\MATLAB2014b\work\test\feature_extraction_box\feature_extration');
n=size(ROIdata,2);        %文件数量
Ng=size(ROIdata(1).levels,2);       % 灰度级数

%得到所有ROI区域的灰度直方图
for i=1:n
    ROIonly=ROIdata(i).ROIonly;
    histData(i).H=my_hist(ROIonly,Ng);
    %name=strcat(num2str(i),'.jpg');
    %print('name.jpg');
end
save hist.mat histData;
disp('得到灰度直方图');
%.1计算均值mean
for j=1:n
     mean=0;
    for k=0:Ng-1
        H=histData(j).H;
        mean=mean+k*H(k+1);
        grayFeature(j).mean=mean;
    end
end
disp('得到均值');

%2.计算方差variance
for j=1:n
    variance=0;
    for k=0:Ng-1
        mean=grayFeature(j).mean;
        H=histData(j).H;
        variance=variance+((k-mean).^2)*H(k+1);
        grayFeature(j).variance=variance;

    end
    grayFeature(j).deviation=sqrt(variance);
end
disp('得到方差');

%3.计算最大值最小值maxP,minP,
 for i=1:n
     ROIonly=ROIdata(i).ROIonly;
     maxP=max(max(ROIonly));
     grayFeature(i).maxP=maxP;
     minP=min(min(ROIonly));
     grayFeature(i).minP=minP;
 end
disp('得到最大值最小值');

%4.计算偏离度,峰态,能量
for j=1:n
    skewness=0;
    kurtosis=0;
    energy=0;
    for k=0:Ng-1
        H=histData(j).H;
        mean=grayFeature(j).mean;
        deviation= grayFeature(j).deviation;
        skewness=skewness+((k-mean).^3*H(k+1))./(deviation.^3);
        kurtosis=kurtosis+((k-mean).^4*H(k+1))./(deviation.^4);
        energy=energy+H(k+1).^2;
    end
    grayFeature(j).skewness=skewness;
    grayFeature(j).kurtosis=kurtosis-3;
    grayFeature(j).energy=energy;


end
disp('得到偏离度,峰态,能量');

%5.计算熵
entropy=0;
for j=1:n
    for k=0:Ng-1
        H=histData(j).H;
        if(H(k+1)==0)
            entropy=entropy+0;
        else
            entropy=entropy+H(k+1)*log2(H(k+1));
        end
    end
    grayFeature(j).entropy=entropy;
end
disp('得到熵');
save grayFeature.mat grayFeature;
%movefile('grayFeature.mat',featurePath);

三、提取纹理特征

  纹理特征是一类人类视觉可以明显感觉到的特征,同时也是图像的一类重要特征,主要表现为像素在空间分布模式的描述,可以反映图像表示的物体表面的粗糙度、光滑性、颗粒度、随机性等性质。本文采用灰度共生矩阵(GCLM)来提取肺结节CT影像数据的纹理特征。

  灰度特征是基于图像矩阵的特点,利用数学方法构造的灰度共生矩阵,从灰度共生矩阵中得到图像的信息,本文利用设计的肺结节CT影像特征提取系统对选取的9张肺结节CT影像进行特征提取,本文采用灰度共生矩阵方法(GCLM)提取肺结节的纹理特征,这里提取了能量、对比度、相关、熵、差分矩、和平均6个特征。

  代码如下(纹理特征利用了GCLM工具包):

function [textureFeature] = get_texture_feature( ROIdataPath )
%get_texture_feature.m :获取纹理特征
%DESCRIPTION:
%调用以下两个函数得到纹理特征
%[GLCM] = getGLCM(ROIonly,levels);
%[glcmTextures] = getGLCMtextures(GLCM);
%IMPUTS:
%
%OUTPUTS:


load(ROIdataPath);%打ROIdata数据
% featurePath=fullfile('D:\wuProgram\MATLAB2014b\work\test\feature_extraction_box\feature_extration')
n=size(ROIdata,2);        %文件数量
%Ng=size(ROIdata(1).levels,2);       % 灰度级数

for i=1:n
    ROIonly=ROIdata(i).ROIonly;
    levels=ROIdata(i).levels;
    ROIbox=ROIdata(i).ROIbox;
    maskBox=ROIdata(i).maskBox;
    [GLCM] = getGLCM(ROIonly,levels); %调用getGLCM获得GCLM矩阵
    [glcmTextures] = getGLCMtextures(GLCM);%调用getGCLMtextures函数获得GCLM纹理
    textureFeature(i).glcmTextures=glcmTextures;
    fprintf('获取第%d组数据GCLM纹理特征\n',i);
end
save textureFeature.mat textureFeature;
%featurePath=fullfile('D:\wuProgram\MATLAB2014b\work\test\feature_extraction_box\feature_extration');
%movefile('textureFeature.mat',featurePath);

四、提取形态特征数据

  提取了肺结节的大小、周长、面积、重心和形状参数特征,另外根据Hu不变矩算法提取了7个不变矩组作为形态特征。

1、基本形态特征提取代码

function [geometryFeature] = get_geometry_feature(sDataPath)
%function get_geometry_feature.m
%purpose:
%获取几何参数,边界长度perimeter、直径diameter、面积area、重心orthocenter、形状参数shape
%INPUTS:
%sDataPath:存储有mask的数据文件位置
%OUTPUTS:
%geometryFeature:存储有几何特征的数据
load(sDataPath);
n=size(sData{1, 1},2);
for i=1:n
    mask=sData{1, 1}(i).mask;
    perimeter = get_perimeter(mask);
    [diameter,myarea] =get_diameter_area( mask );
    orthocenter = get_orthocenter( mask,myarea );
     shape = get_shape(perimeter ,myarea );
     geometryFeature(i).perimeter=perimeter;
     geometryFeature(i).diameter=diameter;
     geometryFeature(i).myarea=myarea;
     geometryFeature(i).orthocenter=orthocenter;
     geometryFeature(i).shape=shape;
     fprintf('得到第%d组形状参数\n',i);
end

save geometryFeature.mat geometryFeature

2.形态特征提取子函数

function [perimeter] = get_perimeter(mask)
%function get_perimeter :获取周长
%purpose:
%获取mask中的周长
%INPUTS:
%mask:圈出区域
%OUTPUTS:
%perimeter:周长

m_edge=edge(mask);
edgeSpot=find(m_edge==1); %获取边界坐标数组
perimeter=size(edgeSpot,1);
end

function [diameter,myArae] =get_diameter_area( mask )
%function get_diameter_area:获取mask的直径和面积
%description:
%输入mask,值不为0的地方为感兴趣区域,求其直径和面积
%INPUTS:
%mask:处理的矩阵
%OUTPUTS:
%diameter:直径
%area:面积

[m,n]=size(mask);
myArae=0;
diaTemp=[];
k=1;
for i=1:m
    for j=1:n
        if(mask(i,j)~=0)
            myArae=myArae+1;   %计算面积
            diaTemp(k,1)=i;  %区域存储坐标
            diaTemp(k,2)=j;
            k=k+1;
        else
            continue;
        end
    end
end

n=size(diaTemp);
length=[];
k=1;
for i=1:n
    for j=i+1:n
        length(k)=sqrt((diaTemp(j,1)-diaTemp(i,1)).^2+(diaTemp(j,2)-diaTemp(i,2)).^2);%计算任意两个坐标间的距离
        k=k+1;
    end
end

diameter=max(length);%得到最大距离,即直径
end

function [orthocenter] = get_orthocenter( mask,area )
%function get_orthocenter:获取mask重心
%description:
%获取mask区域重心
%INPUTS:
%mask:需要计算的的图像
%OUTPUTS:
%orthocenter:重心

[m,n]=size(mask);
xTemp=0;
yTemp=0;

for i=1:m
    for j=1:n
        if(mask(i,j)~=0)
            xTemp=xTemp+i;
            yTemp=yTemp+j;
        else
            continue;
        end
    end
end
orthocenter.x=ceil(xTemp/area);
orthocenter.y=ceil(yTemp/area);

end

function [shape] = get_shape(perimeter ,area )
%function get_shape:获取形状参数
%description:
%获取mask形状参数
%INPUTS:
%perimeter ,area区域的mask需要计算的的图像的周长,面积
%OUTPUTS:
%shape:形状参数

shape=(perimeter.^2)/(4*pi*area);
end

  上述为肺结节CT影像特征提取系统主要部分代码,部分工具包代码过长,无法贴出。

04-19 15:50