目前,很多特征选择文献主要是依据对共信息的直观认识使用它,即:正值表示表型的存在使特征间依赖程度增加,是特征间存在相互作用的证据;负值表示表型的存在使特征间冗余性增加;零表示特征是相互独立的,或者说,是特征间的增益与冗余相互抵消了。因此,从理论上深入认识共信息是一项创新工作。
识别阶段的第一项工作是使用共信息测度穷举搜索候选 SNP 集合中的 SNP 交互作用。当 SNP 组合中所有 SNP 与表型的共信息为正时,说明表型使 SNP 间的依赖程度增加了,是 SNP 组合与表型间存在相互作用的证据。因此,将该 SNP 组合保留并进一步使用置换检验测度评价。当 SNP 组合中所有 SNP 与表型的共信息为非正时,说明 SNP 组合与表型间存在着冗余关系。因此,将该 SNP 组合过滤,后面不再考虑。
一个 SNP 对表型的总效应,不仅包括其单独作用对表型的效应 (主效应) ,还包括该 SNP 通过与其它 SNP 共同作用影响表型效应中的自身部分(边际效应)