粗糙集理论(Rough Set Theory)



一种数据分析处理理论。

《粗糙集—关于数据推理的理论》。

数据挖掘(Data Mining)和知识发现(KDD)。

集合近似定义的基本思想及其应用和粗糙集合环境下的机器学习基础研究。

在粗糙集中使用信息表(information table) 描述论域中的数据集合.信息表的形式和大家所熟悉的关系数据库中的关系数据模型很相似,是一张二维表格。

数据库(数据挖掘)、粗糙集、粗糙集合论、集合A(列表)、对象、属性(条件属性,决策属性)、论域、知识、知识库、知识系统、集合的划分(划分关系)、近似集合(上近似,下近似)。

在所有的现有知识里面找出跟他最像的两个一个作为下近似,一个作为上近似。下近似集是在那些所有的包含于X(A上的子集合X)的知识库中的集合中求并得到的(包含在X内的最大可定义集),而上近似则是将那些与X有交集的知识库中的集合求并得到的(包含X的最小可定义集)。

下近似集合=X集合内可区分对象的集合。

上近似集合=下近似集合∪X中对象不可区分的所有对象的集合。

一般的,我们可以用下面的图来表示上、下近似的概念。

粗糙集理论(Rough Set Theory)-LMLPHP粗糙集理论(Rough Set Theory)-LMLPHP

这其中曲线围的区域是X的区域,蓝色的内部方框是内部参考消息,粗糙集理论(Rough Set Theory)-LMLPHP是下近似 ,绿的是边界加上蓝色的部分粗糙集理论(Rough Set Theory)-LMLPHP就是上近似集。其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。

研究方向

理论:①利用抽象代数来研究粗糙集代数空间这种特殊的代数结构。②利用拓扑学描述粗糙空间。③还有就是研究粗糙集理论和其他软计算方法或者人工智能的方法相接合,例如和模糊理论、神经网络、支持向量机、遗传算法等。④针对经典粗糙集理论框架的局限性,拓宽粗糙集理论的框架,将建立在等价关系的经典粗糙集理论拓展到相似关系甚至一般关系上的粗糙集理论。

应用领域:粗糙集理论在许多领域得到了应用,①临床医疗诊断;②电力系统和其他工业过程故障诊断;③预测与控制;④模式识别与分类;⑤机器学习和数据挖掘; ⑥图像处理;⑦其他。

基于粗糙集的特征选择称为属性约简。

算法:一方面研究了粗糙集理论属性约简算法和规则提取启发式算法,例如基于属性重要性、基于信息度量的启发式算法,另一方面研究和其他智能算法的结合,比如:和神经网络的结合,利用粗糙集理论进行数据预处理,以提高神经网络收敛速度;和支持向量机SVM结合;和遗传算法结合;特别是和模糊理论结合,取得许多丰硕的成果,粗糙理论和模糊理论虽然两者都是描述集合的不确定性的理论,但是模糊理论侧重的是描述集合内部元素的不确定性,而粗糙集理论侧重描述的是集合之间的不确定性,两者互不矛盾,互补性很强,是当前国内外研究的一个热点之一。

05-21 23:26