OWL本体语言和Protege本体编辑器
演讲稿原作者:Wala Abdulaziz
译者:Wu Di (pimgeek)
转载、编辑:Tan Liwei
原文发布日期:2013年6月5号
原文链接:https://prezi.com/ggozsbzy2xn-/owl-protege/
什么是本体(Ontology)?
在计算机科学和信息科学中,本体的作用是表达知识.在本体中,知识可以被正式地表达为一系列的领域相关概念,以及这些概念之间的相互关系.
本体可以被用来为一个知识领域建立模型,并且支持对这个模型中的实体进行推理.
我们为什么需要本体?
本体的重要作用?
- 利用本体,可以在不同的人或应用程序之间共享一组有结构的信息,并达成理解上的共识.(补充:消除歧义、去重)
- 允许我们重复使用领域知识:当我们已经拥有了关于某个知识领域的本体时,我们可以把同一个本体应用于不同的应用程序中,这就可以避免重新发明轮子.
- 可以把知识领域内的(内行人不言自明的)前提假设明确地表达出来.
- 把领域知识与操作性知识区分开.
- 利用概念之间的已适当建立的关系分析领域知识.
本体工程的流程
- 确定知识领域.
- 列举出这个领域里会用到的术语.
- 定义一些可以表达领域内概念的类(class).
- 定义每个类的属性,以便将他们链接起来.
- 定义约束条件, 以便限制类和属性.
- 从类出发创建一些实例
Web 本体语言(OWL)
- 一种用来定义Web本体的语言.
- 一个OWL的本体可以包含关于类,属性及其实例的描述.
- 当给定了一个这样的本体时,OWL的形式化语义允许我们由本体自动推导出一些符合逻辑的结论.
什么是Protégé?
- Protege 是一个图形界面的本体开发工具,它支持丰富的知识模型
- Protege 是开源的,并且可以免费获取
OWL 本体的组成单元
(1) 个体
- 个体代表知识领域中我们感兴趣的那些具体对象.
- 个体有时候也被称作实例.
- 个体也可以被称作"属于某个类的实例".
(2) 属性
属性是个体之间的二元关系. 换句话说, 属性把一对个体链接起来.
(3) 类
(3) 类
- OWL的类可以被理解为包含若干个体的集合
- 类需要被形式化地描述出来,这些描述精确界定了究竟个体能否成为某个类的成员的"准入标准"
- 不同的类可以被组织为体现父类子类关系的树形大纲结构
披萨饼范例本体
当前活动的本体
类
- 披萨饼本体中有很多类
- 子类: 在OWL 中表示隐含关系
- 不相交的类: 把一组类区分开来(如果A类与B类不相交,那么属于A类的个体不可能同时属于B类)
- 我们让以下四个类不相交
IceCream
Pizaa
PizzaBase
PizzaTopping
OWL的属性
对象属性:
对象属性是一对个体之间的关系,它从某一个体出发,链接到另一个体.
对象属性是一对个体之间的关系,它从某一个体出发,链接到另一个体.
数据属性:
数据属性是个体与某个数据取值之间的关系.
标注属性:
标注属性被用来为类,个体,对象属性/数据属性等添加信息(元信息,或者所谓的关于数据的数据). 译者注: 标注属性本身也可添加标注属性.
对象属性
对象属性
- hasCountryOfOrigin (拥有发源地国家)
- hasIngredient: (拥有组成要素)
haseBase (拥有面饼)
hasTopping (拥有覆盖食材) - hasSpiciness (拥有辛辣口味)
- isIngerdientOf:
isBaseOf
isToppingOf
对象属性的特性
函数型特性
函数型特性(Functional Properties):
如果一个对象属性是函数型的, 那么借助这个属性,某个体a只能连接到唯一的个体b
函数型特性也被称作单值特性
例如:
hasBase property.
(一个披萨只能拥有一个面饼)
hasBase property.
(一个披萨只能拥有一个面饼)
反向函数型特性(Inverse Functional Properties):
如果一个对象属性具有反向函数型特性,那么这意味着它的反向属性具有函数型特性.
例如:
(1) isIngredientOf (多对一)
(2) hasIngredient (一对多)
传递型特性(Transitive Properties):
如果一个对象属性P是传递型的,那么如果个体a通过属性P关联到b,且b又通过属性P关联到c,那么我们就可以推得:a一定可以通过属性P直接关联到c.
对称型特性(Symmetric Properties):
如果属性P是对称的, 并且个体a 通过属性P与个体b 发生关联,那么我们可以推得b 也一定通过属性P与a 发生关联.
如果一个对象属性P是传递型的,那么如果个体a通过属性P关联到b,且b又通过属性P关联到c,那么我们就可以推得:a一定可以通过属性P直接关联到c.
对称型特性(Symmetric Properties):
如果属性P是对称的, 并且个体a 通过属性P与个体b 发生关联,那么我们可以推得b 也一定通过属性P与a 发生关联.
非对称型特性(Asymmetric properties):
如果属性P是非对称的, 并且个体a 通过属性P与个体b 发生关联,那么我们可以推得b 不可能通过属性P与a 发生关联.
对象属性的定义域和值域
对象属性把来自定义域的个体链接到来自值域的个体.(但这种规定并不被用来限制个体).当一对个体 a 和 b 可以被这个对象属性关联时,即使它们并没有被明确地分配给任何类,我们也能推出 a 一定属于定义域所对应的类,而 b 则一定属于值域所对应的类.
推理机(Reasoner)
推理机是Protege 的重要功能之一. 我们不仅可以用推理机判定一个类的定义是否一致,还能利用充分必要条件发现一些隐含的信息.
一致性检查
检查一个(译者注:按规则形成的)类是否不可能包含任何个体.
自动分类
给定一个包含了很多类的树形结构,分类器能够把其中的一些类自动归集到对应的分支上去.(译者注:分类器是推理机的一部分,不仅可以对类做自动归集,还可以对个体做自动归集.)
分类器
当推理得出的类呈现红色时,这表示这些类是不一致的.(如下图:)
在本体理论中,不一致表示这样的类不可能拥有任何个体.
CheeseyVegetableTopping 类是不一致的, 那是因为我们给它设定了两个没有交集的父类, CeeeseTopping 和 VegetableTopping.
说明:
如果我们取消CheeseToppping 与 VegetableTopping之间的互不相交关系,然后再次开动分类器,那么CheeseyVegetableTopping这个类就不再是不一致的了.
OWL可视化(OWLViz)
- OWLViz 插件可以被用来在我们已定义好的类结构中四处游走和查看
- 检查类的一致性,并且用树的形状展示逻辑意义.
- 在包含很多类,而且部分类的父类也很多的大型本体库中,这个插件很有用.
OWLViz 提供了:
- 以声明方式形成的类的层级关系
- 以推理方式形成的类的层级关系
以声明方式形成的类:
以推理方式形成的类
不一致的类
(上图中)存在不一致性的类,在图中以红色高亮显示.
为披萨饼本体增加一些其它类(比如饮料类)
有困惑吗?
有困惑吗?
参考资料
(1) Ontology (information science): http://en.wikipedia.org/wiki/Ontology_(information_science)
(2) Natalya F. Noy, Deborah L. McGuinness, Ontology Development 101: A Guide to Creating Your First Ontology, Stanford, Available from:
http://www.ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf
(3) What is protégé?: http://protege.stanford.edu/overview/index.html
(4) W3C,(2004)OWL Web Ontology Language Guide: http://www.w3.org/TR/owl-guide/
(5) Protégé Glossary:
http://protegewiki.stanford.edu/wiki/Pr4_UG_mi_Glossary#FaCT.2B.2B
(6) Matthew Horridge, (2011) A Practical Guide To Building OWL Ontologies
Using Protege 4 and CO-ODE Tools [online] Manchester, Available from:
http://owl.cs.manchester.ac.uk/tutorials/protegeowltutorial/resources/ProtegeOWLTutorialP4_v1_1.pdf