我已经研究了默认的UIMA Ruta Workbench Eclipse项目,足以充分了解其活动部分-例如,为什么input/
和output/
文件夹的行为与众不同,如何使用jcasgen
和其他Maven插件完成项目等
但是,即使经过数小时的研究项目并与Maven一起尝试使其工作,我仍然在做一些非常简单的事情上仍然遇到很多麻烦:使用DKPro
脚本中的Ruta
库(尤其是类型)。
我的基本问题是:在Ruta脚本中使用DKPro和TC库中的类型和分析组件的最小持久性的途径是什么?
我的具体问题是:
我注意到,在许多desc/type
jar的api
文件夹中,有TypeSystemDescription
XML文件似乎适合与Ruta一起使用。是否可以通过某种方式为TypeSystemDescription
组件获取“主” DKPro
XML文件?
是否有一个我可以学习的同时使用Ruta
和DKPro
的非常复杂的项目?
使用AnalysisEngine
脚本所做的Ruta
与用Java编写的Analysis Component
有什么区别?
编辑以减少挫败感
最佳答案
实际上,Ruta和DKPro的人在一起做工,然后在篝火旁快乐地坐着-或至少在鸡尾酒吧里喝点饮料。不幸的是,我们不是经常这样做。
您要问的问题的种类和数量要求教程;)
您看过我们joint workshop at GSCL 2013中的幻灯片和示例了吗?
它包含有关如何一起使用DKPro Core和Ruta的几个示例。在这些示例中,有一个Maven项目负责获取DKPro Core依赖关系,然后单独的Ruta项目对该Maven项目具有依赖关系并使用分析引擎。
一个具有Ruta和Maven性质的项目也应该起作用。
为类路径中的所有DKPro Core类型(或类路径中的所有启用uimaFIT的类型)获取单个类型描述符的方法是
import org.apache.uima.fit.factory.TypeSystemDescriptionFactory;
OutputStream os = ...
TypeSystemDescriptionFactory.createTypeSystemDescription().toXML(os);
检出GSCL 2013 tutorial examples。
AnalysisComponent
表示从内部看的视图,即从组件开发者的角度来看(从框架内部的视图)。 AnalysisEngine
代表从外部观看的视图,即从组件/工作流的用户观看的视图。但是,通常会说“我正在实现一个新的分析引擎”,意思是“我要对JCasAnnotator_ImplBase
进行子类化(AnalysisComponent
的实现)”。另请参见UIMA开发人员邮件列表上的this post。披露:我是DKPro Core开发人员和Apache UIMA开发人员。
关于eclipse - 您应该/如何将DKPro库与UIMA Ruta一起使用?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33973273/