我已经研究了默认的UIMA Ruta Workbench Eclipse项目,足以充分了解其活动部分-例如,为什么input/output/文件夹的行为与众不同,如何使用jcasgen和其他Maven插件完成项目等

但是,即使经过数小时的研究项目并与Maven一起尝试使其工作,我仍然在做一些非常简单的事情上仍然遇到很多麻烦:使用DKPro脚本中的Ruta库(尤其是类型)。

我的基本问题是:在Ruta脚本中使用DKPro和TC库中的类型和分析组件的最小持久性的途径是什么?

我的具体问题是:


我注意到,在许多desc/type jar的api文件夹中,有TypeSystemDescription XML文件似乎适合与Ruta一起使用。是否可以通过某种方式为TypeSystemDescription组件获取“主” DKPro XML文件?
是否有一个我可以学习的同时使用RutaDKPro的非常复杂的项目?
使用AnalysisEngine脚本所做的Ruta与用Java编写的Analysis Component有什么区别?


编辑以减少挫败感

最佳答案

实际上,Ruta和DKPro的人在一起做工,然后在篝火旁快乐地坐着-或至少在鸡尾酒吧里喝点饮料。不幸的是,我们不是经常这样做。

您要问的问题的种类和数量要求教程;)

您看过我们joint workshop at GSCL 2013中的幻灯片和示例了吗?

它包含有关如何一起使用DKPro Core和Ruta的几个示例。在这些示例中,有一个Maven项目负责获取DKPro Core依赖关系,然后单独的Ruta项目对该Maven项目具有依赖关系并使用分析引擎。

一个具有Ruta和Maven性质的项目也应该起作用。


为类路径中的所有DKPro Core类型(或类路径中的所有启用uimaFIT的类型)获取单个类型描述符的方法是

import org.apache.uima.fit.factory.TypeSystemDescriptionFactory;

OutputStream os = ...
TypeSystemDescriptionFactory.createTypeSystemDescription().toXML(os);

检出GSCL 2013 tutorial examples
AnalysisComponent表示从内部看的视图,即从组件开发者的角度来看(从框架内部的视图)。 AnalysisEngine代表从外部观看的视图,即从组件/工作流的用户观看的视图。但是,通常会说“我正在实现一个新的分析引擎”,意思是“我要对JCasAnnotator_ImplBase进行子类化(AnalysisComponent的实现)”。另请参见UIMA开发人员邮件列表上的this post


披露:我是DKPro Core开发人员和Apache UIMA开发人员。

关于eclipse - 您应该/如何将DKPro库与UIMA Ruta一起使用?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33973273/

10-10 02:18