我想使用一些PDF,txt,html非结构化数据来训练诸如IBM Watson之类的机器学习系统,然后提出问题并通过API调用获得答案。我该如何实现?基于GUI的培训或基于API的培训。从Bluemix,很难确定哪种服务最能满足此要求。您能建议最好的选择吗?
最佳答案
检索和排名-检索和排名可以显示来自文档集合的最相关的信息。例如,使用R&R,经验丰富的技术人员可以从密集的产品手册中快速找到解决方案。联络中心座席也可以快速找到答案,以缩短平均呼叫处理时间。 “检索和排名”服务“开箱即用”,但也可以自定义以改善结果。更多详细信息here
发现服务-通过转换,规范化和丰富化从非结构化数据中提取价值。使用简化的查询语言来浏览该数据或快速利用诸如Discovery News集合之类的预先丰富的数据集。更多详细信息here
关于machine-learning - 如何从非结构化文本(pdf,txt,html)构建语料库并训练IBM Watson?然后通过API调用问问题?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43308506/