我已经学习wit.ai好几天了。我发现了wit.ai机器人引擎的关键点:

  • 基于故事的故事-创建问候故事,订购比萨饼,订购笔记本电脑,询问天气预报
  • 基于角色的实体-位置:表单,位置:收件人。此处“从”和“到”是“位置”实体
  • 的角色
  • 复合/嵌套实体-汽车(型号,颜色,modelYear)。在这里,模型,颜色,模型年份可以嵌套在汽车实体
  • 搜索策略:特征,自由文本,关键字
  • 通过创建一些故事来了解机器人
  • 比赛得分被称为信心
  • 最大
  • 处的用户表达式长度256
  • 从预定义的关键字列表中搜索匹配的表达式
  • 嵌套上下文
  • 用户定义的实体,预定义的实体
  • 基于实体的操作:如果只有,如果始终有条件,则为
  • 对于给定的用户表达式,机智在关键字列表中搜索匹配项,自由文本
  • 对于给定的用户表达式,机智在实体
  • 下搜索列出的表达式中的关键字位置
  • 在给定的用户表达式
  • 中缺少信息的分支
  • 机智的代词支持吗?不
    故事1用户:Widget X 2000多少钱?机器人:它的价格是30美元。故事2用户:在哪里可以买到Widget X 2000? Bot:在您本地的百思买。
    故事2
    用户:Widget X 2000多少钱?机器人:它的价格是30美元。用户:我在哪里可以买到它? - 错误 -
    使用上下文
  • 尚未实现 session 感知的实体提取
  • 是否可以使wit.ai机器人记住/重用故事中的上下文?检查context.key是否存在
  • 是否可以在Wit.ai中设置默认意图?否,可以检查置信度值,设置置信度阈值,低于阈值特定响应
  • 您可以在Wit.ai中按优先级对实体进行排名吗?没有

  • 现在,我想知道wit如何检测用户表达的意图,并使用wit.ai中创建的bot的故事对实体进行分类。

    如果有人了解wit.ai中使用的基础技术/ML算法,请在此线程中分享。我希望它将对像我这样的人有所帮助。

    提前致谢。

    最佳答案

    wit.ai的两个主要部分是:

  • 意图分类
  • 实体提取

  • 对于实体提取,它使用了duckling库,他们最近开放了该库的源代码,您可以在此处找到有关算法的详细说明。

    对于意图分类,我想他们使用基于词袋的文本分类方法或更高级的词嵌入方法(例如word2vec)。

    您还可以查看上述两项任务的相似的完全开源项目,例如RasaspaCy

    关于machine-learning - wit.ai : how does it identify intent and classifies entities from user expressions,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42802400/

    10-12 22:05