基本上根据说话者来组织内容?

摘自:罗伯特·路易斯·史蒂文森。 “杰基尔博士和海德先生的奇怪案例。”

输入示例:


  但是Lanyon的脸变了,他举起了颤抖的手。 “我不希望再见到杰基尔博士了,”他大声地说道。 “那个人我已经受够了;我求求你,请避免对我认为已死的人提任何提法。


示例输出:

[

“Narrator”: “But Lanyon's face changed, and he held up a trembling hand.”,

“Lanyon”: “I wish to see or hear no more of Dr. Jekyll”,

“Narrator”: “he said in a loud, unsteady voice.”,

“Lanyon”: “I am quite done with that person; and I beg that you will spare me any allusion to one whom I regard as dead.”

]

最佳答案

我还没有听说过能做到这一点的算法。但是,存在两个可能有用的众所周知的问题:命名实体识别(查找所有潜在讲话者)和回指解析(确定每种情况下的“他”或“她”是谁)。

您还需要训练一个分类器,以便为每个引用的文本块确定它是否是直接语音。而且,您可能需要另一个分类器来为每个确定的语音片段和上下文中的每个确定的说话者决定,该语音实际上属于该说话者的可能性有多大。

08-20 04:37