Closed. This question needs to be more focused。它当前不接受答案。
                            
                        
                    
                
                            
                                
                
                        
                            
                        
                    
                        
                            想改善这个问题吗?更新问题,使其仅通过editing this post专注于一个问题。
                        
                        4年前关闭。
                                                                                            
                
        
这些问题是不言自明的。但是,有关更多背景信息,我正在一家中型公司中工作。我们有许多有关类似错误,类似问题等的客户支持请求。我们使用模板来回复许多电子邮件。

我如何开始将机器学习应用于此过程以自动执行回复?我想向我们的支持代表发送文本回复,他们可以对这些支持代表进行最少的编辑并发送出去。

谢谢!

最佳答案

我认为在这个答案中您具有一定的机器学习背景。我还假设问题得到了一些简化,您只想将来自客户的电子邮件与现有的错误/问题/类别相匹配(然后您可以提出支持部门的所有答复)。

在尝试应用机器学习时,请记住以下一些启发式方法:


了解数据
了解客户的解决方案
首先尝试简单的事情
20%的努力将带来80%的结果(称为帕累托原理)
在开发框架/数据集上花费大量时间来测试解决方案
最好的机器学习解决方案通常是赋予人类权力而不是代替人类的解决方案
准确性通常来自系统的其他部分而不是模型(例如,让用户标记他的电子邮件)


我的一般建议是,首先尝试着重于一些常见的问题/错误(例如,将电子邮件排在前50%的目标),收集数据集并评估是否可以获得一些实际结果。尝试解决排序问题“在top5结果中带入正确的电子邮件模板”。

对于可以解决此类问题的实际模型,这是开放式的,没有好的答案。我的直觉是,会有一些词可以很好地描述一些常见的问题/错误,对于罕见的问题/错误,我们将无法获得任何有用的准确性(除非使用复杂的功能,否则我们将无法在尝试简单的功能之前使用这些功能)并获得有关问题的直觉)。

朴素贝叶斯在NLP上下文中往往表现出令人惊讶的出色表现,并且也易于解释。您可以按照以下步骤操作:


做一些常规的数据分析:每个错误的电子邮件数量分布是什么。给定错误的电子邮件看起来是否相似?
如果上一步有希望的结果,请尝试组装数据集
现在您可以尝试使用类似NB的模型(scikit-learn中的示例很容易理解,例如http://scikit-learn.org/stable/auto_examples/text/mlcomp_sparse_document_classification.html#example-text-mlcomp-sparse-document-classification-py


请注意,NB应该经过交叉验证
对于度量,我假设您要使用top5和top1简单精度
在scikit-learn中,您可以轻松地交换分类器。
一定要研究可以作为预测力的单词,并对问题有一定的直觉。
如果您决定对稀有类进行评估,那么对于像多类分类这样的简单处理而言,它可能太稀疏了。您可能想研究相似性搜索或聚类,但是在此阶段我将不专注于此。

向解决方案的最终用户显示结果。有帮助吗?这样可以节省多少时间?
取得初步成果-您是否想投资使其能够投入生产?您认为可以提高准确性还是太难了?


这个答案非常高,但是很难在没有更多信息的情况下提出更复杂,更合理的解决方案(例如先尝试简单的模型):)

关于machine-learning - 希望使用机器学习来自动化客户服务。如何应用机器学习生成对客户的文本回复? ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32162404/

10-12 23:13