因此,我想知道是否有一种使用NLP /机器学习标记/标记电视或电影文件的方法。

我知道已经有很多正则表达式方法可以做到这一点,但是使用NLP / Machine Learning也不能做到这一点吗?

例:
The.Heart.Guy.S01E07.Die.Belastungsprobe.German.DL.720p.HDTV.x264-GDR

应该是这样的:

The Heart Guy SHOW-NAME1 SEASON7 EPISODEDie Belastungsprobe EP-NAMEGerman DL LANGUAGE720p RESOLUTIONHDTV SOURCEx264 CODECGDR GROUP

有人尝试过这样的事情吗?或任何提示应该从哪里开始,或者是否有可能获得类似的效果。

最佳答案

机器学习方法的成本要比基于规则的方法高。但是,如果您想尝试机器学习解决方案,我想到的最好的解决方案是使用markov模型,因为问题具有顺序观察结果,并且可以使用有限状态自动机进行处理。您可以将此paper用作参考。

关于machine-learning - 将电视和电影文件名与NLP/机器学习匹配吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44903535/

10-12 19:39