我想使用印地语(非英语)中的一些音频数据的PESQ,STOI分数。对于英语,我可以找到PESQ算法/代码并使用相同的代码。像:-StackOverflow question,Python pesq(PyPI) STOI。
我们是否可以对印地语或其他语言的音频使用相同的代码来确定PESQ / STOI分数?
大多数时候,我发现PESQ用于“语音质量评估”(不是英语专用)。同样在PESQ score comparison in different languages PESQ score comparison in different languages_2中,他们刚刚比较了不同语言的PESQ分数。他们没有为他们使用不同的代码。
但是有些像A Methodology for Improving PESQ accuracy for Chinese Speech的论文
,写在结论部分:“本文正在评估PESQ,以研究在计算语音质量时是否考虑了汉语语音的辅音和声调清晰度。在进行的两个实验中,发现在嘈杂和安静(无噪声)的情况下,主观清晰度与PESQ的计算质量之间的相关性都很低”,
并且在Performance Evaluation and Accuracy Upgrading ofPESQ in Chinese Environment 中,结论部分提到:-“通过此结果
大量的主观测试数据,反复指出
PESQ的中文分数被低估了,
尽管皮尔逊相关系数高达
除外。 PESQ的得分远低于经验
语音服务在中间时来自客户
质量。 ”
因此,对于其他语言(当前,我的情况是印度语,印度语),我应该直接使用常规的PESQ方法还是必须对其进行修改?如果我必须进行修改,那么任何适用于某些印度语言(或英语以外的其他语言)的想法都将非常有帮助。
最佳答案
不知道您是否仍然需要建议,只需对您的问题发表一些评论: