我想使用Google在C#中不使用api来翻译各种语言的字符串。
这是我的代码:

public string TranslateWithGoogle(string input, string languagePair)
{
    try
    {
        string url = String.Format("http://www.google.com/translate_t?hl=en&ie=UTF8&text={0}&langpair={1}", input, languagePair);
        WebClient webClient = new WebClient();
        webClient.Encoding = System.Text.Encoding.Default;
        string result = webClient.DownloadString(url);
        result = result.Substring(result.IndexOf("<span title=\"") + "<span title=\"".Length);
        result = result.Substring(result.IndexOf(">") + 1);
        result = result.Substring(0, result.IndexOf("</span>"));
        return result.Trim();
    }
    catch (Exception exc)
    {
        MessageBox.Show(exc.ToString());
        return string.Empty;
    }

}


因此,现在使用C#与直接使用浏览器进行测试时,我使用以下代码:

string strSource_String = "Debug offline mode";
string strSource_Language = "en";
string str_It = TranslateWithGoogle(strSource_String, strSource_Language+"|it");
string str_Fr = TranslateWithGoogle(strSource_String, strSource_Language + "|fr");
string str_De = TranslateWithGoogle(strSource_String, strSource_Language + "|de");
string str_Ru = TranslateWithGoogle(strSource_String, strSource_Language + "|ru");
string str_Bg = TranslateWithGoogle(strSource_String, strSource_Language + "|bg");
string str_Cz = TranslateWithGoogle(strSource_String, strSource_Language + "|cz");
string str_Pl = TranslateWithGoogle(strSource_String, strSource_Language + "|pl");


结果C#/浏览器为:


  它
  
  C#:“ Esegui il离线调试”
  
  浏览器:“ Esegui il离线调试”


好!而且àchar是正确的


  FR
  
  C#:“Déboguerle mode hors connexion”
  
  浏览器:“Déboguerle mode hors connexion”


好!而且échar是正确的


  俄语
  
  C#:“Ðåæèìîòëàäêèâààâîíîìíììðåæèìå”
  
  浏览器:“Режимотладкивавтономномрежиме”


错误的:-(

保加利亚语和捷克语也有同样的问题。
我试图更改所有webClient.Encoding = System.Text.Encoding.Default;选项,但这没有帮助。

感谢您的帮助

帕特里克

最佳答案

如果您检查返回的HTML的标题部分,您将看到它使用了字符集“ windows-1251”-专用于西里尔字母。您需要为此设置编码。

在下载页面之前,可能有更好的方法来获取标题信息,但是如果您愿意两次下载页面-那么可以检查所使用的字符集,如果它是“ windows-1251”,则更改编码并再次下载。

就像是 :

string result = webClient.DownloadString(url);
if (result.Contains("windows-1251"))
{
  webClient.Encoding = System.Text.Encoding.GetEncoding("windows-1251");
  result = webClient.DownloadString(url);
}
else if (result.Contains("ISO-8859-2"))
{
  webClient.Encoding = System.Text.Encoding.GetEncoding("ISO-8859-2");
  result = webClient.DownloadString(url);
}


您可能需要对其进行修改,以确保“ Windows-1251”位于标题部分

关于c# - C#Google翻译不带api和unicode,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50963296/

10-13 08:11