假设我在 Chrome 中打开一个网站,它是俄语的。 Chrome 告诉我它是俄语的,并愿意为我翻译。如何使用 C# 找出网页的语言?很喜欢找出实际的语言,如英语、西类牙语、俄语等。
最佳答案
您可以尝试解析页面头部的 <meta http-equiv="language" content="ru" />
和 <meta http-equiv="content-language" content="ru" />
标签。
通常这些标签并非在每个页面上都可用。
我认为如果缺少这些标签,Google 会在内部数据库中进行“单词查找”,以尝试确定页面最可能使用的语言。
编辑
您还可以使用 SOAP API of Bing 来检测语言。
他们网站上的一个例子:
var client = new TranslatorService.LanguageServiceClient();
var result = client.Detect(
"myAppId",
"I have no idea what this language may be");
Console.WriteLine("The detected language friendly code is: " + result);
只需从要检测的 HTML 页面中提取一些文本(例如使用 HTML Agility Pack )并将其传递给 SOAP 函数。
关于c# - 如何在 C# 中找出网页的语言(不是编程!),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6722737/