本文介绍了Hpricot-UTF-8问题的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
运行以下代码时出现以下错误:
I get the following error when running the code below:
invalid byte sequence in UTF-8 (ArgumentError)
代码:
require 'hpricot'
require 'open-uri'
doc = open('http://www.amazon.co.jp/') {|f| Hpricot(f.read) }
puts doc.to_html
Hpricot无法解析日语内容.关于解决此问题有什么建议吗?
Hpricot cannot parse the Japanese content. Any suggestions on fixing this issue?
推荐答案
该站点似乎未使用UTF-8:<meta http-equiv="content-type" content="text/html; charset=Shift_JIS" />
.
The site doesn't seem to be using UTF-8: <meta http-equiv="content-type" content="text/html; charset=Shift_JIS" />
.
尝试以下方法:
open('http://www.amazon.co.jp/') {|f| Hpricot(f.read.encode("UTF-8")) }
这篇关于Hpricot-UTF-8问题的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!