本文介绍了Hpricot-UTF-8问题的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

运行以下代码时出现以下错误:

I get the following error when running the code below:

invalid byte sequence in UTF-8 (ArgumentError)

代码:

require 'hpricot'
require 'open-uri'

doc = open('http://www.amazon.co.jp/') {|f| Hpricot(f.read) }
puts doc.to_html

Hpricot无法解析日语内容.关于解决此问题有什么建议吗?

Hpricot cannot parse the Japanese content. Any suggestions on fixing this issue?

推荐答案

该站点似乎未使用UTF-8:<meta http-equiv="content-type" content="text/html; charset=Shift_JIS" />.

The site doesn't seem to be using UTF-8: <meta http-equiv="content-type" content="text/html; charset=Shift_JIS" />.

尝试以下方法:

open('http://www.amazon.co.jp/') {|f| Hpricot(f.read.encode("UTF-8")) }

这篇关于Hpricot-UTF-8问题的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

11-01 14:20