创建: 2017/08/05

更新: 2018/01/08 修正: ele_inner_text -> ele.inner_text

                          补充: inner_text和text一样

 第一步  gemfile里面加上

# 2017/08/05  拉取数据
 这行是注释,自己随便写点啥
gem 'mechanize'
 第二步 bundle install
在项目目录下运行,安装Mechanize
 第三步 新建文件 scraping.rb
 位置 app/models
 先自己标点注释,
 实际第一行加上 require 'mechanize'
 
 
 
 
 
 
 
 
  
  
  
  
 
 Mechanize方法
 创建 agent = Mechanize.new
 读取 page = agent.get('...')

''内部放网址

 获取特定标签内容
 满足条件的所有内容
 elements = page.search('..')
 获取标签内部文本  elements.each do |ele|
    puts ele.inner_text
 end
 获取特定标签内容
 满足条件的一个内容
 elements = page.at('..')
 获取内部属性 elements.each do |ele|
    link =
ele.get_attribute(:href)
 end

或者简写为ele[:href]

  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
05-11 15:34
查看更多