Para quem detesta a interface do classificados do Diário do Nordeste (Fortaleza):
#!ruby
require ‘rubygems’
require ‘hpricot’
require ‘open-uri’
doc = Hpricot(open(”http://diariodonordeste.globo.com/classif/consultando.asp?Filtro=#{$*[0]}&Operador=OU&Filtro2=”))
doc.search(”.anuncio”).each do | anuncio |
puts ‘****’
puts anuncio.inner_text.strip
puts anuncio.inner_text.scan(/[0-9]{4}+\.[0-9]{4}+/)
end
Para usar:
ruby diario.rb notebook
