Para quem detesta a interface do classificados do Diário do Nordeste (Fortaleza):
#!ruby
require 'rubygems'
require 'hpricot'
require 'open-uri'
doc = Hpricot(open("http://diariodonordeste.globo.com/classif/consultando.asp?Filtro=#{$*[0]}&Operador=OU&Filtro2="))
doc.search(".anuncio").each do | anuncio |
puts '****'
puts anuncio.inner_text.strip
puts anuncio.inner_text.scan(/[0-9]{4}+\.[0-9]{4}+/)
end
Para usar:
ruby diario.rb notebook

1 response so far ↓
1 tiago barreto // Sep 16, 2008 at 3:12 pm
hey man.. isso é manero! vou usar e vou passar pra um amigo meu que tá precisando dessa parada.. valeu! di boa! =)
Leave a Comment