1 Star 0 Fork 1

mygoare/douban-zufang

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
capture.rb 640 Bytes
一键复制 编辑 原始数据 按行查看 历史
mygoare 提交于 2013-09-16 12:23 . 提取出href, title, date
# encoding: utf-8
require "open-uri"
require "uri"
douban_url = URI.escape("http://www.douban.com/group/search?group=146409&cat=1013&q=静安")
t = Time.new(2013,9,12)
open(douban_url) { |f|
content = f.read()
links = content.scan(/<tr class=\"pl\">[\s\S]*?<\/tr>/).flatten
links = links.select { |link| link =~ (Regexp.new t.strftime("%Y-%m-%d")) }
links.each do |link|
href = /<a class="" href="(.*)" title="(.*)">/.match(link)[1]
title = /<a class="" href="(.*)" title="(.*)">/.match(link)[2]
date = /\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}/.match(link)
print href, " - ", title, " - ", date, "\n\n"
end
}
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Ruby
1
https://gitee.com/mygoare/douban-zufang.git
git@gitee.com:mygoare/douban-zufang.git
mygoare
douban-zufang
douban-zufang
master

搜索帮助