主题:【求助】求能自动抓取网站内容的软件 -- 渡泸
共:💬29 🌺40
这个需要一点儿ruby脚本的知识,如果你有兴趣的话就好办了。
环境的准备包括:
1.安装ruby186-26
http://rubyforge.org/frs/download.php/29263/ruby186-26.exe
2.安装rubygems 1.3.7
http://rubyforge.org/frs/download.php/70697/rubygems-1.3.7.zip
打开命令行,进入rubygems解压后的目录,运行ruby setup.rb.
3.安装firewatir
打开命令行,运行gem install watir
4.安装Firefox插件jssh
http://wiki.openqa.org/download/attachments/13893658/jssh-3.6-WINNT.xpi
环境准备好后可以写一些很简单的Ruby脚本来模拟网站交互以及抓取信息。
具体可以查看http://watir.com网站的相关文档。
- 相关回复 上下关系8
🙂谢谢盒子兄! 渡泸 字24 2010-11-01 05:53:37
🙂ruby+firewatir的组合很适合这种任务 2 罗杰 字130 2010-10-31 20:33:07
🙂太好了兄弟!在哪里能下载啊? 渡泸 字0 2010-11-01 00:44:11
🙂一些说明
🙂谢谢罗兄! 渡泸 字20 2010-11-01 16:56:48
🙂snagit 把截屏转化为文字 1 老醋花生 字201 2010-10-31 19:25:02
🙂用过webzip,整个网站都当下来。 1 notime 字0 2010-10-31 20:34:46
🙂用Excel VBA 写程序处理 1 充实 字22 2010-10-31 05:09:59