主题:【求助】求能自动抓取网站内容的软件 -- 渡泸
用PHP/CURL库。不过价格就比下面说的50元高多了。
还有一种方法是找人帮你手工抓信息。
使用软件抓信息叫做 Web Scraping。
http://www.freelancer.com/projects/by-job/Web-Scraping.html
手工抓信息叫做 Data Entry。
http://www.freelancer.com/projects/by-job/Data-Entry.html
如果你在国外,可以试试 freelancer.com。
如果你在国内,可以百度“威客”,很多外包网站提供这类服务。
另外,你还可以试试Firefox下的一个免费插件……iMacros。
如果网站结构简单,用iMacros可以很快写出脚本,自动运行。
https://addons.mozilla.org/en-US/firefox/addon/3863/
另外,还有些现成的软件可以抓email、电话号码什么的。Google "scraping software",或者到天空软件、华军软件、download.com 搜索“scrap”。
如果你想学 scraping 编程,可以参考 "Options for HTML scraping?"
o Beautiful Soup
o lxml
* Ruby
o Hpricot
o scrAPI
o scRUBYt!
* .NET
o Html Agility Pack
o WaitiN
* Perl
o WWW-Mechanize
o Web-Scraper
* Java
o Tag Soup
* PHP
o htmlSQL
- 相关回复 上下关系8
🙂罗杰兄帮我写了个程序 渡泸 字77 2013-09-14 22:45:35
🙂flashget的 site explorer 1 jet 字0 2010-11-02 09:27:23
🙂谢谢! 渡泸 字42 2010-11-02 16:48:25
🙂做过很多抓取网站信息的小项目
🙂谢谢盒子兄! 渡泸 字24 2010-11-01 05:53:37
🙂ruby+firewatir的组合很适合这种任务 2 罗杰 字130 2010-10-31 20:33:07
🙂太好了兄弟!在哪里能下载啊? 渡泸 字0 2010-11-01 00:44:11
🙂一些说明 4 罗杰 字562 2010-11-01 09:01:50