主题:【原创】Facebook的一小步(上) -- forsake
共:💬57 🌺187
请看这里:
http://code.google.com/web/ajaxcrawling/docs/getting-started.html
原理有点像定点拍照。
需要站长在url里表明支持Googlebot抓取,并提供抓取入口。
当然,Google正在努力支持所有ajax内容,就像太守说的,变成一个虚拟浏览器。不过现在看起来还没有完全实现。
西西河google还好办,但更加强调动态交互的ajax应用还是麻烦。
我个人认为不是技术原因,而是虚拟浏览器的计算成本太高了。这一点过几年就能解决。
- 相关回复 上下关系8
压缩 2 层
🙂关于西西河的部分,太守说的不完全对。不过我也不能多说 铁手 字0 2011-03-04 10:32:21
🙂del forsake 字1 2011-03-04 13:00:59
🙂动态Injection怎么抓内容呢? MacArthur 字68 2011-03-03 17:23:05
🙂就我所知,Google目前只能抓一部分符合规定的Ajax
🙂他们这意思是要站长们为Googlebot专门写个page MacArthur 字90 2011-03-04 06:00:56
🙂没办法,过渡时期,要理解配合嘛 forsake 字44 2011-03-04 06:06:40
🙂我估计google的爬虫已经具有了类似浏览器对HTML和 1 当年万户侯 字70 2011-03-04 02:02:20
🙂看不见就是不存在? 素里太守 字0 2011-03-03 18:15:35