西西河

主题：【原创】Facebook的一小步（上） -- forsake

共:💬57 🌺187

信息技术

全看分页树展 · 主题跟帖

复动态Injection怎么抓内容呢？

就我所知，Google目前只能抓一部分符合规定的Ajax

请看这里：

http://code.google.com/web/ajaxcrawling/docs/getting-started.html

原理有点像定点拍照。

需要站长在url里表明支持Googlebot抓取，并提供抓取入口。

当然，Google正在努力支持所有ajax内容，就像太守说的，变成一个虚拟浏览器。不过现在看起来还没有完全实现。

西西河google还好办，但更加强调动态交互的ajax应用还是麻烦。

我个人认为不是技术原因，而是虚拟浏览器的计算成本太高了。这一点过几年就能解决。

全看分页树展 · 主题跟帖

相关回复上下关系8
压缩 2 层
- 🙂关于西西河的部分，太守说的不完全对。不过我也不能多说铁手字0 2011-03-04 10:32:21
  - 🙂del forsake 字1 2011-03-04 13:00:59
- 🙂动态Injection怎么抓内容呢？ MacArthur 字68 2011-03-03 17:23:05
  - 🙂就我所知，Google目前只能抓一部分符合规定的Ajax
    🙂他们这意思是要站长们为Googlebot专门写个page MacArthur 字90 2011-03-04 06:00:56
    🙂没办法，过渡时期，要理解配合嘛 forsake 字44 2011-03-04 06:06:40
  - 🙂我估计google的爬虫已经具有了类似浏览器对HTML和 1 当年万户侯字70 2011-03-04 02:02:20
  - 🙂看不见就是不存在？素里太守字0 2011-03-03 18:15:35

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

Copyright © cchere 西西河

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明