西西河

主题:【文摘】给互联网加标签 -- Davi

全看树展主题 · 分页首页 上页
/ 1
下页 末页
家园 【文摘】给互联网加标签

能在互联网上找到想要的东西是不是很棒的事呢?当然!Google就是一个出色的查找工具--例如查找一个公司的主页或是制作巴腾堡蛋糕(Battenberg cake)的方法。不过,经常发生的情况是:你查找一点东西却有无数个选择,让人沮丧不堪。

这一点都不奇怪:Google目前索引的网页超过80亿个,而3年前还只有20亿,两年前只有30亿,数目的确庞大。正如哈佛大学伯克曼中心(Berkman Center)的大卫?温伯格(David Weinberger)所说:“这些年我们一直在庞大而复杂的互联网中挣扎”。有没有更好的方法查找东西呢?

严格来说还没有。我认为Google仍然是最好的搜索引擎。不过有人认为这样看待问题的方法有误。如果有一个更好的、组织这个网络而非索引网络的方法会怎么样呢?Google毕竟只是索引它在一个网页上搜索到的词,以及与这个网页链结的其他网页上的词。因此,如果你要搜索巴腾堡蛋糕的配方,那非常容易。不过Google不会去分析这些单词的确切意思或这些网页的内容。

简单来说,使用Google就像走进图书馆、雇佣了一个跑得很快的帮手,他可能不大机灵,但阅读速度却很快,他能飞快找到带“巴腾堡”几个字的所有的书。如果只需走到目录旁边,查找“制作一种用杏仁糖浆包裹、黄粉两色的方形海绵蛋糕”,这样是不是更好么?

也许是会好些,但问题是目前还没有这样的目录。幸好这种想法现在已经有了,叫“语义网”,概念很简单:通过给网页加标签对互联网上的资讯进行分类,如蛋糕、杏仁糖浆、配方等等。但是,互联网上的页面浩如烟海,每天又有几千个新增加的网页,可不会有人主动请缨来完成这项任务--直到最近。

去年有两个免费的互联网服务开始做一些有意思的事情,它们相互之间是完全独立的。Flickr网站(www.flickr.com)可以存储照片,del.icio.us (http://del.icio.us)可以让你保存你最喜欢的网页的书签。它们有两个共同特点:让使用者给保存的东西加标签,这些资料默认可以与其他用户共享。

因此,假设你上传一张照片到Flickr,你可能会给它加一两个单词来进行分类,比如:scuba (水中呼吸器)或marzipan(杏仁糖浆)。同样道理,你在del.icio.us的书签上加进一个网页时,也对它分类。不过,这两个工具都是公用的,这意味著你可以浏览到拥有同样标签的其他Flickr图片或del.icio.us的网页链结。

这不是谁特意想出来的。del.icio.us是由30岁的纽约人约书亚?沙克特(Joshua Schachter)创建的。他这样做主要是想保存他的书签。但是,忽然之间,你不仅可以看到自己收集了些什么,还可以看到别人收集了些什么。“做这个网站的主要动机是解决自己遇到的问题,没想到给很多人解决了问题”,沙克特说。社会性标签由此诞生了。

另外有些人意识到这个非主流的分类方法有扩展的空间。不用聘请几十个像蜜蜂一样勤劳的工作人员每天坐在电脑旁边工作、在互联网上对网页和图片进行分类以便使人们找起来更加方便,现在人们自愿在做这件事,在上传网页或图片时想到什么关键字就加什么。

用不著组织一个专家委员会来讨论决定分类的层级制度,现在是普通人在做分类,脑子里想到什么标签就加什么。这是一种人人平等的分类法--因此有人把它称为“通俗分类”,它有可能会流行起来,也可能不会。这种分类不算完美,但有效。正如一直在研究标签、住在东京的日裔美国人Gen Kanai所说的,“用户在加标签上只需多做一点工作,而一旦加了标签的资讯被编进目录并和其他有相同标签的资料链接起来后,这一点点的工作就会带来丰富的资讯资源”。

那么这一切对你和我意味著什么呢?假设你对潜水(scuba diving)感兴趣。你在del.icio.us上加进一些相关的网站并用“scuba”作为标签。突然,在你的del.icio.us书签页面上,你不仅会看到自己所有的标签,还会看到有多少人对相同的页面加了标签,你还能看到其他被加“scuba”标签的页面。

你不仅把书签存在了以后能找到的地方,还把其他人指向了这些页面。此外,最重要的是,你会看到一大批别人认为值得加书签的网页。忽然之间,加标签成了一件简单、富社会性而有用的事情。旧金山市程序员鲍恩?德尔(Bowen Delle)说:“它给了人们一个容易理解的方法把事物联系起来,最重要的是它成为人们可能与他们建立联系的方式--甚至有可能因此走到一起”。

目前这种方式还是小规模的,并不发达。首先,我们怎么能确定每个人加的是相同的标签呢--比如都是杏仁糖浆而不是杏仁糊?其次,现在还只是两个网站,相比于整个互联网不过是沧海一粟。没错,但这是良好的开头。最近,一个叫Technorati的搜索引擎开始使用Flickr和del.icio.us的标签来对它索引的几百万个网络日志进行分类。这使得Technorati成为一个主题网页,包括任何你能想得到的、可能有人在撰写的主题。例如,你可以在www.technorati.com/tag/moleskine上找到我几个星期以前在“Loose Wire”栏目里讨论的关于笔记本电脑的网页。

最重要的是,社会性标签如果真的发展起来,会使搜索资讯变得容易得多。我们不再需要依赖搜索引擎,而可以借助其他上网者把找到的有趣网站贡献出来。这种情形有点像有一些特别快速、机灵的速读者带著一叠叠索引卡,在网上替我们四处奔跑查找资讯。

点看全图

外链图片需谨慎,可能会被源头改

家园 整理,检索,查找Internet中的海量信息的确是个大课题。
家园 Google可不仅仅是“跑得很快”。Google的搜索结果是

经过排序的。Google有一个所谓的专利技术叫“PageRank”,是Google起家的本钱。http://www.google.com/technology/

Del.icio.us听起来怎么象又一个Yahoo啊?

家园 Hehe, just give it a try! You'll like Del.icio.us

It's different from Yahoo because MANY people are doing the labeling rather than a company or a few experts. People label the webpages simply for their own goods, so that they can organize their bookmarks in a way similar to Gmail. But more importanly such efforts are shared among a society, and collectively are very valuable not only to human, but also to machine intellience (such as Google). It's not meant to replace Google, but help it with affordable human knowledge.

全看树展主题 · 分页首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河