西西河

主题:【原创】wikipedia架构学习笔记(一)他们的骄傲 -- 羽羊

共:💬62 🌺262 新:
全看分页树展 · 主题
家园 【原创】wikipedia架构学习笔记(一)他们的骄傲

Wikipedia架构学习笔记

wikipedia毫无疑问是个超大规模的网站,在软件的使用、配置、管理方面亮点无数,而且wikipedia开放的态度对于后来者学习他们的优秀经验非常有帮助,在几个项目中,都多多少少从wikipedia获益,于是把学习的点点滴滴整理一下、记录下来,最近俗务繁多,也不知道什么时候能填完,小羊一定尽快。因为水平有限,所以本文一定挂一漏万,而且错漏之处一定不少,还请各位指正。

一、wikipedia的骄傲

根据wikipedia自己的说法:

Since its creation in 2001,

Wikipedia has grown rapidly into one of the largest reference web sites,

attracting around 65 million visitors monthly as of 2009.

There are more than 75,000 active contributors working on more than 14,000,000 articles in more than 260 languages.

As of today, there are 3,060,942 articles in English.

Every day, hundreds of thousands of visitors from around the world collectively make tens of thousands of edits and create thousands of new articles to augment the knowledge held by the Wikipedia encyclopedia

外链出处

技术数据,根据Mark Bergsma的pdf:

外链出处

30 000 HTTP requests/s during peak-time

3 Gbit/s of data traffic

3 data centers: Tampa, Amsterdam, Seoul

350 servers, ranging between 1x P4 to 2x Xeon Quad-

Core, 0.5 - 16 GB of memory

...managed by ~ 6 people

现在的最新数据

外链出处

(发文前,小羊很八卦的一台台数了一下)服务器357台在线,而且排名从Mark Bergsma作报告时的第10名上升到了第六名

外链出处

实时性能数据

外链出处

实时访问数据

外链出处

2009年4月5日的架构图(写实风格的,能数出server数量。。。看到晕倒。。。)

点看全图

外链图片需谨慎,可能会被源头改

外链出处

花了多少钱?

wikimedia基金会的08-09财年报告,懂财务的自己看吧

外链出处

一个致力于知识存储、共享和传播的网站

一个致力于知识存储、共享和传播、达到如此规模的网站

他们有充分的理由骄傲。

关键词(Tags): #IT(廣雅疏證)#软件(廣雅疏證)#架构(廣雅疏證)#cache(廣雅疏證)元宝推荐:晨枫,铁手, 通宝推:李根,

本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河