今天在wikipedia上逛了很多时间。wikipedia在IT架构方面的经验,对于我们构建网站极有参考价值,因为wikipedia提供的这些信息非常详细和确凿。(以下是我的简单总结,仅供参考,准确信息请访问参考资料)
wikipedia目前一年大概可以募集约10万USD的捐款。其中90%都用于购置服务器等硬件以及租用机房/带宽等费用,另外来自大公司捐赠的hosting资源(如yahoo),包括服务器/IDC资源等。
数据库服务器:MySql,7台,AMD64平台,4~16GB内存,FedoraCore3;
Cache服务器:squid,~17台,P4,3~4GB内存,1U机架服务器,FedoraCore3;
Squid 大部份應付未登入使用者的需求,快取命中率達75%,有效的減輕Apache的負載。負載平衡是以Round-Robin DNS法來達成。
Web服务器:Apache,49台,P4,1~4GB内存,1U机架服务器,FedoraCore2;
運行PHP,且搭配Turck的PHP快取系統以增進效能。這些伺服器以NFS共享工作目錄,以實現同步運作
其他服务器:~8台,用于NFS、DB dump、DNS、社区运作,如email, irc等,机器比较杂,配置较低,运行较老版本的linux
总共83台服务器;说明LAMP已经非常成熟可用于世界级的大网站应用。
目前wikipedia的服务器访问量平均在1400req/s,峰值到2000req/s。流量方面,数据库服务器的流量大约在8MB/s(单机?);
软件方面,mediawiki的最新版本的代码量大约为13万行(PHP代码);
下图为wikipedia网络架构
参考资料
* Wikipedia meta
* wikipedia server原始资料,中文