Hunter的大杂烩

二月 2, 2006

淘宝的cache技术猜测

类归于: 技术话题 — hunter @ 9:28 下午

在国内那么多网站里面,恕我孤陋寡闻,我认为taobao的系统架构应该相当不错的
每天上亿的PV,还能达到如此快的显示速度,我觉得相当不错,当然,它也砸了不少钱,一般的网站恐怕很少会在硬件上投入那么多
与sina比,淘宝的动态内容相当的多,sina这类新闻网站,与用户的交互比较少,虽然也有几个亿的PV,估计8/10在news.sina.com.cn上面
以纯静态页面为主,所以买china cache技术,比较划算,可以用china cache的技术实现global load balance+local cache
taobao据我观察,pics应该是买了netapp的net cache server,据说后台file server也是netapp的硬件
真是肯下血本啊,只是不知道性价比如何
list,search两个域名下有不少静态页面,估计很多数据被cache 成文件了,大大缓和了对搜索引擎和数据库的压力
list 前200页都是静态页面,后面页动态产生了, 不过有兴趣翻到后面200页的,估计也不是一般的用户的,嘿嘿

最让我迷惑的是auction上的商品信息页,照理应该也是静态化了,不过里面若干数据变化频率比较高,几次抓包下来,也是server直接吐出来的,让我非常迷惑,我对jsp不熟,我只能猜测,可能app server能把jsp编译为binary,大部分静态数据已经模板化了,只有若干常变信息作为变量在每次output的时候,replace一下。。。

另外就是后台的DB SERVER,照理orcale是不适合做OLTP方面的工作,以taobao每月10亿的成交额,每秒都应该有5-10笔订单(假设每笔100圆,则10 0000 0000/100圆/3600秒/24小时/30日*3 = 10),嗯,应该快到oracle上限了吧?

WordPress 所驱动