Google Reader背后的数字和未来走向
Google Reader是我每天都要使用的RSS阅读服务,根据数据统计,Google Reader也已经成为全球用户最多的RSS阅读器.那么Google到底花费了多大的空间来存储Feed,又是如何管理这些Feed的呢?下面我们来一探究竟:
1.Google Reader区别对待两种Feed:
只有一个读者的Feed(占Feed总量的2/3,每3个小时更新一次)
一个以上读者的Feed(每小时更新一次)
2.Google Reader用了10 TB的容量来存储所有的原始数据
3.Google Reader每天要抓取800多万个Feed
4.Google Reader是主流在线RSS阅读器里惟一一个保留有所有Feed完整历史的阅读器.
5.许多Google应用程序都使用了Google Reader的核心架构来管理Feed:iGoogle,Gmail网络剪辑,Blogger Widgets,Google电子表格,Ajax API.用户所有涉及到Feed的操作都由Google Reader完成,它独立于Google博客搜索.
6.Google Reader用户的增长速度=Feed的增长速度(当然是Google Reader需要处理的Feed)
7.Google Reader的索引文件每周增长4%
8.Google Reader 70%的流量来自于Firefox
9.Gmai和Orkut是仅有的两个在流量上超过Google Reader的Google应用程序.
10.搜索功能需要庞大的计算资源.Google Reader为搜索功能使用了两种索引:
一个每天更新2次的树形索引(150台机器,60亿个文档)
为即时文章准备的40个小型树形索引,每5分钟更新一次(40台机器,4亿个文档)
11.未来会加入的功能:
即将到来的:国际化,Feed推荐功能,接收发送到Google博客搜索的Ping
不久的将来:基于链接(链接到同一页面的文章)的简单聚合,给共享文章添加评论的功能.
盈利分享计划:在Feed中加入Google Adsense广告,和使用Adsense的博客主分享收入.
0
顶一下w3站长
首页- 03-24百度任命李昕晢为CFO 第一位女性
- 03-24SMX搜索大会展览促成IT商机与技
- 03-20谷歌漏税事件进展 李开复涉嫌漏
- 03-19雅虎与第三方合作防止点击欺诈的
- 03-17搜索营销策略之关注产业的两端
- 03-14Google Sky 实现浏览器直接浏览
- 03-14百度日本成当地第四大独立搜索引擎
- 03-13Search engine land消息:SMX会
- 03-11广告页载入速度太慢 Google要惩
- 03-11Google称付费点击下滑被夸大 股
- 03-10奇虎网改版大变脸 周鸿祎进军问
- 03-07百度Hi如何杀出重围
- 03-24百度任命李昕晢为CFO 第一位女性
- 03-11Google称付费点击下滑被夸大 股
- 03-13Search engine land消息:SMX会
- 03-11广告页载入速度太慢 Google要惩
- 04-12用户桌面之争 Google中国遭遇本
- 03-24SMX搜索大会展览促成IT商机与技
- 03-20谷歌漏税事件进展 李开复涉嫌漏
- 03-14Google Sky 实现浏览器直接浏览
- 03-10奇虎网改版大变脸 周鸿祎进军问
- 03-07百度Hi如何杀出重围
- 03-19雅虎与第三方合作防止点击欺诈的
- 03-14百度日本成当地第四大独立搜索引擎