我要去桂林---田春峰的IT网志

IT改进生活

  DonewsBlog  |  Donews首页  |  Donews社区  |  Donews邮箱  |  我的首页  |  联系作者  |  聚合   |  登录
  135篇文章 :: 2篇收藏:: 104篇评论:: 20个Trackbacks

公告

天天多么乐

田春峰

accesine's Rapleaf Score

关于我的信息链接

Donews Blog

Subscribe with Bloglines

my qq number

文章

收藏

相册

IT精英

存档


正在读取评论……


2006年12月



    摘要:抽空学习过一点关于平移算法的问题,文本聚类平移算法的几点问题。现在做了一个小的演示,自动这里生成:今日热点关键词 列表。    (全文共370字)——点击此处阅读全文




    摘要:结论: 1、百度的索引库比雅虎中国的大。 在双方都认为最重要的3793个站点中:百度索引量:1626829061 ,雅虎中国的索引量:1018594668,高出:608234393 ,高出6亿。 2、百度的索引量分布图比较接近“长尾 Long Tail ”,长尾曲线比较完美。图形越接近长尾表明搜索引擎索引库基础的架构越好。 (理由是:"哥白尼对天动说美学上的反对是他拒绝托勒密体系的重要原因..." - Thomas Kuhn, The Copernican Revolution ) 很显然上面的分析还不一定能囊括所有方面,因此我准备还从下面几个方面继续深入研究: 之二:[百度vs雅虎中国]收录量和pr的相关性; 之三:[百度vs雅虎中国]索引量和alexa排名的相关性; 之四:[百度vs雅虎中国]如何测试搜索索引库的膨胀率;     (全文共5416字)——点击此处阅读全文