当我在Google上检索到某个网页时,Google自动地提供出来与这个网页内容相关的3-5个网页的简要信息,放在屏幕的右边,供我参考。

要做到这一点,Google需要做到:

1.海量信息的高性能存取能力,对数据库中存放的80亿个以上的网页,迅速地提取出关键字,并在备选数据库中抽取适合3-5个网页。

2.近于完美的关键字提取技术。这技术,“情报分析”工作者“御宇多年求不得”, 现在梦想成真了。

3.高效能的网络蜘蛛。

 

Google所做的工作,有一项很关键的技术,是语义分析。可以从一篇文章中,自动地抽取出关键字来。