当我在Google上检索到某个网页时,Google自动地提供出来与这个网页内容相关的3-5个网页的简要信息,放在屏幕的右边,供我参考。
要做到这一点,Google需要做到:
1.海量信息的高性能存取能力,对数据库中存放的80亿个以上的网页,迅速地提取出关键字,并在备选数据库中抽取适合的3-5个网页。
2.近于完美的关键字提取技术。这技术,“情报分析”工作者“御宇多年求不得”, 现在梦想成真了。
3.高效能的网络蜘蛛。
Google所做的工作,有一项很关键的技术,是语义分析。可以从一篇文章中,自动地抽取出关键字来。