通用搜索引擎和垂直搜索引擎的区别

通用搜索引擎抓取网页后,需要做大量的预处理工作。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等,我们叫通用搜索引擎的“网页预分析”。

垂直搜索,除了要执行通用搜索引擎的“网页预分析”外,还需要将页面的信息进行更详细的分析,比如哪些是公司联系方式,哪些是产品信息参数,价格、原材料、品牌、重量、包装等等都要事先进行分析和索引,我们叫垂直搜索引擎的“信息预分析”。