王立建SEO工作室十年经验老司机 提供企业网站优化排名服务 王立建 手机:18003190145 QQ:200898432

搜索引擎预处理:建立索引

建立索引是建立关键词与网页之间的对应关系。建立索引的最大好处在于可以快速获取对应的数据。简单来说,搜索一个关键词后,搜素引擎能够在很短的时间内将所有相关的内容进行展现,依靠的就是提前对页面建立了索引。

建立索引时有两种索引关系:正排索引和倒排索引。

正排索引

蜘蛛在网页收集阶段抓取到的网页,经过文字提取、中文分词、去重等预处理操作后,得到的就是独特的、能反映页面主题内容的、以词为单位的字符串。接下来搜索引擎索引程序就可以提取关键词,为该页面建立与关键词的对应关系,这个过程称为正排索引。简单来讲,正排索引指的是页面对应关键词的索引

倒排索引

用户在搜索引擎中输入某个关键词后,搜索引擎会快速地将与搜索词相关的所有页面展示给用户,这个过程称为倒排索引。简单来讲,倒排索引指的是关键词对应页面的索引

正排索引还不能直接用于排名,比如用户搜索“旅游攻略”,如果只存在正排索引,排名程序需要扫描所有索引库中的文件,找出包含该关键词的文件,再进行相关性的计算。这样就不能实时返回排名结果。

所以搜索引擎会将正排索引数据库重新构造为倒排索引,把页面对应到关键词的关系表,转化为关键词对应到页面。这样当用户搜索某个关键词时,排名程序在倒排索引中定位这个关键词,就可以马上找到所有包含这个关键词的页面。

由于蜘蛛在分析页面时,会根据页面中关键词出现的频率、次数、格式、位置等信息,判断一个页面重点优化的关键词是什么,然后建立关键词和页面的对应关系。因此石家庄网站优化公司在优化网站时,应该做到四处一词,重点突出每个页面中优化的关键词,提高关键词出现的频率、出现的次数,也可以使用标签进行突出强调。