搜索引擎对索引库的检索过程可以简单描述如下:
(1)把用户提交的搜索词分成词A和词B.
(2)同时使用词A和词B在索引库中进行检索,并提出所有包含词A或者词B的文件,组成文件集合L.
(3)在文件集合L中吧包含词A和B的文件优先提出来组成文件集合M排在前面,把只包含词A或B的文件排在后面。
(4)继续对文件集合M进行分析,把完全包含用户搜索词的文档提出来组成文件集合N,并排在前面,把内容中没有完全匹配搜索词的文件排在后面。
(5)再根据搜索词在网页中出现的次数、位置、密度和形式等对文件集合N中的文件进行排序。
(6)搜索引擎还好分析文件的外链数量、质量和锚文本,根据锚文本辅助分析文件和关键词的相关度、外链的数量和质量来确定文件的重要程度,以进行排序调整。
以上只是简单模拟搜索引擎的检索排序过程,为了描述方便,引入了“文件集合”。在整个检索和排名过程中,关键词匹配程度、密度、频率、位置、形式和外链情况会应用到所有文件上,而不仅仅是上文所提到的文件集合上。由以上检索排序模拟过程可以看出,搜索引擎判断一个网页或者文件与搜索词的相关度,主要根据文件中关键词出现的频率(次数)、密度(占全部内容的比例)、最终分词后关键词之间的距离(是否完全匹配)、位置和形式(是否在标题、内容比较靠前的位置以及是否黑体、变色、H标签等突出显示)、文件外链锚文本(是否和内容有统一的文本描述)等,外链的数量和质量并不是判断内容相关性的因素,只是判断文件重要程度、内容质量或可信任程度的标准。
同时在关键词匹配中,搜索引擎为了使返回的结果都是用户真正需要的,会分析判断搜索词分词后的词语,哪些是用户主要关心的,哪些是次要关心的。比如,搜索引擎会弱化搜索词中的常用或者意义不大的定语,在百度搜索“我们的航母”,搜索结果中前几页的网页内容都会完全匹配“我们的航母”这个关键词。多向后翻几页,当没有能完全匹配该搜索词的网页时,会明显感觉到后面的网页都是以“航母”为主要关键词的。

猜你喜欢
联络方式:
深圳 · 龙岗 · 大运软件小镇22栋302-308
电话:400 1828 580
邮箱:szhulian@qq.com



-
网站优化提升网站权重有哪些?
稳定的服务器是网站快照正常的第一步,首先你得让搜索引擎能够访问你的网站,如果你的服务器有问题,网站不能正常打开,蜘蛛来觅食的时候吃了闭门羹,蜘蛛饿着肚子回家第二天兴许就不来你的网站了。所以我们在选择服务器的时候一定不能省小钱,必须找一个稳定的服务器......
-
深圳网站开发教程之新手框架入门
常言道,条条大路通罗马,可是那一条适合我呢? 由于用于构建前端页面等现代技术的出现,JavaScript 在 web 开发社区早已是如雷贯耳。通过在网页上编写几个函数并提供执行逻辑,可以很好的支持 HTML (主要是用于页面的 表现 或者 布局)...
-
如何使用js中navigator属性判断浏览器的版本类型?
本来javascript的navigator的属性是用来检测浏览器版本的,但是如果用来检测用户是手机用户还是电脑用户,手机用户调整至手机网站,电脑用户之间跳转至电脑网页还是有用的,通过网上搜集相关资料,以及个人的理解,整理出来为大家提供帮助...
-
【正告】嘉兴博讯网络信息技术公司【博讯品牌全网营销机构】抄袭之正告
对于抄袭自己创意的人,每位原创者都会深恶痛绝,智慧劳动成果被他人窃取,真真地让人极为愤怒。自从“深正互联”官网改版上线后,一些不轨企业纷纷开始抄袭模仿,抄袭“深正互联”之风日益横行,有成都的,有浙江的,有湖南的...
-
Vue 3有怎么下载怎么用,有什么优势?
针对重写最新版本的 Vue,尤雨溪于日前发表了长文对其过程中获得的经验教训,作了详细阐述,对此,深正互联进行了全文翻译,望共勉...