做seo需要简单的了解搜索引擎的工作原理,才能更好的做seo。
搜索引擎的简单工作大致分为三步。
爬行和抓取
1,蜘蛛:百度抓取机器人:baiduspider
2,跟踪链接。两种模式,深度优先、广度优先(网站树状机构图)
3,吸引蜘蛛。网站或者页面的权重、页面更新率、导入链接数、与首页距离
4.地址库,为了避免重复爬行
5,文件存储
6,爬行简单的内容处理,蜘蛛爬了不一定收录
预处理(索引)
1,提取文字。从源代码中提取文字
2,中文分词
3,消除噪声。去除与页面主题不相关的内容
4,去重
5,索引
排名
1,搜索词处理:中文分词、拼写矫正
2,文件匹配
3,初始子集的选择
4,相关性计算:关键词常用程度、词频、关键词的位置及形式、链接分析及权重
5,排名显示
6,搜索缓存
7,用户查询及点击日志
备注:
1,搜索引擎是一个索引工具,本质上和图书馆的图书管理工具没有实质区别
2,搜索引擎的是一个程序,是由人来决定它的算法
3,搜索引擎的算法有进行公示,有兴趣可以去网站进行查询了解。
企业微信部署及安装请联系:江西景行网络科技有限公司
客服PP:35800792 公司电话:0792-8505880 值班手机:13307926943