搜索引擎的基本工作流程: 抓取网络页面-预处理-查询服务 。本篇讲讲如何根据这三个流程来优化自己的网站,从而获得免费的流量。
1. 抓取网络页面
搜索引擎抓取页面就是大家常说的蜘蛛(有的地方也叫机器人)抓取。搜索引擎的一个自动应用程序,它的作用是在互联网中浏览信息,然后把这些信息都抓取到搜索引擎的服务器上。简单理解:我们可以把 搜索引擎蜘蛛当作一个用户,然后这个用户来访问我们的网站,然后在把我们网站的内容保存到自己的电脑上 !下面说说两个蜘蛛的“习惯”:
△ 蜘蛛抓取页面流程 : 发现链接-下载链接内容-保存-取内容中的链接-循环。
△ 蜘蛛抓取页面规律 : 深度优先,宽度优先,重访优先,权重优先。
☂ 优化项 :
1. 提 交链接 :直接通过提交网址到引擎的方法让蜘蛛知道我们的网站。这样可以节约蜘蛛到我们网站的时间。
2. 做好 内链 :主要是导航,次导航与面包屑导航,页面内容链接,需要清晰分布。方便蜘蛛快速抓取网站上的所有页面。
3. URL层次不要太深 :这个针对上面深度优化与宽度优化,URL目录越深,蜘蛛越难爬到这个页面。
4. 做好的外链 :主要是蜘蛛喜欢去权重高的页面上抓取链接,假如我们在网易首页上做友情链接,那蜘蛛就会很快到我们页面上来,并给予较好评价。这是针对上面权重优先。
5. 网站更新 :这里需要提到重访优先,比如前一天蜘蛛来抓取了我们的网页内容,而今天我们在该页面又增加了新的内容,那蜘蛛就回来抓取新的内容。长此以往,网站在蜘蛛的“印象”中就很友好了。
2. 预处理
预处理,又称为索引。我们知道搜索引擎蜘蛛在 爬行页面之后会对该页面进行提取文字信息,分词,去噪,去重,得到一批关键词集合 。之后搜索引擎会对这个集合进行 正向索引 ,即把每个页面中的多个关键词和页面建立对应关系,同时会 记录 这些关键词的密度,频率,表现格式等权重信息。表现格式主要是分析这些关键词是否使用了H1标签,是否使用了粗体或颜色变化,是否出现在了页面的title,description,keywords标签等权重标签。
☂ 优化项 :
1. 代码简洁 :提取文字信息主要是去除HTML、CSS、JavaScript、Flash、图片等代码及资源。简洁代码可以帮引擎节省时间。
2. 关键词要集中 :举例,如果网站是要做“中国瓷器”这个关键词,不要描述“中国的瓷器”,因为经过分词,去噪后,中国的瓷器,就变成两个词:中国 瓷器,“的”已经消除了。引擎上搜索“中国瓷器”评定页面相关时,中国瓷器描述一定比中国的瓷器要高。
3. 页面相似度不能太高 :上面引擎的去重操作,会取消相似度高的页面的保存。
4. 关键字密度 :引擎建议2%-8%,太少就会缺少相关性。
5. H标签的运用 :H1用于网站唯一主标题,只用一次,大多用于资讯新闻文章的标题。H2,H3用于分类标题,可用多次。
6. 粗体 :粗体有两种b和 strong,b主要侧重于表现视觉上的强调,而strong则是指语意上的强调。一般用于优化关键字的话,是用strong。
7. 颜 :颜色也可强调关键字。
8. title,description,keywords :这三个标签是引擎第一关注点。主要关键字要合理分布在这三个标签中。
3 . 查询服务
查询服务就是最后的排名,当用户查询关键字后,引擎对应的查询过程。首先把用户搜索的内容切分为一个关键词序列,我们有了搜索词集合,再把关键词所对应索引库,计算相关性后显示。显示结果: title与description 。
☂ 优化项 :
1. title的吸引性 :用户搜索关键字后,发现你的网站排名很靠前,但是你的网站标题是否吸引他去点击,这是个问题。
2. description的描述性 :Description要把网站的大致内容描述清楚,让用户觉得这个网站可信。
总结:根据搜 索 引擎的工作流程,对应做出友好的行为 ,才能使网站满足搜索引擎收录排名需求。当网站在搜索引擎中 提高关键词排名 ,就能精准地把用户带到网站,获得 免费流量 ,产生直接销售或品牌推广。
文章转载请保留网址:http://www.iswweb.com/news/solutions/1688.html