凡事都有两面,有黑既有白。要想把一件事做好,还需要了解事情的本质。

搜索引擎优化也是如此。

  • 什么叫做搜索引擎
  • 什么叫做搜索引擎优化(SEO)
  • 为什么要进行搜索引擎优化
  • 搜索引擎工作过程
  • 如何进行搜索引擎优化

搜索引擎(英语:search engine)是一种信息检索系统,旨在协助搜索存储在计算机系统中的信息。–wiki

se

上图为google搜索引擎

搜索引擎优化(英语:search engine optimization,缩写为SEO),是一种透过了解搜索引擎的运作规则来调整网站,以及提高目的网站在有关搜索引擎内排名的方式。–wiki

futu

上图为搜索“富途证券”的结果

掌握搜索引擎的工作原理,了解自己的网站业务,再加上合理的优化方式,得出合理的优化方案。从而达到提升网站在搜索引擎的排名。

总之,所做的一切都是为了提升网站在搜索引擎的排名。

那么,从技术角度,应该如何对搜索引擎进行优化。

1. 搜索引擎工作过程

首先,我们需要对搜索引擎的工作原理要有一定的了解。搜索引擎一般由3步组成:爬行/抓取,预处理,排名。

搜索引擎工作过程

上图为搜索引擎的工作流程图

  • 爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问页面,获取页面 HTML 代码存入数据库。
  • 预处理:搜索引擎对抓取来的页面数据文字进行文字提取、中文分词、索引等处理,以备排名程序调用。
  • 排名:用户输入关键字后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。

搜索引擎通过页面中的链接或指定起始爬行链接进行页面抓取。我们能控制的只有网站本身。要使得网站能获取得一个更高得排名,就需要让搜索引擎蜘蛛能更快得爬行到目标网页,更准确的抓取到关键数据。

总结就两点:

  1. 提供最合理的词语(关键词)
  2. 让搜索引擎更快,更准确的获取到这些关键词

2. 如何进行搜索引擎优化

我们在搜索引擎中进行搜索的关键字,通过排名程序搜索数据,计算数据的相关性,为每个结果计算权重,最后进行权重排名,返回得到的搜索结果。

由此可以知道,我们能做的就是在搜索引擎蜘蛛爬取页面阶段进行优化。而非搜索阶段。
搜索

2.1. 如何提供最合理的词语

关键词的命中率,权重,直接影响着搜索结果排名的展示。

合理的优化方式:

  1. 提供合理大小,准确的关键字
  2. 提供术语
  3. 网站字眼
  4. 独一无二的标题
  5. 犀利的描述
  6. 图片添加alt

错误的优化:

  1. 提供火热字眼
  2. 关键字隐秘字

通过火热字眼欺骗搜索引擎蜘蛛,会大大降低网站排名。

例如,通过合理的方式进行关键词优化。搜索”富途web研发团队”是我们想要的结果。
搜索

2.2. 如何让搜索引擎更快,更准确的获取到这些关键词

目前,移动优先是SEO优化的重点。选择大的服务器提供商,不仅能保证网站的稳定性和访问速度,而且在搜索引擎蜘蛛看来会更加的可靠。

合理的优化方式:

  1. 关键字加粗
  2. 页面布局结构扁平化
  3. 结构元素语义化
  4. 标题权重划分
  5. 使用robots.txt
  6. URL适当使用「nofollow」
  7. URL链接优化
  8. 提供网站sitemap
  9. 提高网站打开速度
  10. 尽量不使用单页面
  11. 增加页面导航

除了让搜索引擎蜘蛛能更快的打开页面之外,我们还需要对蜘蛛抓取的关键字增加权重。需要蜘蛛忽略的目录和链接进行屏蔽,不让蜘蛛抓取。

懿旨在给蜘蛛想要的数据,屏蔽不喜欢的。

除了一些合理优化外,还有错误的优化方式:

  1. 垃圾索引(Spamdexing)意指透过欺骗技术和滥用搜索算法来推销毫不相关、主要以商业为着眼的网页。
  2. 斗蓬法(cloaking)简单来讲就是网站站长用了两版不同的网页来达到最优化的效果。
  3. 桥页(doorway pages)也叫门页,是通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向到主页。
  4. 付费链接(paid link) 是利用支付费用方式要求其他网站提供链接至自身网站,借此伪装高信任网站来欺骗搜索引擎。
  5. 链接农场(link farm) 是故意在一些低质量,内容跟自己内容无关的网站上获取大量链接,藉以提高排名。

有句话说得好,过犹不及。事情做得过头,就跟做得不够一样,都是不合适的。反而会降低网站排名,甚至直接进入黑名单。

现在运用上面的一些技巧,我们对网站进行结构语义化处理。让蜘蛛虫可以更好的抓取到想要的数据。
搜索

3. 附录

搜索引擎对html标签的评分:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
  内部链接文字:10分
  标题title:10分
  域名:7分
  H1,H2字号标题:5分
  每段首句:5分
  路径或文件名:4分
  相似度(关键词堆积):4分
  每句开头:1.5分
  加粗或斜体:1分
  文本用法(内容):1分
  title属性:1分 (注意不是title>, 是title属性, 比如a href=… title=”)
  alt标记:0.5分
  Meta描述(Description属性):0.5分
  Meta关键词(Keywords属性):0.05分