博客
电影
宝箱
友链
关于
<
《呼啸山庄》读后感,偏激的爱情
《李尔王》与《乱》影评,人性的悲歌
>
简述网站SEO知识
作者:
Cifer
类别: 技术·SEO
时间:2018-07-29 14:57:20
字数:4266
版权所有,未经允许,请勿转载,谢谢合作~
### 前言 SEO全称,Search Engine Optimization(搜索引擎优化),通俗讲,搜索引擎是根据相关机械规则抓取、分析、展示网站的内容,网站的代码应该对这些规则友好,同时搜索引擎应该是对用户负责的,从而间接要求网站的内容要对用户有用。 从上述概念看,广义上说SEO是让你把网站做的更好,这相当于在说废话,所以人们往往退而求次,在网站水平达到我们暂时性上限下,如何提高搜索引擎收录与排名,这也是我们口头所说的狭义SEO,它本身还是会受到广义SEO的制约。 ### 搜索引擎 在国内,在当前流量入口被大平台垄断的情况下,搜索引擎的地位已今非昔比,但在圈内被标题党、软文、营销、哗众取宠、强造噱头等各种垃圾信息狂轰滥炸中,也有人不堪忍受,所以搜索引擎还有它生存的空间,甚至当无用的信息爆炸时,越来越多的人不满足被摆弄,回归到自我需求的本质,搜索引擎的作用又体现出来,当然可能以别的形式,这是题外话。 <a href="http://www.boatsky.com/blog/42.html" title="简述网站SEO知识">简述网站SEO知识</a>之前,先来了解一下搜索引擎如何运作的,如果你使用过Spider爬虫技术,比如使用某个语言爬取网站SSR并且解析代码内容进行保存,最后聚合成类似于曾经google reader的功能,而搜索引擎即是它的超级加强版,除了网站HTML页面结构比SSR复杂外,数量级也不是一回事。 简单模拟一下过程: 1,Spider 试图获取网站爬虫协议Robot Exclusion Protocol(一般写在robots.txt),根据协议内容对网站进行爬取。 2,试图获取网站地图sitemap.xml,简化爬取路径。 3,根据网站权重与更新频次等各项指标,按相应频率优先下载首页HTML文件,再次判断爬虫协议(比如mate name="robot"的爬虫协议一,与robots.txt是一样的,但比之更有效,因为如果是外站链接爬过来的,则可能跳过了robots.txt协议) 4,仅当第3步允许下,才进一步对其他元素解析、过滤、分词、去重、反作弊等操作,同时获取所有link。 5,内容根据诸多算法计算页面的相应关健词指数,建立索引,保存快照,钟对相关的关键词排名显示。 6,第5步的同时对于第4步的link进行分析,以是否已经爬过、什么频次、爬取层级数等循环3、4、5、6步骤。 虽然上述步骤看起来简单,事实上这是一个无比复杂的过程,比如如何分步式、各种权重算法、分词、去复、建立高效的索引、缓冲机制……任何一个细节都是难题。以google为例,2017年便有8万多员工,虽不知其知识部门(原是搜索部门)有多少员工,但作为其最核心的部门之一,相关研发人员必然是大头。因为分工精细,即使是内部员工,也无从得知其核心引擎算法最终实现,更别说SEO从业人员,听着很消极,情况又确实如此。 从搜索引擎的实现来看,没人可以保证网站的优化一定可以得到好的排名,甚至收录时间也不能保证,这正是搜索引擎故意不公开其排名与收录规则的原因之一。站长与其花过多精力去顺应它的规则,不如把更多业务花在提高网站质量上。但不意味着SEO没有用,只是在定位上,不要为了SEO而SEO,舍本逐末,而应该把它作为推广你高质量网站的手段,酒好也怕巷子深,SEO可以如虎添翼。 ### 影响排名与收录的因子及SEO技巧 1. 网站评级,权威性、原创性、实用性 2. 网站流量,包括PV,UV,IP等 3. 网站稳定运行、持续更新的时间 4. 域名年龄,域名与网站内容相关 5. 外部链接的质量与个数,高质量的单向外链是上策,相关的少量友情链接是中策,滥发无意义的外链是下策(也有可能被惩罚) 6. HTML代码、内容结构的优化,不宜使用无说明的图片、JS后续加载、flash等对搜索引擎不做好的方式,即使只有HTML(没有CSS与JS),你的页面对用户也是可读的,并内容与主题强相关 7. 良好的网站层级结构,所有页面与首页链接不宜太远,可增加面包屑与结构模块,另外避免死链与部分页面形成孤岛 8. 建立网站地图sitemap.xml,方便其直接爬取,因小网站收录量有限,所以需要设置合理的优先级priority 9. 内容不宜重复,恰当的设置title,description,keywords信息,不应乱堆积关键字,应准确打击,有人认为这些搜索不考虑了,虽然权重不太高,但也是中游的重要性,并且这个与内容组合,有长尾词效应 10. 使用白帽SEO,即提升内容质量,不要作弊 11. 用户被动反馈,如停留时长,访问频次、访问页数等 12. URL静态化,规范化 13. 301永久重定向(推荐),302暂时重定向 14. 网站打开页面速度,速度快对升权作用不大,但太慢却会降权,这个可以理解为前端性能,做缓存,CDN,减少请求,压缩,异步加载等 15. 适当的使用nofollow,防止权重分流,但不加nofollow的引用权威又可以轻量的增加本网站的权威,所以看这个如何权衡,并且友链一般是不加nofollow,否则大家都加,友链就没有意义了 16. URL命名,页面内容元素命名,URL使用中划线等系列合理命名问题 ### 常用搜索指令 这些简单指令除给SEO人员查看收录情况,对普通用户也可提高搜索精度与效率,以下皆以google为例: ``` "哈姆雷特根本不属于那个时代" ``` 加双引号(最好是英文的双引号),完全匹配的搜索,用作精确查找,可用来判断文章原创性。 ``` site:www.boatsky.com ``` 搜索网站编入索引的网页,一般收录总数小于编入索引总数,即只显示收录中权重高的,或者说只收录合格的页面。 ``` intitle:怎么分辨一部电影的好坏 ``` 搜索页面title含有关键字,如果不考虑作弊的情况,intitle搜索更准确。 ``` allintitle:怎么 分辨 电影 好坏 ``` intitle组合方式,之间空格分隔。 ``` inurl:boatsky ``` 搜索url带有boatsky的网页。 ``` filetype:pdf 理想国 ``` 搜索特定格式文件,比如想看柏拉图的《理想国》,直接查找它的pdf格式文件。 ### 参考工具 ##### Alexa Alexa 是最常用的查询网站流量数与排名 Alexa官网 <a href="https://www.alexa.com/" title="https://www.alexa.com/" target="_blank" rel="nofollow">https://www.alexa.com/</a> Alexa中文版 <a href="http://alexa.chinaz.com" title="http://alexa.chinaz.com" target="_blank" rel="nofollow">http://alexa.chinaz.com</a> 它的数据使用Alexa工具条统计的,很多用户根本没有安装它甚至都不知道这个工具,造成统计数据与真实数据出入较大,加上不少公司为了吸引投资,偷偷花钱找第三方刷流量、刷排名,造成Alexa没有太大的权威性,但大家还是拿它作参考,因为没有其他权威的替代品。 ##### similarweb 官网 <a href="https://www.similarweb.com" title="https://www.similarweb.com" target="_blank" rel="nofollow">https://www.similarweb.com</a> 因为数据多来源,比如爬取数据、向网络服务商买数据等,据说比Alexa精确度更高,但还是只能作参考。 ##### 流量统计 因为网站的流量是种商业机密,没有真正权威的网站可以查看别人网站的流量,但自已网站的数据,可以使用相关的统计工具事先加入统计代码,如: Google Analytics <a href="https://analytics.google.com" title="https://analytics.google.com" target="_blank" rel="nofollow">https://analytics.google.com</a> 百度统计 <a href="https://tongji.baidu.com" title="https://tongji.baidu.com" target="_blank" rel="nofollow">https://tongji.baidu.com</a> ##### robots.txt规则 <a href="https://support.google.com/webmasters/answer/6062596?hl=zh-Hans" title="https://support.google.com/webmasters/answer/6062596?hl=zh-Hans" target="_blank" rel="nofollow">https://support.google.com/webmasters/answer/6062596?hl=zh-Hans</a> ##### W3C网页规则验证 <a href="https://validator.w3.org/" title="https://validator.w3.org/" target="_blank" rel="nofollow">https://validator.w3.org/</a> ##### Google Trends <a href="https://trends.google.com/trends/" title="https://trends.google.com/trends/" target="_blank" rel="nofollow">https://trends.google.com/trends/</a> ### 结束 SEO是门技术,也是门艺术,需要无数的实践经验与不断的尝试与学习才能做好,西法也只是学习阶段出于记录学习的总结的需要记下本文,如有不对欢迎指正。 本文参考文献: 《SEO深度解析:全面挖掘搜索引擎优化的核心秘密》痞子瑞 著 《seo实战密码:60天网站流量提高20倍》昝辉 著
如果觉得有帮忙,您可以在本页底部留言。
相关推荐:
记录Google Analytics遇到的问题
……
更多
<
《呼啸山庄》读后感,偏激的爱情
《李尔王》与《乱》影评,人性的悲歌
>
全部留言
我要留言
内容:
网名:
邮箱:
个人网站:
发表
全部留言