如何审视网页的收录状况
1/3 简易阅读
若想探究百度的收录状况,可搜索“站长资源”,打开站长资源库。
2/3
在站长资源库中挑选“SEO全面检测”。
3/3
接着,将欲查询的网址填入文本框,点击“检索”便可查看该网站的搜索引擎收录状况,以及权重等附加信息。
我们怎样探查网站收录
1、借助百度站长平台或百度分析工具
近期,百度在站长平台发布了网站的精确收录数据,精确到每日更新,即每日都会更新,故注册了站长平台或百度分析后,便能精确掌握网站的收录数据,且每日均有数据,极为便捷。为便于查阅,还采用了按时间逆序排列,百度官方曾宣称这是目前最精确的收录数据。
2、通过sitemap探查网站的收录数据
目前,除了在谷歌管理员工具提交sitemap文件外,在百度站长平台也能提交地图文件,格式包括txt格式、xml格式及sitemap索引文件格式,提交后,抓取效果显著。由于百度尚未全面开放,提交sitemap文件需邀请码。以下以谷歌为例进行说明,地图文件可借助技术支持解决,最简单的方式是使用txt格式,在txt文件中,仅需每行列出URL即可,中间不得有空行,且需使用绝对地址形式。不过,最常用的是XML格式,因为它不仅提供URL,还包含优先级、更新频率、时间等因素,更便于搜索引擎抓取。当制作并提交后,在谷歌管理员工具中便会显示如下:
图中已编入索引的网址数,即为谷歌抓取该地图文件后的精确收录数据。若将网站中所有URL都放入地图,提交后,通过此方法即可得知其精确收录量。注意,当URL较多时,可提交多个sitemap文件,一个sitemap文件的URL数量不宜超过五万条,且文件压缩前不能超过50M(百度不超过10M)。
3、运用rank tracker工具探查收录
Rank tracker是一款国外的卓越关键词排名查询工具,可批量查询数万词的排名,功能强大。我们可以利用它来探查网站的收录状况,方法是将网站的URL导出,导入rank tracker进行批量查询,将URL作为网站的关键词查询排名,排名第一的即表示已收录。
4、利用火车头采集工具探查收录
首先,需将网站的URL导出,然后根据百度的URL特征,将网站的页面URL当作在百度搜索的关键词,批量生成在百度查询后的URL地址,用火车头工具批量采集这些URL的内容,采集这些页面的特征内容,如未找到、抱歉等字眼。当采集到这些内容,即代表未被收录。用URL总数量减去未被收录的URL数量,即为网站的收录数据。