如何处理百度抓取异常的页面?

我的站是wordpress建的,固定链接已经更改过,但是百度还是提示有四个抓取异常的页面,全部为域名/?p=数字的链接,打开均为404,请问应该如何处理?

百度抓取异常的页面的原因有:网页不存在、服务器无法正常提供信息,或是服务器无法回应,也就是常说的网站404页面。具体的解决方法是在网站中设置一个404页面。具体的步骤如下:

1.先下载或者根据网站制作一个404错误页面,优化404页面,添加一些导航菜单或者返回首页的超链接;

2.打开网站使用服务器的FTP,登陆网站的后台;

3.登陆FTP,打开网站的根目录htdocs;

4.把刚刚我们下载好的404模板,用鼠标拖进左下角的任务栏,单击鼠标右键传输到根目录。(这里说下,404模板名字一定是命名“404”,比如:404.html这个才是正确的,其他命名名字,系统会无法识别的);

5.进入到网站主机的管理后台,输入个人的账号登陆,然后点击管理控制台;

6.进入到主机后台后,点击站点信息,打开基础环境设置,直接设置404页面。

7.进入404错误页面设置界面,点击“浏览”选中刚刚上传的404模板,点设置404错误页面就好了;

8.测试是否已经成功设置404,在浏览器中输入自己的域名,在域名后缀加斜杠随便打几个字母测试。比如:xxxx.com/dfddfdsd,如图;

温馨提示:内容为网友见解,仅供参考
第1个回答  推荐于2018-03-29

要看具体的问题,再针对问题解决抓取异常的问题

网站抓取异常分析:

    域名到期(或者域名转出等出现暂时不能访问就会出现抓取异常)

    服务器不稳定

    网站程序有问题

    robots.txt文件里设置了拒绝百度蜘蛛抓取的代码

    网站被挂马

解决方案:

    查询域名是否到期,到期了需续费恢复正常

    服务器不稳定 咨询供应商及其解决稳定问题并修复

    网站程序有问题找建站程序员检测问题并修复

    robots.txt文件里拒绝百度蜘蛛抓取的代码删除掉并更新

    网站被挂马,要查询挂马文件在哪里并删除,恢复网站,更改登录名和密码,安全密保要从新设置,防止下次被挂马

第2个回答  2014-08-26
它可以帮助你检查错误的链接,不仅仅是URL链接,还包行DNS解析失败、服务器链接、robots.txt 文件等问题,几乎所有网站都会出现抓取错误。 网 站站长工具将错误分为两类:网站错误(site errors)和链接地址错误(URL errors)。如果在一个网站上出现多个抓取错误,那么你的网站信任度会下降,甚至会影响到排名,当然这工具对于百度优化同样有效。那么应当如何解决 Google网站管理员工具的抓取错误呢。 通过Googlebot抓取的错误分类就看知道是什么导致抓取错误的原因了。 一、HTTP的错误 当一个网站上的网页(例如,当用户在浏览器中访问您的网页或Googlebot抓取页面时)到您的服务器发出请求,服务器返回HTTP状态码响应请求。 如果出现403状态,可以不用理睬,这表明是你的主机阻止了Googlebot抓取。对于所有HTTP状态码的列表文件,可以参考Google HTTP状态码帮助页面。 二、Sitemap中的错误 Sitemap错误往往会造成404错误页面,或在当前地图返回一个404错误页面,如果出现404错误页面请检查Sitemap中所有的链接, Google会不断抓取你已经删除的Sitemap,这点很郁闷,但也有办法解决:确保旧的Sitemap已经在管理员工具中被删除。如果不想被抓取,确保旧Sitemap出现404或者重新定向到新的Sitemap。 来自Google员工Susan Moskwa解释道: 阻止Googlebot的爬行,最好的办法是使这些网址(例如旧的sitemaps)出现404,当我们看到一个URL多次出现404后,Googlebot会停止爬行。 三、重定向错误 有些错误是因为301从定向引起的,执行重定向后要注意什么: 1:确保他们返回到正确的HTTP状态码。 2:确保没有任何循环重定向。 3:确保重定向指向有效的网页,而不是404页,或其他错误页,如503(服务器错误)或403(禁止抓取) 4:确保重定向不是指向一个空页面。 四、404错误 404错误可能会出现在以下几个方面: 1:删除了网站上的网页; 2:改变了网页的名称; 4:链接到了一个不存在的页面; 5:其他网站链接到你网站上一个不存在的页面; 6:网站迁移到一个新的域名不完全匹配的网站。 五、受robots.txt限制 还有一个原因是robots.txt文件阻止了Googlebot的抓取,如果出现大量抓取错误,第一步应该检查robots.txt 六、软404错误 通 常情况下,当有人请求的页面不存在,服务器将返回一个404(未找到)错误。除了在响应请求的页面不存在返回404代码,服务器也将显示一个404页。 这可能是一个标准的“未找到文件”的消息,或旨在提供更多信息的用户,它可能是一个自定义页面。
第3个回答  2014-08-27
可以选择修改;至于结构调整方案,等你改完了再说吧,一步一步来。追问

现在那些链接打开都是404,我并不知道他本来链接到什么地方,怎么办

本回答被提问者和网友采纳
第4个回答  2016-01-15

百度抓取异常,是有4种不同的情况的,要看你是哪种情况啦

如何处理百度抓取异常的页面?
1.先下载或者根据网站制作一个404错误页面,优化404页面,添加一些导航菜单或者返回首页的超链接;2.打开网站使用服务器的FTP,登陆网站的后台;3.登陆FTP,打开网站的根目录htdocs;4.把刚刚我们下载好的404模板,用鼠标拖进左下角的任务栏,单击鼠标右键传输到根目录。(这里说下,404模板名字一定是命名...

百度恢复异常页面方法步骤 百度如何开启恢复异常页面
1.首先点击打开手机中的百度软件进入界面后,在右下角点击我的进入到个人中心界面里,再在中间的功能选项里找到更多后在上面点击选择。2.当页面右侧弹出一个菜单窗口时,在里面点击左下角的设置功能打开。3.跳转进入到设置界面后,在其中找到恢复异常关闭页,并在它的后面点击对应的开关按钮,把按钮设置...

百度网站抓取异常的原因有哪些?有什么影响和解决方法?松友饮
原本正常的链接后来失效了就是死链接,死链接发送请求时,服务器返回404错误页面。死链的处理方案可以通过百度站长平台提交死链文件。链接异常原因 1、访问被拒绝 爬虫发起抓取,httpcode返回码是403。2、找不到页面 爬虫发起抓取,httpcode返回码是404。3、服务器错误 爬虫发起抓取,httpcode返回码是5XX 4...

这是个关于百度抓取的问题,socket读写错误,怎么解决?
1、登录百度站长平台。2、选择搜索服务->抓取诊断,根据需要,可以选择pc端或mobile端的百度蜘蛛。3、输入网站的某url后缀提交抓取请求。4、等待几秒后,查看抓取结果,同时可以查看蜘蛛抓取页面的响应HTML。对于大规模站点群或大量二级域名的场景,批量提交无法通过人工实现,这时可以借助百度抓取诊断的批量提...

网站被非法入侵攻击导致被百度K怎么办
1、找到被挂的木马,删除,并彻底清理,查看服务器有没有被挂病毒;2、如果可以网站加安全狗,设置登录次数;3、网站首页加隐藏关键词,并每天按时更新文章;4、重新在百度统计后台,连续提交整个网站的网址和sitemap,让百度重新抓取你的网站;坚持这样做基本在半个月左右就能恢复正常(小网站)。

网站被百度抓取一次异常后什么操作?
服务器和DNS的问题可以通过百度站长平台里的网站异常提醒工具看出。这里面会记录着服务器无法连接或百度蜘蛛无法抓取网站的时间和次数。必要时需要联络服务器提供高或域名注册商进行百度蜘蛛抓取测试,排除服务器屏蔽百度蜘蛛或DNS无法被百度识别情况。2、挂马导致降权:删除恶意代码、修复漏洞、申请删除快照网站被挂马是大...

百度渲染蜘蛛(Baiduspider-render)抓取到的异常页面全部是404怎么办
提取这些页面链接,然后做成死链接文件上传到网站根目录中。在通过百度资源平台的死链提交工具进行提交!也可以直接制作404页面放入站点根目录里,然后在服务器上设置好404页面,这样对网站优化来说就没有太大的影响了!

网站在百度检测出被篡改了,请问要怎么修复啊?
查询的方法很简单,打开搜索引擎site你的网站,从标题、描述等基本信息可以看到是否与网站符合,同时也可以点击【百度快照】按钮,看一下,网站被百度抓取的内容,是否与自己的内容符合。那么出现这一种情况如何解决呢,最快速的办法就是打开自己快照被劫持的页面,查看源代码,然后找到快照劫持的JS(通常情况...

网站能正常访问,但是百度与360抓取诊断错误,可是搜狗抓取诊断就正常。这...
抓取异常的原因有哪些一、网站异常 1、dns异常当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。2、连接超时抓取请求连接...

百度spider无法抓取站点如何解决?
首先你要检查一下robots.txt文件是否设置正确,然后看网站打开是否正常,还要看网站速度是否正常。以上这几点都有可能曩蜘蛛抓取的,如果有问题就忙处理。还有一种情况,有时候是蜘蛛自己的问题。这个我以前就遇到过。你可以尝试搜狗或360抓取是否正常,如果是正常的,那应该问题不在你,可以暂时不管它。

相似回答