广州凡科互联网科技有限公司

营业时间
MON-SAT 9:00-18:00

全国服务热线
18720358503

公司门店地址
广州市海珠区工业大道北67号凤凰创意园

网页页面长渡过长也会致使不收录?

日期:2021-03-03 浏览:

网页页面长渡过长也会致使不收录?


短视頻,自新闻媒体,达人种草1站服务

近期院长收到1个十分典型的抓取提升事例,梳理1下共享给各位,各位站长们切记不必出現同样的状况:

站点意见反馈:

网站行为主体內容全是js转化成,对于客户浏览,沒有做提升;可是网站特对于爬虫抓取做了提升,且将照片也立即做了base64转换;但是提升后发现內容却不被百度搜索收录

网页页面品质很好,还特地对于爬虫做了提升,为何內容反而不收录了呢?

工程项目师剖析:

1、网站对于爬虫抓取做的提升,立即将照片2进制內容放到了html中致使网页页面长渡过长,网站网页页面长度达164k;

2、 站点提升后将行为主体內容放于最终,照片却放于前面;

3、爬虫抓取內容后,网页页面內容太长被断开,已抓取一部分没法鉴别到行为主体內容,最后致使网页页面被评定为空短而不收录。

工程项目师提议:

1、不提议站点应用js转化成行为主体內容,如js3D渲染错误,极可能致使网页页面內容载入不正确,网页页面没法抓取

2、 如站点对于爬虫抓取做提升,提议网页页面长度在128k以内,不必太长

3、对于爬虫抓取做提升,请将主题內容放于正前方,防止抓取断开导致的內容抓取不全




新闻资讯

联系方式丨CONTACT

  • 全国热线:18720358503
  • 传真热线:18720358503
  • Q Q咨询:2639601583
  • 企业邮箱:2639601583@qq.com

首页
电话
短信
联系