一、 分析網(wǎng)站日志,看是否有被蜘蛛爬過
作為站長一定要學(xué)會網(wǎng)站日志的分析,網(wǎng)站日志里面可以告訴我們表面看不到的隱藏問題。
1)、如果未被收錄的頁面未被蜘蛛爬行
頁面沒有被Baiduspider爬行,那么你可以適當(dāng)?shù)慕o該頁面做一些外鏈來引導(dǎo)蜘蛛過來爬行,也可以給搜索引擎提交該頁面。
2)、如果頁面已經(jīng)被Baiduspider爬行過了
頁面被爬行也沒被收錄,那么就可能存在的因素:
1、 第一次被Baiduspider爬行,從百度的綜合算法來看該頁面的價值性極低,再考核要不要創(chuàng)建索引。
2、 第二次被Baiduspider爬行,該頁面從始至終都未有任何的變動,決定對此頁面暫停分析。
3、 第三次被Baiduspider爬行,該頁面還是沒變動,并且這么長時間也未出現(xiàn)其它的附加價值(附加價值:評論,分享,被轉(zhuǎn)發(fā)等等),決定不予收錄。
要知道Baiduspider也是很忙的,沒有那么多的閑工夫天天來爬行你這些未收錄的頁面,所以,當(dāng)出現(xiàn)頁面長時間都不被百度收錄的話,那么就要適當(dāng)?shù)慕o該頁面增加一些附加價值或者對該頁面進(jìn)行重新的進(jìn)行修改。你可以對文本新增一些圖片,視頻或者內(nèi)容,也可以對標(biāo)題進(jìn)行再次編輯。總之,要讓Baiduspider再次過來爬行的時候,返回的狀態(tài)碼不是一個無變化的狀態(tài),這樣你的頁面被收錄的幾率就大大的提升了。
第二、 是否robots設(shè)置錯誤,主動屏蔽Baiduspider
Robots的設(shè)置也是非常重要的,這個很多人可能對這些還不了解。建議大家可以到百度站長工具資訊里面看,那里面有詳細(xì)的教程。若是自己robots設(shè)置的問題,那么自己進(jìn)行糾正后,再在百度站長工具后臺里面進(jìn)行更新robots這樣的話好讓百度蜘蛛重新更改狀態(tài)。
第三、 網(wǎng)站頁面是否存在敏感詞
如今越來越多的詞對搜索引擎來說都有一定的敏感,敏感詞很有可能造成你的頁面不被收錄,有時候也會造成網(wǎng)站被將去或被k。所以站長們再建設(shè)內(nèi)容的時候一定要注意不要在文中出現(xiàn)敏感詞。
第四、 你的頁面內(nèi)容是否是采集的
百度老大之前有表明過,數(shù)據(jù)庫里面肯定會存在完完全全的重復(fù)的內(nèi)容。但是也會有一定的限制。比如一篇文章上限被收錄20篇,那么當(dāng)已經(jīng)被收錄20篇了,那么無論是你還是他人在轉(zhuǎn)載更新的話也不會被收錄。