新人須知如何利用搜索引擎消除噪音

搜索引擎的消噪很多情況下都是對於同一個網站的,其中搜索引擎不會因爲網站的某個部分而去判斷另一個網站對應部分也是噪音,現在搜索引擎消噪原理可以分爲三大類:

新人須知如何利用搜索引擎消除噪音

  第一:可視化信息原理

利用頁面中元素的佈局信息對頁面進行劃分,並保留頁面中間區域,其他區域則被認爲是噪音。

  第二:網頁結構原理

根據html標籤對頁面進行分區,分出頁頭、導航、正文、廣告等區域,抓住正文等重要部分。

  第三:模板原理

從一組網頁中提取相同的模板,然後利用模板從網頁中篩選有用的信息。

  怎樣利用搜索引擎消噪

第一:搜索引擎基於可視化信息識別噪音,因此想要儘快消噪就一定要遵循搜索引擎通用原則,把正文內容安排在頁面中間區域,不要出現個性化頁面,這樣會增加搜索引擎識別噪音難度。

第二:搜索引擎基於網頁結構識別噪音,根據網頁HTML標籤先抓取後區分,與正文沒有關係的'內容不被抓取就是減噪了,有很多區域如頁頭、廣告等內容都是通過JS調用來實現的,因爲這些區域的內容很多都是重複的,尤其是廣告、版權等這方面,一旦被收錄就要進行消噪處理,可能會造成重複,但需要注意的是放入JS版塊的都是不想被抓取的。

第三:搜索引擎會基於網頁模版識別噪音,這些是針對同一個網站來說的,網站的模板相同可以更快的處理噪音,我們在建設網頁時最好採用同一套模板,不要輕易改動模板,以幫助搜索引擎識別噪音區域,如果網站中頁面中每個模板都不一樣,那麼搜索引擎對每個模板都有重新識別一次,這樣就增加了處理時間。