SEO算法問題,如何借助分詞符號過濾重復內容機制。
關于這個知識點,我在SEO優化課程里說的太多了,但是沒有深入的說,因為大部分人聽不懂。畢竟實用性不如網站布局真實。眾所周知,分詞是搜索引擎中一種獨特的算法分類,但對于搜索引擎百度來說,中文分詞占據主導地位。我們繼續思考一個SEO邏輯,分詞符號在SEO優化中能起到什么作用,尤其是對于SEO從業者。這個問題解決好了,就相當于直接解決了一個知識點,也就是處理內容重復。我們都知道,百度在計算網頁的內容重復度時,是根據詞與詞之間的關系來對內容結果進行排名的,但真正能滿足一個點的,不僅僅是詞,而是詞與詞之間構造的符號。
分詞技巧
一個網頁可以分成多個結構部分,從初的文章到分段。如果執行分割,則除了公共部分區域之外,它是文本的一種表達形式。那么這里有一個知識點。分詞符號出現的位置不一樣,能過濾的點其實也不一樣。這是什么意思?我們在下圖中顯示了它:
中文分詞
這是騰訊的中文分詞工具。如果需要使用,可以直接理解使用。從上圖我們可以看到,vx: SEO快排網站的標題在分詞后得到了這樣一個詞庫的組合,但其實我目前已經用了一個橫線。當我們添加更多的分詞符號時,我們可以有完全不同的效果,如下圖所示:
算法摘要
看這個搜索結果,是不是很精彩?技術培訓本身就是一個詞。現在增加了一個分詞符號,是分詞的結果嗎?這里肯定有人會問,這是什么角色?回到我在這篇文章的標題中寫的,是處理內容重復的問題。其實百度判斷一個網頁是不是原創,在于對內容切分后的重復度進行重新計算,分詞符號可以借助這個特征點來處理一個內容過濾和收集的問題,關鍵是看大家是否會進行深入的研究和挖掘。
有一點,上面兩個網頁的截圖,添加分詞符號和不添加額外的單詞符號得到的一個單詞的數量和內容是完全不一樣的,這也是市場上一些黑帽SEO作弊的人能把百度扭轉過來的根本原因。