記得在昨天,筆者在通過CNZZ統(tǒng)計查看一個來自百度的新關鍵字時,這個網(wǎng)站是使用WordPress制作的企業(yè)網(wǎng)站,其編碼為UTF-8,在百度的搜索頁面中其URL中的漢字顯示的是亂碼.這種現(xiàn)象在以往一直存在,網(wǎng)民在使用據(jù)稱最懂中文的搜索引擎百度,看到很多奇怪的莫名其妙的字符,如星劍(starow)就曾經說過,UTF-8編碼的網(wǎng)站,URL中的百度會變成鐧懼害 ,而Google一開始也不能識別gb2312和GBK編碼URL中的漢字, 不知道早些時候何時修改了. 請看圖片:
以下為引用的內容:
就在今天4月8日,我習慣性地site:www.wysth.com ,發(fā)現(xiàn)百度竟然可以識別帶漢字的UTF-8編碼URL,我昨天剛剛升級了一個WordPress的圖片插件,以為是網(wǎng)站程序更改了,又site了我例外一個使用phpcms UTF-8編碼的茶葉網(wǎng)站(www.lincha.com)和Discuz構建的論壇(),確認百度可識別帶漢字的utf-8編碼URL了.請看圖片:
以下為引用的內容:
site: 的結果:
tag 的結果:
網(wǎng)站編碼和URL已經是SEO的重要因素之一.關于網(wǎng)站用utf-8編碼還是用gbk編碼或gb2312編碼好,這個問題在各大CMS開發(fā)論壇及各大站長論壇的討論頗多,大多站長普遍認為涉外網(wǎng)站(如外貿英文網(wǎng)站)使用UTF-8編碼,主要針對國內訪客的網(wǎng)站使用gbk或gb2312的編碼.國內幾大網(wǎng)站都是使用gb2312編碼,就連百度,Sina,Sohu,網(wǎng)易163幾大門戶也是如此。
百度從一開始就不支持識別帶漢字的utf-8編碼URL,已經存在好幾年的時間,為何數(shù)年不解決這個bug,應該不是技術問題,也許是百度為了提高用戶體驗滿意度,也許百度根本就不曾關心過這個細微的問題,也許是在Google支持gb編碼URL后跟進的, 競爭促進進步,壟斷扼殺創(chuàng)新。