昨天百度升級(jí)了藍(lán)天算法,升級(jí)這個(gè)算法主要是打擊垃圾目錄發(fā)布低質(zhì)量虛假和站點(diǎn)主題無關(guān)的內(nèi)容,百度在公告上已經(jīng)說的很清楚了,這種做法嚴(yán)重干擾秩序,侵害了優(yōu)質(zhì)開發(fā)者的權(quán)益,所以百度才不得不升級(jí)算法來遏制作弊者。
百度在這篇公告中,順便發(fā)了一張違規(guī)行為案例,從最新的案例來看,這個(gè)網(wǎng)站的違規(guī)頁面已經(jīng)被刪除,可見這個(gè)網(wǎng)站的運(yùn)營(yíng)者求生欲很強(qiáng),但是違規(guī)目錄依舊沒有刪除。
那么我們從百度發(fā)的公告當(dāng)中,我們需要注重2點(diǎn):
一、低質(zhì)量?jī)?nèi)容被打壓
事實(shí)上百度算法可以識(shí)別內(nèi)容的質(zhì)量度,行業(yè)內(nèi)有不少的同學(xué)依舊認(rèn)為,百度是無法識(shí)別質(zhì)量的,事實(shí)上,百度是有算法,可以辨別質(zhì)量度的,具體書籍請(qǐng)參考搜索引擎相關(guān)原理。
二、跟站點(diǎn)主題無關(guān)的內(nèi)容
我個(gè)人分析,百度算法是有能力通過你的內(nèi)容來辨別主題的,也就是說我們?cè)诎l(fā)布的內(nèi)容之后,百度是可以通過算法來判斷你的網(wǎng)站屬于什么領(lǐng)域,這個(gè)沒有實(shí)質(zhì)性的證據(jù),但是我們可以看一下頭條在這一塊是怎么做的,我之前研究過頭條的算法,因?yàn)轭^條之前有選擇領(lǐng)域,那個(gè)時(shí)候是因?yàn)轭^條算法上還不夠成熟,所以只能靠人工去選擇領(lǐng)域才能判斷賬號(hào)的領(lǐng)域,但是隨著后期頭條算法的迭代,人工選擇領(lǐng)域已經(jīng)沒有什么實(shí)際意義了,這里舉個(gè)例子,比如說你的內(nèi)容中包含劉德華,周星馳或者某些明星的名字或電影,頭條會(huì)根據(jù)算法判斷為你的賬號(hào)屬于娛樂領(lǐng)域,所以我個(gè)人認(rèn)為頭條都可以,從內(nèi)容判斷領(lǐng)域,百度應(yīng)該也可以實(shí)現(xiàn)的。
從行業(yè)內(nèi)不少人來看,百度升級(jí)藍(lán)天算法,目的在打擊目錄站和b2b行業(yè),因?yàn)檫@些行業(yè)基本上就是低質(zhì)量?jī)?nèi)容的孵化池,所以也有不少人猜測(cè),百度這波操作,是不是要推出什么產(chǎn)品?如果站長(zhǎng)不幸中的算法還有什么辦法可以挽救嗎?答案是有的,因?yàn)榘俣人{(lán)天算法打擊的主要就是低質(zhì)量和站點(diǎn)無關(guān)內(nèi)容,所以我們只需要目錄結(jié)構(gòu)轉(zhuǎn)成二級(jí)域名結(jié)構(gòu)就可以了,但這些做法之前要保證內(nèi)容質(zhì)量。