我們講到了采集內(nèi)容的弊端與風(fēng)險(xiǎn),但仍然有不少網(wǎng)站為了快速充實(shí)網(wǎng)站的內(nèi)容,不斷地采集內(nèi)容,以獲取更大的流量,追求網(wǎng)站短期內(nèi)的最大利益而不顧一切。我們只能通過(guò)一些技術(shù)手段采取措施防止內(nèi)容被采集。
1.加上隨機(jī)廣告或版權(quán)聲明網(wǎng)站
采集者在采集時(shí),通常都是指定頭尾特征從哪到哪過(guò)濾。我們可以在文章頭尾加隨機(jī)廣告,當(dāng)然隨機(jī)廣告是不固定的。比如文章的內(nèi)容是“防止網(wǎng)站內(nèi)容被采集的4種方法”,則可以這樣加入隨機(jī)廣告或版權(quán)說(shuō)明:
<div id=”xxx”>隨機(jī)廣告 “防止網(wǎng)站內(nèi)容被采集的4種方法”內(nèi)容出自XX網(wǎng)站(xxx.com)</div>
2.圖片防盜鏈
現(xiàn)在很多博客服務(wù)商都作了圖片防盜鏈處理,由服務(wù)器程序判斷,當(dāng)前圖片被外部調(diào)用時(shí),提示“此圖片僅限于XX用戶之間交流與溝通”,這只對(duì)有圖片的內(nèi)容有效,不管圖片被保存到本地還是遠(yuǎn)程連接都可以防止被盜。
3.使用多套模板
采集器的原理就是根據(jù)關(guān)鍵字符串找出要采集的內(nèi)容,多做幾個(gè)列表和內(nèi)容模板,使用隨機(jī)模板可有效地防止采集器,并對(duì)搜索引擎無(wú)任何影響。模板越多,采集者需要定制的對(duì)策采集模板就越多。但是需要懂得采集器原理來(lái)制作防采集模板,不然就會(huì)白費(fèi)工夫。
4.使用專(zhuān)業(yè)的防采集軟件
目前防采集這塊做得不錯(cuò)的軟件要算魚(yú)羊防采集了,它能在很大程度上防止采集器的采集。其對(duì)網(wǎng)頁(yè)瀏覽速度無(wú)影響,不需要專(zhuān)業(yè)知識(shí)與技巧,對(duì)搜索引擎無(wú)影響。最新的v3.0版只能運(yùn)行在Windows的IIS下,需要獨(dú)立的服務(wù)器。