有什么好方法防止自己網(wǎng)頁的內(nèi)容被采集
網(wǎng)站采集者在采集時,通常都是指定頭尾特征從哪到哪過濾.我們這里講的第一種方法:文章頭尾加隨機(jī)廣告,當(dāng)然隨機(jī)廣告是不固定的。
比如你的文章內(nèi)容是"校內(nèi)網(wǎng)涂鴉代碼",則隨機(jī)廣告的加入方法:
<div id="xxx">隨機(jī)廣告1歡迎訪問校內(nèi)網(wǎng)涂鴉代碼站隨機(jī)廣告2</div>
注:隨機(jī)廣告1和隨機(jī)廣告2每篇文章只要隨機(jī)顯示一個就可以了.
防采集第二種方法:在文章正文頁面插入重復(fù)特征頭尾代碼的注釋。文章列表加隨機(jī)不同的鏈接標(biāo)簽,比如<a href="",<a class="dds" href=''
當(dāng)然,這個可以用正則去掉,但足于對付通用的CMS采集系統(tǒng)了。。
<!--<div id="xxx_文章ID">-->
其它標(biāo)題或內(nèi)容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
隨機(jī)廣告1歡迎訪問4399com小游戲站隨機(jī)廣告2
<--</div>--></div><--</div>-->
防采集第三種方法:加在文章列表的隨便鏈接樣式。
即:正文頭尾或列表頭尾添加<!--重復(fù)特征代碼-->
原理是讓采集的人無法抓到列表鏈接規(guī)律,無法批量進(jìn)行采集.
請看:
<a href="xxx.html">標(biāo)題一</a>
<a alt="xxx" href="xxx.html">標(biāo)題二</a>
<a href='xxx.html'>標(biāo)題三</a>
<a href=xxx.html>標(biāo)題四</a>
如果你把三種方法全部加上,我想一定能讓想采集的人頭疼半天而放棄的..
如果你還問,如何防止別人復(fù)制采集呢?要做到這一點容易,把你的網(wǎng)站的網(wǎng)線拔了,自己給自己看就好了.
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。