dedecms自帶的采集系統(tǒng)確實(shí)很不錯(cuò),可以免去一些手工添加信息的麻煩,設(shè)置一下dede采集規(guī)則、采集點(diǎn),然后點(diǎn)采集,OK,幾百篇文章就搞定了!呵呵,確實(shí)很省事的!下面介紹幾種常用采集規(guī)則的過(guò)濾方法:
應(yīng)用示例一:dedecms過(guò)濾標(biāo)題空格
經(jīng)常在采集文章的時(shí)候,標(biāo)題文字里面有空格,采回來(lái)后應(yīng)用很是麻煩,所以需要在標(biāo)題處過(guò)濾處添加下面正則過(guò)濾
{dede:trim} {/dede:trim} 注意:中間是有一個(gè)空格
應(yīng)用示例二:來(lái)源作者中連接的過(guò)濾
在采集文章的時(shí)候,有的網(wǎng)站系統(tǒng)里面作者或者來(lái)源處都帶有連接,直接采集的話將連接采集回來(lái)了,然后由于這兩個(gè)字段有限制,通常會(huì)造成需要采集的內(nèi)容沒(méi)有采集回來(lái),所以需要在過(guò)濾處添加下面正則過(guò)濾。
1,如果要保留dedecms鏈接中的文字:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
2,如果去掉鏈接中的文字:
{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}
應(yīng)用示例三:文章內(nèi)容中連接以及其他廣告代碼的過(guò)濾
這個(gè)就不用說(shuō)了,當(dāng)需要對(duì)所有東西過(guò)濾的時(shí)候,直接用上面所有的代碼過(guò)濾就可以,但是實(shí)際應(yīng)用中,我們只需要對(duì)連接、動(dòng)畫(huà)、調(diào)用等進(jìn)行過(guò)濾。(這個(gè)需要按照對(duì)方內(nèi)容里面具體含有什么代碼來(lái)具體操作)
一般的只有鏈接,使用二中的代碼進(jìn)行過(guò)濾就可以了,但是實(shí)際上一般的網(wǎng)站現(xiàn)在都在內(nèi)容里面加有廣告等,所以采取下面的過(guò)濾正則就可以完成過(guò)濾:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
過(guò)濾p可以用
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
過(guò)濾js用下面這個(gè)
{dede:trim}]*)>([^<]*){/dede:trim}
過(guò)濾未知變量字符
固定(.*)固定
應(yīng)用示例四:過(guò)濾GG廣告代碼
其實(shí)這個(gè)就是在上面的內(nèi)容過(guò)濾,但是很多論壇里的網(wǎng)友經(jīng)常問(wèn)這個(gè),所以單獨(dú)作為一個(gè)應(yīng)用列出來(lái):
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}
下面是在綜合論壇上網(wǎng)友的各種正則的一個(gè)dedecms規(guī)則過(guò)濾全集:
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}
好了,上面四種應(yīng)用基本上涵蓋了采集的各種應(yīng)用,掌握了這個(gè),過(guò)濾基本上就不用求人了!下面教大家一個(gè)更簡(jiǎn)單的方法,把下面的過(guò)濾規(guī)則復(fù)制到你那里去,幾乎就可以處理所有的問(wèn)題了,當(dāng)然也可以自己分析一下。
{dede:trim}<span(.*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim}<p(.*)>{/dede:trim}
{dede:trim}</p>{/dede:trim}
{dede:trim}<li>{/dede:trim}
{dede:trim}</li>{/dede:trim}
{dede:trim}<ul>{/dede:trim}
{dede:trim}</ul>{/dede:trim}
{dede:trim}<font(.*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<table(.*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<tbody(.*)>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<tr(.*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<td(.*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<a(.*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<iframe(.*)</iframe>{/dede:trim}
{dede:trim}<style(.*)</style>{/dede:trim}
{dede:trim}<script(.*)</script>{/dede:trim}
{dede:trim}<option(.*)</option>{/dede:trim}
{dede:trim}<select(.*)</select>{/dede:trim}
{dede:trim}<embed(.*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<param(.*)</param>{/dede:trim}
{dede:trim}<object(.*)</object>{/dede:trim}
上面這一段萬(wàn)能采集過(guò)濾代碼,不能用來(lái)采集帶有視頻的頁(yè)面,因?yàn)橐呀?jīng)過(guò)濾了視頻,最后的四行是過(guò)濾掉視頻的。如果你確認(rèn)要采集視頻,那就去掉最后四行。
另外,提供ecshop二次開(kāi)發(fā)和ecshop精美模板,敬請(qǐng) 關(guān)注木木軒商鋪( http://mumu58.taobao.com)。
版權(quán)聲明: 本站資源均來(lái)自互聯(lián)網(wǎng)或會(huì)員發(fā)布,如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除!謝謝!
轉(zhuǎn)載請(qǐng)注明: dedecms采集過(guò)濾規(guī)則 萬(wàn)能采集過(guò)濾代碼 常用過(guò)濾