織夢dedecms采集中用到的一些過濾規(guī)則
時間: 2020-03-16 13:15
閱讀: 次
作者:素材無憂網(wǎng)
織夢dedecms的過濾規(guī)則寫起來不是很難,規(guī)則如下:
代碼示例:
{dede:trim}要過濾的內(nèi)容{/dede:trim}
如果要過濾的內(nèi)容很簡單,完全可以把過濾規(guī)則直接寫在“{dede:trim}”和“{/dede:trim}”之間。
對于比較復雜的情況,請考慮使用正則,你懂的,正則表達式,那是相當強勁的。
以下是一些過濾規(guī)則的例子,供大家參考。
1、采集中去除內(nèi)容里的超鏈接:
代碼示例:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
假如要將所有超鏈接內(nèi)容都去除,規(guī)則是:
代碼示例:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
這兩個規(guī)則的不同通過下面代碼來解釋
例如文章代碼中包含著如下內(nèi)容:
<a href="#">超鏈接</a>
通過第一個規(guī)則,采集結(jié)果是:超鏈接
2、過濾廣告
對于廣告來說,過濾規(guī)則就得針對html中看到的內(nèi)容使用規(guī)則了,例如某些廣告僅僅是引用某個JS文件,例如
代碼示例:
<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>
這樣的規(guī)則只需
代碼示例:
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}
如果某些廣告的內(nèi)容是JS代碼寫在<script></script>區(qū)間里的,例如GG的廣告,那么過濾規(guī)則應該是:
代碼示例:
{dede:trim}<script>(.*)</script>{/dede:trim}
3、一些測試過的過濾規(guī)則
代碼示例:
{dede:trim}<!–(.*)–>{/dede:trim}
{dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim}
{dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim}
{dede:trim}<select([^>]*)>{/dede:trim}
{dede:trim}</select>{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
//by www.jbxue.com//
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim} // 內(nèi)容來自www.jbxue.com//
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<script>(.*)</script>{/dede:trim}
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}
版權(quán)聲明:
本站資源均來自互聯(lián)網(wǎng)或會員發(fā)布,如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時內(nèi)刪除!謝謝!
轉(zhuǎn)載請注明:
織夢dedecms采集中用到的一些過濾規(guī)則
標簽: