織夢dedecms的過濾規(guī)則寫起來不是很難,規(guī)則如下:
代碼示例:
{dede:trim}要過濾的內容{/dede:trim}
如果要過濾的內容很簡單,完全可以把過濾規(guī)則直接寫在“{dede:trim}”和“{/dede:trim}”之間。
對于比較復雜的情況,請考慮使用正則,你懂的,正則表達式,那是相當強勁的。
以下是一些過濾規(guī)則的例子,供大家參考。
1、采集中去除內容里的超鏈接:
代碼示例:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
假如要將所有超鏈接內容都去除,規(guī)則是:
代碼示例:
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
這兩個規(guī)則的不同通過下面代碼來解釋
例如文章代碼中包含著如下內容:
<a href="#">超鏈接</a>
通過第一個規(guī)則,采集結果是:超鏈接
2、過濾廣告
對于廣告來說,過濾規(guī)則就得針對html中看到的內容使用規(guī)則了,例如某些廣告僅僅是引用某個JS文件,例如
代碼示例:
<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>
這樣的規(guī)則只需
代碼示例:
{dede:trim}<script(.*)>{/dede:trim}
{dede:trim}</script>{/dede:trim}
如果某些廣告的內容是JS代碼寫在<script></script>區(qū)間里的,例如GG的廣告,那么過濾規(guī)則應該是:
代碼示例:
{dede:trim}<script>(.*)</script>{/dede:trim}
3、一些測試過的過濾規(guī)則
代碼示例:
{dede:trim}<!–(.*)–>{/dede:trim} {dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim} {dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim} {dede:trim}<select([^>]*)>{/dede:trim} {dede:trim}</select>{/dede:trim} {dede:trim}<param([^>]*)>{/dede:trim} {dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim} {dede:trim}<embed([^>]*)>{/dede:trim} {dede:trim}</embed>{/dede:trim} {dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim} {dede:trim}<object([^>]*)>{/dede:trim} {dede:trim}</object>{/dede:trim} {dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim} {dede:trim}<OBJECT([^>]*)>{/dede:trim} {dede:trim}</OBJECT>{/dede:trim} {dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim} {dede:trim}<iframe([^>]*)>{/dede:trim} //by www.dedecms51.com// {dede:trim}</iframe>{/dede:trim} {dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim} {dede:trim}<IFRAME([^>]*)>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim} {dede:trim}<font([^>]*)>{/dede:trim} {dede:trim}</font>{/dede:trim} {dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim} {dede:trim}<a([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim} {dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim} {dede:trim}<td([^>]*)>{/dede:trim} {dede:trim}</td>{/dede:trim} {dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim} {dede:trim}<tr([^>]*)>{/dede:trim} {dede:trim}</tr>{/dede:trim} {dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim} {dede:trim}<tbody>{/dede:trim} {dede:trim}</tbody>{/dede:trim} // 內容來自www.dedecms51.com// {dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim} {dede:trim}<table([^>]*)>{/dede:trim} {dede:trim}</table>{/dede:trim} {dede:trim}<span([^>]*)>{/dede:trim} {dede:trim}</span>{/dede:trim} {dede:trim}</IFRAME>{/dede:trim} {dede:trim}<script>(.*)</script>{/dede:trim} {dede:trim}<script(.*)>{/dede:trim} {dede:trim}</script>{/dede:trim} |
版權聲明: 本站資源均來自互聯(lián)網或會員發(fā)布,如果侵犯了您的權益請與我們聯(lián)系,我們將在24小時內刪除!謝謝!
轉載請注明: 織夢采集中用到的一些過濾規(guī)則