前期做網(wǎng)站上線之初 采集知識(shí) 織夢(mèng)dedecms采集過(guò)濾與替換常用操作:點(diǎn)擊“常用規(guī)則”,選擇要過(guò)濾的代碼段,再編輯成我們需要的。
如果會(huì)文章簡(jiǎn)單采集了,接下來(lái)就需要過(guò)濾掉采集內(nèi)容中的廣告和鏈接及其它代碼。一般的寫法是{dede:trim}要過(guò)濾的內(nèi)容{/dede:trim} ,舉幾個(gè)例子:
1,過(guò)濾摘要和關(guān)鍵字使用,經(jīng)常要用到。
{dede:trim replace=''}{/dede:trim}
2,簡(jiǎn)單替換。
{dede:trim replace='替換后的詞語(yǔ)'}要替換的詞語(yǔ){/dede:trim}
采集的內(nèi)容當(dāng)然也要求搜索引擎收錄,過(guò)濾和替換目的是減少重復(fù),進(jìn)行偽原創(chuàng),如何具體的操作,就看個(gè)人的要求與喜好了。
3,去除超鏈接,這種最常用。
{dede:trim replace=''}<a([^>]*)>{/dede:trim}
{dede:trim replace=''}</a>{/dede:trim}
如果填成這樣,那就把鏈接的文本也一起去掉了
{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}
4,過(guò)濾JS調(diào)用廣告,比如GG的廣告,就加個(gè)這樣的:
{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}
5,過(guò)濾div標(biāo)簽
這個(gè)很重要,如果沒(méi)過(guò)濾干凈則可能使發(fā)布出來(lái)的文章版面錯(cuò)位,目前大多數(shù)遇到采集后錯(cuò)位的原因在此。
{dede:trim replace=''}<div([^.]*)>{/dede:trim}
{dede:trim replace=''}</div>{/dede:trim}
有的時(shí)候也需要這樣子過(guò)濾:
{dede:trim replace=''}<div 選擇器>(.*)</div>{/dede:trim}
版權(quán)聲明: 本站資源均來(lái)自互聯(lián)網(wǎng)或會(huì)員發(fā)布,如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除!謝謝!
轉(zhuǎn)載請(qǐng)注明: 織夢(mèng)系統(tǒng)后臺(tái)采集規(guī)則與替換規(guī)則