用dedecms怎樣采集新浪新聞呢!現(xiàn)在很多的小型的門戶網(wǎng)站都有自己的資源站,但是要每個資源站都自己來寫文章,發(fā)表文章,不僅需要大量的人力物力,而且量也很大,故而都會選擇偽原創(chuàng),采集大型的門戶數(shù)據(jù),把它們綜合成自己的
那接下來,就為大家提供一下,用dedecms采集新聞新聞的方法.
如果我要采集http://sports.sina.com.cn/nba/okc.shtml這個網(wǎng)頁下的所有文章,那我改怎么配置呢dedecms呢,
下面提供一段代碼,你首先復制下面代碼,然后進入dedecms后臺點采集->采集結(jié)點管理->導入配置然后修改 引用網(wǎng)址,手工指定網(wǎng)址,預覽網(wǎng)址這三項,你再保存并測試就可以啦
{dede:listconfig}
{dede:noteinfo notename="俄克拉荷馬城雷霆_新浪" channelid="1" macthtype="string"
refurl="http://sports.sina.com.cn/k/2012-07-20/06186140620.shtml" sourcelang="gb2312" cosort="asc"
isref="no" exptime="10" usemore="0" /}
{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://"
startid="1" endid="" addv="1" urlrule="area" musthas="http://sports.sina.com.cn/k/"
nothas="" listpic="1" usemore="0"}
{dede:addurls}http://sports.sina.com.cn/nba/okc.shtml{/dede:addurls}
{dede:batchrule}{/dede:batchrule}
{dede:regxrule}{/dede:regxrule}
{dede:areastart}<div id="right">{/dede:areastart}
{dede:areaend}</div>{/dede:areaend}
{/dede:listrule}
{/dede:listconfig}
{dede:itemconfig}
{dede:sppage sptype='full' srul='1' erul='5'}{/dede:sppage}
{dede:previewurl}http://sports.sina.com.cn/k/2012-07-20/06186140620.shtml{/dede:previewurl}
{dede:keywordtrim}{/dede:keywordtrim}
{dede:descriptiontrim}{/dede:descriptiontrim}
{dede:item field='title' value='' isunit='' isdown=''}
{dede:match}<title>[內(nèi)容]</title>{/dede:match}
{dede:trim replace=""}_籃球-NBA_新浪競技風暴_新浪網(wǎng){/dede:trim}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='writer' value='' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='source' value='' isunit='' isdown=''}
{dede:match}<span>[內(nèi)容]</span>{/dede:match}
{dede:trim replace="胡鵬博客"}新浪體育{/dede:trim}
{dede:trim replace=""}<a([^>]*)>|</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='pubdate' value='' isunit='' isdown=''}
{dede:match}<span id="pub_date">[內(nèi)容]</span>{/dede:match}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='body' value='' isunit='1' isdown='1'}
{dede:match}<!--正文上部推廣 begin-->[內(nèi)容]<!-- publish_helper_end -->{/dede:match}
{dede:trim replace=""}<a([^>]*)>|</a>{/dede:trim}
{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace=""}<!--(.*)-->{/dede:trim}
{dede:trim replace=""}<style([^>]*)>(.*)</style>{/dede:trim}
{dede:trim replace=""}<iframe([^>]*)>(.*)</iframe>{/dede:trim}
{dede:trim replace="胡鵬博客"}新浪體育{/dede:trim}
{dede:trim replace=""}\(微博\){/dede:trim}
{dede:trim replace="圖形"}點擊觀看組圖|點擊觀看高清組圖{/dede:trim}
{dede:trim replace=""}\(<span([^>]*)>點擊觀看進球視頻</span>\){/dede:trim}
{dede:trim replace=""}(<span([^>]*)>點擊觀看進球視頻</span>){/dede:trim}
{dede:trim replace=""}\(點擊觀看進球視頻\){/dede:trim}
{dede:trim replace=""}\(點擊觀看進球視頻\){/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
{/dede:itemconfig}
版權(quán)聲明: 本站資源均來自互聯(lián)網(wǎng)或會員發(fā)布,如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時內(nèi)刪除!謝謝!
轉(zhuǎn)載請注明: 用dedecms采集新浪新聞的方法