花魁直播高品质美女在线视频互动社区 - 花魁直播官方版

 歡迎來(lái)到素材無(wú)憂(yōu)網(wǎng),按 + 收藏我們
登錄 注冊(cè) 退出 找回密碼

帝國(guó)CMS-robots.txt文件使用教程

時(shí)間: 2020-09-16 10:50 閱讀: 作者:素材無(wú)憂(yōu)網(wǎng)

 在說(shuō)帝國(guó)CMS-robots.txt文件使用前先給大家解釋下robots.tx是干什么的。

robots協(xié)議(也稱(chēng)為爬蟲(chóng)協(xié)議、爬蟲(chóng)規(guī)則、機(jī)器人協(xié)議等)也就是robots.txt,網(wǎng)站通過(guò)robots協(xié)議告訴搜索引擎哪些頁(yè)面可以抓取,哪些頁(yè)面不能抓取。Robots協(xié)議是網(wǎng)站國(guó)際互聯(lián)網(wǎng)界通行的道德規(guī)范,其目的是保護(hù)網(wǎng)站數(shù)據(jù)和敏感信息、確保用戶(hù)個(gè)人信息和隱私不被侵犯。因其不是命令,故需要搜索引擎自覺(jué)遵守。一些病毒如malware(馬威爾病毒)經(jīng)常通過(guò)忽略robots協(xié)議的方式,獲取網(wǎng)站后臺(tái)數(shù)據(jù)和個(gè)人信息。

robots.txt文件是一個(gè)文本文件,使用任何一個(gè)常見(jiàn)的文本編輯器,比如Windows系統(tǒng)自帶的Notepad,就可以創(chuàng)建和編輯它。robots.txt是一個(gè)協(xié)議,而不是一個(gè)命令。robots.txt是搜索引擎中訪問(wèn)網(wǎng)站的時(shí)候要查看的第一個(gè)文件。robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。
當(dāng)一個(gè)搜索蜘蛛訪問(wèn)一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來(lái)確定訪問(wèn)的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問(wèn)網(wǎng)站上所有沒(méi)有被口令保護(hù)的頁(yè)面。百度官方建議,僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容時(shí),才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容,請(qǐng)勿建立robots.txt文件。
如果將網(wǎng)站視為酒店里的一個(gè)房間,robots.txt就是主人在房間門(mén)口懸掛的“請(qǐng)勿打擾”或“歡迎打掃”的提示牌。這個(gè)文件告訴來(lái)訪的搜索引擎哪些房間可以進(jìn)入和參觀,哪些房間因?yàn)榇娣刨F重物品,或可能涉及住戶(hù)及訪客的隱私而不對(duì)搜索引擎開(kāi)放。但robots.txt不是命令,也不是防火墻,如同守門(mén)人無(wú)法阻止竊賊等惡意闖入者。

帝國(guó)CMS默認(rèn)robots.txt為

#
# robots.txt for EmpireCMS
#

 

User-agent: *                               *允許所有搜索引擎抓取

Disallow: /d/                                *禁止所有搜索引擎抓取D目錄
Disallow: /e/class/                     *禁止所有搜索引擎抓取/e/class/ 目錄
Disallow: /e/data/                       *禁止所有搜索引擎抓取/e/data/ 目錄
Disallow: /e/enews/                   *禁止所有搜索引擎抓取/e/enews/ 目錄
Disallow: /e/update/                   *禁止所有搜索引擎抓取/e/update/ 目錄

版權(quán)聲明: 本站資源均來(lái)自互聯(lián)網(wǎng)或會(huì)員發(fā)布,如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除!謝謝!

轉(zhuǎn)載請(qǐng)注明: 帝國(guó)CMS-robots.txt文件使用教程

標(biāo)簽:  
模板推薦