網(wǎng)站日志分析是網(wǎng)站SEO優(yōu)化的重要組成部分。網(wǎng)站剛剛創(chuàng)建,我們想看看蜘蛛是否爬行;網(wǎng)站包含,我們需要知道蜘蛛的活動(dòng);網(wǎng)站包含減少,我們想看看服務(wù)器是否有問題;網(wǎng)站是K,我們想看看服務(wù)器日志中的服務(wù)器是否有問題。
因此,無論網(wǎng)站何時(shí)運(yùn)行,網(wǎng)站日志都應(yīng)該始終關(guān)注網(wǎng)站服務(wù)器日志的動(dòng)態(tài)。如何分析網(wǎng)站日志?我們需要知道哪些數(shù)據(jù)?接下來,最終的SEO顧問將與您討論網(wǎng)站日志分析的主題。在分析網(wǎng)站日志時(shí),我們應(yīng)該關(guān)注以下數(shù)據(jù):
網(wǎng)站日志記錄了蜘蛛和訪客訪問網(wǎng)站的實(shí)際情況。這些數(shù)據(jù)對網(wǎng)站具有重要意義。用戶行為和蜘蛛行為都有重要的參考數(shù)據(jù)。
從用戶的訪問行為,我們可以知道用戶喜歡哪個(gè)頁面,他進(jìn)入哪個(gè)入口,最后離開哪個(gè)頁面;他訪問了多少頁面,他在網(wǎng)站上停留了多長時(shí)間,這些數(shù)據(jù)非常重要。在很大程度上,它幫助我理解用戶的瀏覽行為和思想。
從蜘蛛的角度來看,一般可以觀察到蜘蛛的出訪次數(shù)、蜘蛛停留時(shí)間、蜘蛛抓取量和蜘蛛返回碼。我們可以計(jì)算蜘蛛平均停留時(shí)間、蜘蛛平均抓取量、蜘蛛唯一抓取量、蜘蛛重復(fù)抓取的頁數(shù);以及抓取時(shí)間、抓取頁面和特定的頁面列類型。這對于網(wǎng)站了解網(wǎng)站的權(quán)重分布是非常重要的參考。
我們可以通過觀察網(wǎng)站日志來分析蜘蛛的行為。
1。蜘蛛總抓取量和平均抓取量的增加和減少可以顯示網(wǎng)站的結(jié)構(gòu)、蜘蛛對網(wǎng)頁的偏好程度以及蜘蛛總訪問量可以顯示網(wǎng)站的大小。
2。平均網(wǎng)頁停留時(shí)間表明蜘蛛爬行一頁,減少網(wǎng)頁爬行時(shí)間無疑對網(wǎng)站有重大意義。
3。唯一可以用來分析網(wǎng)站是否允許蜘蛛爬行無效頁面的數(shù)據(jù)量。如果出現(xiàn)這種情況,我們應(yīng)該及時(shí)處理,以避免蜘蛛的損失。網(wǎng)站上也有重復(fù)爬行的次數(shù)和蜘蛛的重復(fù)率。重復(fù)爬蟲不能增加收集的數(shù)據(jù)量,網(wǎng)站的總權(quán)重與排名和流量有著密切的關(guān)系。在這種情況下,我們應(yīng)該引導(dǎo)蜘蛛去爬行網(wǎng)站的其他頁面,減少蜘蛛重復(fù)的爬行頁面。在這里我們可以借用nofollower標(biāo)簽來輔助。
4。蜘蛛捕捉時(shí)間分析,通過日志分析,可以大致了解蜘蛛何時(shí)訪問你的網(wǎng)站,可以更好地幫助你掌握網(wǎng)站的更新時(shí)間和規(guī)律。
5。結(jié)合網(wǎng)站流量趨勢圖,當(dāng)網(wǎng)站流量大幅下降,網(wǎng)站流量異常時(shí),需要了解分析蜘蛛是否在同一時(shí)間段內(nèi)異常爬行,如返回碼是否正常,服務(wù)器是否穩(wěn)定等。
通過以上的描述,我認(rèn)為您應(yīng)該對網(wǎng)站日志的重要性有一個(gè)大致的了解,并對網(wǎng)站日志進(jìn)行分析。
我們?nèi)绾尾拍芎唵蔚亻_始分析日志?下面是一個(gè)簡單的日志來說明:
#軟件:MicrosoftInternet信息服務(wù)6.0
版本1
#日期:2011-03-0100:00:17
#字段:日期時(shí)間s-sitenames-ipcs-methodcs-uri-stemcs-uri-querys-portcs-usernamec-ipcs(用戶代理)sc-statussc-substatussc-win32-statussc-bytes
2011-03-0102:44:37W3SVC381211.154.135.217get/news/news.aspid=20080-203.208.60.169Mozilla/5.0+(兼容;+Googlebot/2.1;++http://www.google.com/bot.html)20000029057298
搜索引擎蜘蛛:
百度:百度蜘蛛谷歌:谷歌機(jī)器人msn:msnbot
雅虎:slurpyodao:youdaobotsogou:sogou+get+spider
在上面搜索蜘蛛的名字,你就能看到蜘蛛的蹤跡。重要的是如何閱讀下面的代碼。我們稱之為HTTP狀態(tài)代碼。
日期表示訪問記錄的日期;
時(shí)間訪問時(shí)間;
s-sitename代表您的虛擬主機(jī)。
S-IP訪客IP;
cs方法是指訪問方法,有兩種常見的方法,一種是get,即我們通常打開一個(gè)url訪問操作,另一種是post,提交表單操作時(shí);
cs-uri-step是要訪問的文件。
cs-uri查詢是指訪問地址參數(shù),如asp文件?下面的字符串id=12等等,如果沒有參數(shù),使用來表示;
S端口訪問的端口
cs用戶名訪問者名稱
C-IP源IP
CS(用戶代理)訪問源;
SC狀態(tài)狀態(tài)狀態(tài),200表示成功,403表示無權(quán)限,404表示404表示打不到該頁面,500表示程序有錯(cuò);
sc-substatus 服務(wù)端傳送到客戶端的字節(jié)大??;
cs–win32-statu客戶端傳送到服務(wù)端的字節(jié)大小;
版權(quán)聲明: 本站資源均來自互聯(lián)網(wǎng)或會(huì)員發(fā)布,如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除!謝謝!
轉(zhuǎn)載請注明: 分析網(wǎng)站日志應(yīng)該從哪個(gè)頁面入手?