如果我們從搜索引擎蜘蛛的角度去看待一個網(wǎng)站,在抓取,、索引和排名時會遇到哪些問題呢,?解決了這些問題的網(wǎng)站設(shè)計就是搜索引擎友好的。
1,、搜索引擎蜘蛛能不能找到網(wǎng)頁
要讓搜索引擎發(fā)現(xiàn)網(wǎng)站首頁,,就必須要有外部鏈接到首頁,找到首頁后,,蜘蛛沿著內(nèi)部鏈接找到更深的內(nèi)容頁,,所以要求網(wǎng)站要有良好的結(jié)構(gòu),符合邏輯,,并且所有頁面都可以通過可爬行的普通HTML鏈接達到,。Javascript鏈接,、Flash中的鏈接等搜索引擎蜘蛛一般不能跟蹤爬行,就會造成收錄問題,。
網(wǎng)站所有頁面離首頁點擊距離不能太遠,,最好在四五次點擊之內(nèi)。要被搜索引擎收錄,,頁面需要都有最基本的權(quán)重,,良好的網(wǎng)站鏈接結(jié)構(gòu)可以適當傳遞權(quán)重,使盡量多的頁面達到收錄門檻,。
2,、找到網(wǎng)頁后能不能抓取頁面內(nèi)容
被發(fā)現(xiàn)的URL必須是可以被抓取的。帶有過多參數(shù)的URL,、Session ID,、整個頁面是Flash,、框架結(jié)構(gòu),、可疑的轉(zhuǎn)向、大量復制內(nèi)容等都可能使搜索引擎敬而遠之,。
某些文件站長可能不希望被收錄,,除了不鏈接到這些文件,更保險的方法是使用robots文件或者meta robots標簽禁止收錄,。
3,、抓取頁面后怎樣提煉有用信息
關(guān)鍵詞在頁面重要位置的合理分布、重要標簽的撰寫,、HTML代碼精簡,、起碼的兼容性等,可以幫助搜索引擎理解頁面內(nèi)容,,提取有用信息,。
只有搜索引擎能順利找到所有頁面,抓取這些頁面并提取出其中真正有關(guān)性的內(nèi)容,,網(wǎng)站才可以被視為是搜索引擎友好的,。關(guān)于網(wǎng)站結(jié)構(gòu)的整站營銷,有一句話非常精辟:“良好引用,、良好結(jié)構(gòu),、良好導航”。
p0