具體分為:①在項(xiàng)目部署或者在設(shè)定的一段時(shí)間后,對(duì)頁(yè)面進(jìn)行后臺(tái)的獲取、遍歷,通過(guò)配置文件設(shè)定的遍歷深度開(kāi)始對(duì)首頁(yè)進(jìn)行深度的鏈接獲取以及轉(zhuǎn)義,將各個(gè)鏈接對(duì)應(yīng)的頁(yè)面交給下一步處理,直到所有遍歷結(jié)束;②對(duì)遍歷的頁(yè)面進(jìn)行SEO 處理, 生成或更新靜態(tài)HTML 緩存放入靜態(tài)頁(yè)面池,即配置文件設(shè)置的緩存路徑,并在遍歷結(jié)束后及時(shí)對(duì)無(wú)效鏈接的緩存進(jìn)行清理;③網(wǎng)絡(luò)請(qǐng)求首先通過(guò)攔截器(SEOFilter),攔截器根據(jù)HTTP 請(qǐng)求的請(qǐng)求頭中包含的“User-Agent”等參數(shù)判斷此請(qǐng)求是否為爬蟲(chóng)機(jī)器人的請(qǐng)求,如果不是則返回正常的頁(yè)面用于AngularJS 內(nèi)部渲染顯示, 反之則通過(guò)URL 轉(zhuǎn)義查詢并返回對(duì)應(yīng)的SEO 緩存頁(yè)面給爬蟲(chóng)機(jī)器人用于抓取關(guān)鍵字。
由于此策略是非實(shí)時(shí)的,所以它適用于較為穩(wěn)定且對(duì)于搜索引擎的實(shí)時(shí)性要求不高的網(wǎng)站。例如政府辦公網(wǎng)站,它每日更新的內(nèi)容不多且不會(huì)頻繁地修改頁(yè)面內(nèi)容,則可以每日對(duì)服務(wù)器的靜態(tài)頁(yè)面進(jìn)行更新,即可滿足每日更新搜索引擎詞條的需求。
本文地址:http://www.khwajamoinuddinchishty.com//article/22215.html