公司網(wǎng)站制作實現(xiàn)步驟
日期 : 2020-12-09 11:52:38
實現(xiàn)步驟。靜態(tài)化策略的實現(xiàn)主要分成配置攔截器以及攔截器實現(xiàn)兩步。首先將AngularJS 的Web 項目加入JavaEE 的webapp 文件夾中,設(shè)置WEB-INF / web.xml 文件,確定外部工具路徑、緩存路徑、遍歷深度、攔截規(guī)則等參數(shù),下面為少量配置代碼:
針對策略二的實時靜態(tài)化SEO 策略的攔截器SEOFilter 的實現(xiàn)原理攔截器首先判斷請求的發(fā)送方, 如果不是爬蟲機器人則直接返回正常的頁面,反之則返回SEO 實時靜態(tài)化頁面。
針對爬蟲機器人的處理流程主要為:首先進行URL 轉(zhuǎn)義,爬蟲請求分析,記錄URL 并查詢遍歷深度(沒有此項參數(shù)則使用配置文件中的默認值);再將URL 進行二次轉(zhuǎn)義,查詢緩存文件;如果存在緩存文件并且沒有失效,則直接返回SEO 靜態(tài)頁面;如果緩存文件不存在,或者緩存已失效并未及時銷毀,則先銷毀緩存,再進入SEO 處理器;SEO 處理器利用第三方工具PhantomJS,它是一個以WebKit 為基礎(chǔ)的服務(wù)器端JavaScript 的API,不依賴于瀏覽器,全面支持各種Web 標準,例如頁面文檔對象模型(Document Object Model,DOM)處理等———對動態(tài)頁面進行搜索引擎優(yōu)化; 最后生成緩存頁面, 保存文件至緩存文件目錄(緩存池),返回SEO 靜態(tài)頁面。
針對策略二的實時靜態(tài)化SEO 策略的攔截器SEOFilter 的實現(xiàn)原理攔截器首先判斷請求的發(fā)送方, 如果不是爬蟲機器人則直接返回正常的頁面,反之則返回SEO 實時靜態(tài)化頁面。
針對爬蟲機器人的處理流程主要為:首先進行URL 轉(zhuǎn)義,爬蟲請求分析,記錄URL 并查詢遍歷深度(沒有此項參數(shù)則使用配置文件中的默認值);再將URL 進行二次轉(zhuǎn)義,查詢緩存文件;如果存在緩存文件并且沒有失效,則直接返回SEO 靜態(tài)頁面;如果緩存文件不存在,或者緩存已失效并未及時銷毀,則先銷毀緩存,再進入SEO 處理器;SEO 處理器利用第三方工具PhantomJS,它是一個以WebKit 為基礎(chǔ)的服務(wù)器端JavaScript 的API,不依賴于瀏覽器,全面支持各種Web 標準,例如頁面文檔對象模型(Document Object Model,DOM)處理等———對動態(tài)頁面進行搜索引擎優(yōu)化; 最后生成緩存頁面, 保存文件至緩存文件目錄(緩存池),返回SEO 靜態(tài)頁面。