公司網(wǎng)站制作采集數(shù)據(jù)模塊設(shè)計
日期 : 2020-12-18 23:45:14
采集數(shù)據(jù)模塊設(shè)計。采集模塊中,成功登陸到采集主頁后,把需要的采集頁面(例如論壇博主信息頁面)輸入到采集文本框中進行采集,同時后端校驗并根據(jù)需求采集用戶想要的信息,采集到重要的數(shù)據(jù)以后,自動執(zhí)行入庫操作,把數(shù)據(jù)儲存在數(shù)據(jù)庫data表中。
并且將采集到的數(shù)據(jù)返回給頁面上,根據(jù)用戶的選擇和需求展示信息,同時,后臺通過鏈采集保證數(shù)據(jù)的完整性(同一個博主文章的完整性)。
鏈采集:通過校驗,比對采集到的數(shù)據(jù)是否完整,如果所采集的頁面所含的數(shù)據(jù)不完整(一個頁面所含的博主文章不全),那么通過鏈采集,找到該url所對應的下一頁或者下幾頁的數(shù)據(jù),找到并采集,直到全部找到所要采集的信息為止(找到博主全部的文章為止)。
并且將采集到的數(shù)據(jù)返回給頁面上,根據(jù)用戶的選擇和需求展示信息,同時,后臺通過鏈采集保證數(shù)據(jù)的完整性(同一個博主文章的完整性)。
鏈采集:通過校驗,比對采集到的數(shù)據(jù)是否完整,如果所采集的頁面所含的數(shù)據(jù)不完整(一個頁面所含的博主文章不全),那么通過鏈采集,找到該url所對應的下一頁或者下幾頁的數(shù)據(jù),找到并采集,直到全部找到所要采集的信息為止(找到博主全部的文章為止)。