企業(yè)做網(wǎng)站網(wǎng)站歸檔技術(shù)和標準不完備
日期 : 2021-10-03 22:49:44
網(wǎng)站歸檔技術(shù)和標準不完備。網(wǎng)頁信息采集主要針對靜態(tài)或動態(tài)網(wǎng)頁及其中文件,隨后提取網(wǎng)頁內(nèi)的全部信息。靜態(tài)網(wǎng)頁與動態(tài)網(wǎng)頁的抓取難度也不相同,靜態(tài)網(wǎng)頁的抓取從技術(shù)上較易實現(xiàn),只需按時間頻率定期進行即可;而動態(tài)網(wǎng)頁的捕獲則無法單純依靠抓取軟件實現(xiàn),且以目前的技術(shù)條件無法實現(xiàn)安全存儲。此外,隨著網(wǎng)頁技術(shù)不斷發(fā)展,網(wǎng)頁文件類型和格式不斷更新。
除了傳統(tǒng)的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網(wǎng)頁文件也層出不窮,但目前尚未有明確標準規(guī)范來指導(dǎo)這些文件歸檔。
除了傳統(tǒng)的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網(wǎng)頁文件也層出不窮,但目前尚未有明確標準規(guī)范來指導(dǎo)這些文件歸檔。