企業(yè)建網(wǎng)站特征知識(shí)庫(kù)的建立
日期 : 2021-09-02 21:28:28
特征知識(shí)庫(kù)的建立。機(jī)器學(xué)習(xí)中最重要的是特征選擇。只有選擇合適的特征,訓(xùn)練有素的分類器才能具有良好的分類效果。
特征集合是網(wǎng)頁(yè)掛馬特征值的集合,當(dāng)網(wǎng)頁(yè)被掛馬之后,將網(wǎng)頁(yè)源碼中一處或者多處掛馬特征提取出來(lái),作為網(wǎng)頁(yè)漏洞的特征,加入待檢測(cè)特征知識(shí)庫(kù)便于后續(xù)模塊的檢測(cè)。
特征提取模板是整個(gè)系統(tǒng)的核心,它的實(shí)現(xiàn)由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負(fù)責(zé)進(jìn)行提取。然后對(duì)提取到的HTML頁(yè)面中的腳本代碼進(jìn)行解析,是通過(guò)HTML unit模塊實(shí)現(xiàn)對(duì)DOM樹(shù)形結(jié)構(gòu)的訪問(wèn),將提取的待檢測(cè)網(wǎng)頁(yè)的所有特征,形成完整的特征記錄,并加入待檢測(cè)特征知識(shí)庫(kù)中,為檢測(cè)模塊提供使用。
特征集合是網(wǎng)頁(yè)掛馬特征值的集合,當(dāng)網(wǎng)頁(yè)被掛馬之后,將網(wǎng)頁(yè)源碼中一處或者多處掛馬特征提取出來(lái),作為網(wǎng)頁(yè)漏洞的特征,加入待檢測(cè)特征知識(shí)庫(kù)便于后續(xù)模塊的檢測(cè)。
特征提取模板是整個(gè)系統(tǒng)的核心,它的實(shí)現(xiàn)由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負(fù)責(zé)進(jìn)行提取。然后對(duì)提取到的HTML頁(yè)面中的腳本代碼進(jìn)行解析,是通過(guò)HTML unit模塊實(shí)現(xiàn)對(duì)DOM樹(shù)形結(jié)構(gòu)的訪問(wèn),將提取的待檢測(cè)網(wǎng)頁(yè)的所有特征,形成完整的特征記錄,并加入待檢測(cè)特征知識(shí)庫(kù)中,為檢測(cè)模塊提供使用。