企業(yè)網(wǎng)站設(shè)計(jì)站內(nèi)全文檢索技術(shù)
日期 : 2019-04-28 14:31:39
隨著企業(yè)網(wǎng)站各功能模塊中信息量的逐漸增加, 如何利用關(guān)鍵詞快速地查找到所需信息也就成了網(wǎng)站要解決的關(guān)鍵問題之一。對(duì)于小型的企業(yè)網(wǎng)站來說, 由于數(shù)據(jù)量不是太大, 采用基于數(shù)據(jù)庫的模糊檢索方式就能滿足要求。但這種檢索方式只適合檢索結(jié)構(gòu)化數(shù)據(jù), 無法對(duì)文本、圖片等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行檢索。而且, 在使用like查詢時(shí), 需要對(duì)數(shù)據(jù)庫表格中相關(guān)字段的內(nèi)容全部檢索一次, 在數(shù)據(jù)量較大的環(huán)境下, like查詢對(duì)系統(tǒng)性能的影響是相當(dāng)大的。
為解決傳統(tǒng)數(shù)據(jù)檢索方式存在的效率低下問題, 以Lucene為代表的站內(nèi)全文檢索技術(shù)也就應(yīng)運(yùn)而生。Lucene的檢索過程實(shí)際上就是把模糊查詢變成可以利用索引進(jìn)行精確查詢的過程, 就如查字典, 只需要從索引目錄中找出所查字符的頁碼即可實(shí)現(xiàn)精確定位, 不需要一頁一頁的去搜尋, 極大地提升了數(shù)據(jù)檢索的效率和準(zhǔn)確性。全文檢索的實(shí)現(xiàn)過程主要分為索引創(chuàng)建和搜索索引兩個(gè)步驟。其中, 索引創(chuàng)建就是將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特征信息提取出來并儲(chǔ)存到創(chuàng)建好的索引庫中;搜索索引就是根據(jù)用戶需要查詢的關(guān)鍵詞, 從索引庫中搜索出滿足條件的記錄, 然后將查詢結(jié)果返回給用戶。
為解決傳統(tǒng)數(shù)據(jù)檢索方式存在的效率低下問題, 以Lucene為代表的站內(nèi)全文檢索技術(shù)也就應(yīng)運(yùn)而生。Lucene的檢索過程實(shí)際上就是把模糊查詢變成可以利用索引進(jìn)行精確查詢的過程, 就如查字典, 只需要從索引目錄中找出所查字符的頁碼即可實(shí)現(xiàn)精確定位, 不需要一頁一頁的去搜尋, 極大地提升了數(shù)據(jù)檢索的效率和準(zhǔn)確性。全文檢索的實(shí)現(xiàn)過程主要分為索引創(chuàng)建和搜索索引兩個(gè)步驟。其中, 索引創(chuàng)建就是將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特征信息提取出來并儲(chǔ)存到創(chuàng)建好的索引庫中;搜索索引就是根據(jù)用戶需要查詢的關(guān)鍵詞, 從索引庫中搜索出滿足條件的記錄, 然后將查詢結(jié)果返回給用戶。