優(yōu)惠活動(dòng) - 12周年慶本月新客福利
優(yōu)惠活動(dòng) - 12周年慶本月新客福利
優(yōu)惠活動(dòng) - 12周年慶本月新客福利

企業(yè)網(wǎng)站設計預處理模塊的構成

日期 : 2019-10-09 16:01:53
       預處理模塊的構成。預處理模塊由三個(gè)子模塊構成, 分別是頁(yè)面抓取、文本內容提取、關(guān)鍵字提取。頁(yè)面抓取的主要功用是讀取用戶(hù)信息庫中儲存的行為信息, 分析用戶(hù)興趣所在, 抓取相對應的頁(yè)面。文本內容提取, 其主要功能是將抓取到的頁(yè)面信息進(jìn)行過(guò)濾, 去除不相關(guān)的信息, 提取與頁(yè)面主題相關(guān)聯(lián)的內容, 并將其以文本文件的形式保存至數據庫, 便于用戶(hù)觀(guān)看與查找。關(guān)鍵字提取, 該項子功能模塊會(huì )將用戶(hù)行為信息進(jìn)行分詞, 將文本中的內容以詞條形式顯示, 并計算每個(gè)詞條的重要性, 依此排序, 選出與詞條相關(guān)的內容。


相關(guān)文章
国产免费丝袜调教视频爱剪辑|国产小受18asian|国产福利91精品一区二区三区|久久久青草大香|欧美丰满熟妇xxxx性