搜索引擎整理信息的過程稱為“建立索引”。搜索引擎不僅要保存搜集起來的信息,要將它們按照一定的規(guī)則進行編排,這樣, 控搜索引擎根本不用重析翻在它所有保存的你息能迅速找到用戶所需要的資料,想象一下, 如果信息是不按任何規(guī)則地隨意堆放在搜索引物的數(shù)據(jù)庫中,那么它每次找資料都得把整個資料庫完全翻查一遍,如此一來,再快的計算的系統(tǒng)也沒有用。
接受查詢處理關(guān)鍵詞
搜索引擎還會根據(jù)同義詞典和潛在語義進行拓展查詢檢索項。如搜索引擎會將“12315"和“消費者權(quán)益"。“人民”和“百姓”當作同一個概念進行處理。另外,搜索引拿在查詢的時候,還會根據(jù)主題來進行歸類,如當查詢sEO的時候,系統(tǒng)會自動將“網(wǎng)絡(luò)營銷”“SEO~“網(wǎng)站優(yōu)化“之類的都歸為一個主題來處理。
用戶使用搜索引擎進行查詢,在搜索框中輸人一一個關(guān)鍵詞,當索引中有這樣一一個完全匹配的結(jié)果時,就會顯示出來。對于英文來說,相對就比較簡單了,只要對英文的單復數(shù)、時態(tài)、詞根、組合詞等進行分析即可。不過對于中文,則- -定要進行分詞,然后對關(guān)鍵詞進行向量計算,得出哪個網(wǎng)站的哪個關(guān)鍵詞的權(quán)重比較高,就顯示在索引中。
用戶向搜索引擎發(fā)出查詢,搜索引擎接受查詢并向用戶返回資料。搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發(fā)出的查詢,它按照每個用戶的要求檢查自己的索引,在極短時間內(nèi)找到用戶需要的資料,并返回給用戶。目前,搜索引擎返回主要是以網(wǎng)頁鏈接的形式提供的,通過這些鏈接,用戶便能到達含有自己所需資料的網(wǎng)頁。通常搜索引擎會在鏈接下提供-小段來自這些網(wǎng)頁的摘要信息以幫助用戶判斷此網(wǎng)頁是否含有自己需要的內(nèi)容。
Section
本文地址:http://heisem.cn/yingxiao/2020/0201/10150.html