對(duì)于搜索引擎你了解多少?搜索引擎(search engine),萬(wàn)維網(wǎng)環(huán)境中的信息檢索系統(tǒng)(包括目錄服務(wù)和關(guān)鍵字檢索兩種服務(wù)方式),按照工作原理的不同,可以分為全文搜索引擎(Full Text Search Engine)和分類(lèi)目錄(Directory),通常所說(shuō)的搜索引擎主要是指全文搜索引擎。為了更深入的了解搜索引擎我們通過(guò)搜索引擎的起源,搜索引擎的工作原理以及搜索引擎商務(wù)模式三個(gè)方面來(lái)更深入的了解搜索引擎。
1、搜索引擎的起源
1990年由Montreal的McGill University 三名學(xué)生(Alan Emtage、Peter Deutsch、Bill Wheelan)發(fā)明的Archie(Archie FAQ),被公認(rèn)為現(xiàn)代搜索引擎的鼻祖,Archie是第一個(gè)自動(dòng)索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站的程序。
2、搜索引擎工作原理
抓取網(wǎng)頁(yè):每個(gè)獨(dú)立的搜索引擎都有自己的網(wǎng)頁(yè)抓取程序(spider),Spider順著網(wǎng)頁(yè)中的超鏈接,連續(xù)的抓取網(wǎng)頁(yè),被抓取的網(wǎng)頁(yè)被稱(chēng)為網(wǎng)頁(yè)快照。
處理網(wǎng)頁(yè):由分析索引系統(tǒng)程序?qū)κ占貋?lái)的網(wǎng)頁(yè)進(jìn)行分析,根據(jù)一定的算法提取相關(guān)信息并建立網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。
檢索服務(wù):當(dāng)用戶(hù)輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁(yè),根據(jù)相關(guān)度數(shù)值排序,并由頁(yè)面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁(yè)面內(nèi)容摘要等內(nèi)容組織起來(lái)返回給用戶(hù)。
3、搜索引擎商務(wù)模式
在搜索引擎發(fā)展早期,多是作為技術(shù)提供商為其他網(wǎng)站提供搜索服務(wù),網(wǎng)站付錢(qián)給搜索引擎。后來(lái),隨著2001年互聯(lián)網(wǎng)泡沫的破滅,大多轉(zhuǎn)向競(jìng)價(jià)排名方式,這種模式最早是Bill Gross提出的。競(jìng)價(jià)排名模式有兩個(gè)特點(diǎn),一是點(diǎn)擊付費(fèi),二是競(jìng)價(jià)排序。