1樓:家和萬事興
一、指代不同
2、目標索引搜尋引擎:是一種以網頁形式查詢網路資源的網路資訊檢索工具。
二、特點不同
1、全文搜尋引擎:以文字、語音、影象等各種資料為物件,提供基於資料內容而非外部特徵的資訊檢索,具有對海量資料進行有效管理和快速檢索的特點。
三、影響不同
2樓:匿名使用者
一、指代不同
2、目標索引類搜尋引擎:是以網頁形式提供查詢網路資源的一種網路資訊檢索工具。
二、特點不同
1、全文搜尋引擎:以各類資料如文字、聲音、影象等為物件,提供按資料的內容而不是外在特徵來進行的資訊檢索,其特點是能對海量的資料進行有效管理和快速檢索。
三、影響不同
3樓:聯著實業集團
就是以資料諸如文字,聲音,影象等為主要內容,以檢索文獻資料的內容而不是外表特徵的一種檢索技術·
主要該系統有trs系統·天宇系統·等
與其他搜尋引擎相比,全文搜尋引擎的顯著特點是它能夠以文中任何一個有檢索意義的詞作為檢索入口,而且取得的檢索結果是原始文獻,而不是文獻線索
隨著計算機產業的發展,以計算機儲存裝置為載體的電子資訊愈來愈多,這些資訊大致可分為兩類:結構化資料和非結構化資料,結構化資料指的是諸如企業財務帳目和生產資料、學生的分數資料等等,非結構化資料的則是一些文字資料、圖象聲音等多**資料等等。據統計,非結構化資料佔有整個資訊量的80%以上。
對於結構化資料,用rdbms(關聯式資料庫管理系統)技術來管理是目前最好的一種方式。但是由於rdbms自身底層結構的緣故使得它管理大量非結構化資料顯得有些先天不足,特別是查詢這些海量非結構化資料的速度較慢。而通過全文檢索技術就能高效地管理這些非結構化資料。
經過幾年的發展,全文檢索從最初的字串匹配程式已經演進到能對超大文字、語音、影象、活動影像等非結構化資料進行綜合管理的大型軟體。由於內涵和外延的深刻變化,全文檢索系統已成為新一代管理資訊系統的代名詞,衡量全文檢索系統的基本指標也逐漸形成規範。
首先,我們關注的是查全率,即系統在進行某一檢索時,檢索出的相關資料量與系統資料庫中相關資料總量的比率。查準率則是保證我們找到最有用資料的一個關鍵,是系統在進行某一檢索時,檢索出的有用資料數量與檢索出資料總量的比率。檢索速度或者說響應時間是提高工作效率的保障,指的是從提交檢索課題到查出資料結果所需的時間。
最基本的檢索速度是應該達「千萬漢字,秒級響應"。還有諸如收錄範圍(所查詢的範圍)、使用者負擔(使用者在檢索過程中付出精力的總和)、輸出形式 (輸出資訊表現形式)等指標也是衡量全文檢索系統優劣的要素。
搜尋引擎應該是全文檢索技術最主要的一個應用。目前,搜尋引擎的使用已成為排在收發電子郵件之後的第二大網際網路應用技術。搜尋引擎起源於傳統的資訊全文檢索理論,即計算機程式通過掃描每一篇文章中的每一個詞,建立以詞為單位的到排檔案,檢索程式根據檢索詞在每一篇文章中出現的頻率和每一個檢索詞在一篇文章中出現的概率,對包含這些檢索詞的文章進行排序,最後輸出排序的結果。
全文檢索技術是搜尋引擎的核心支撐技術。
一個好的檢索引擎是一個理想站點的關鍵。很多人在訪問一個站點時喜歡使用站點檢索,站點檢索應是分類目錄導航和全文檢索的完美結合,具體包括以下幾個方面:
分類目錄導航的關鍵是檢索範圍,檢索範圍的限制能使得檢索結果不會太多、太濫;
全文檢索對於站點檢索是必不可少的,在通常情況下能夠幫助人們很快地找到所要的網頁;
有時利用分類目錄導航和全文檢索還很難定位到所要的資訊,這時就要組合檢索輔助;
必須有相關排序功能,因為當檢索結果太多時,使用者不可能一一瀏覽,大多數使用者只瀏覽前面幾條,沒有相關排序,可能準確的檢索結果排在後面,使用者不能瀏覽到,而排在前面的檢索結果卻相關性很少,造成使用者的錯覺。
此外,我們還要考慮html/xml的特殊性、支援大量併發使用者突發訪問、web站點的動態特性、要求索引維護效率很高等方面。
目前的技術實現有lucene,solr,elasticsearch等。全文檢索過程分為索引、搜尋兩個過程:
索引(indexing)
從關聯式資料庫中、網際網路上、檔案系統採集源資料(要搜尋的目標資訊),源資料的**是非常廣泛的。
將源資料採集到一個統一的地方,例如儲存系統,要建立索引,將索引建立到一個索引庫(檔案系統)中,從源資料庫中提取關鍵資訊,從關鍵資訊中抽取一個一個詞,詞和源資料是有關聯的。也即建立索引時,詞和源資料有關聯,索引庫中記錄了這個關聯,如果找到了詞就說明找到了源資料(http的網頁、電子書、新聞等……)。
搜尋(search)
使用者執行搜尋(全文檢索)編寫查詢關鍵字。
從索引庫中搜尋索引,根據查詢關鍵字搜尋索引庫中的一個一個詞。
展示搜尋的結果。
目錄類搜尋引擎和全文搜尋引擎有什麼區別?
4樓:z窺夢女
全文搜尋引擎因為依靠軟體進行,所以資料庫的容量非常龐大,但是,它的查詢結果往往不夠準確。分類目錄依靠人工收集和整理**,能夠提供更為準確的查詢結果,但收集的內容卻非常有限。
1.搜尋引擎屬於自動**檢索,而目錄索引則完全依賴手工操作。
2.搜尋引擎收錄**時,只要**本身沒有違反有關的規則,一般都能登入成功;而目錄索引對**的要求則高得多,有時即使登入多次也不一定成功。
4. 因此,分類目錄型搜尋引擎營銷方法與技術性搜尋引擎的方式有很大的不同,需要充分了解,這種區別,才能充分發揮各種不同搜尋引擎的作用。
目錄類搜尋引擎和全文搜尋引擎的區別?
5樓:z窺夢女
全文搜尋復引擎因為依制
靠軟體進行,所以資料庫的容量非常龐大,但是,它的查詢結果往往不夠準確。分類目錄依靠人工收集和整理**,能夠提供更為準確的查詢結果,但收集的內容卻非常有限。
1.搜尋引擎屬於自動**檢索,而目錄索引則完全依賴手工操作。
2.搜尋引擎收錄**時,只要**本身沒有違反有關的規則,一般都能登入成功;而目錄索引對**的要求則高得多,有時即使登入多次也不一定成功。
4. 因此,分類目錄型搜尋引擎營銷方法與技術性搜尋引擎的方式有很大的不同,需要充分了解,這種區別,才能充分發揮各種不同搜尋引擎的作用。
國外搜尋引擎的現狀,國外搜尋引擎
國外上的搜尋引擎現狀主要分成以下幾類 1 基於目錄的搜尋引擎,搜尋引擎將收集到的資訊分配到不同的類別中,這類搜尋引擎分為兩大問題 1 分類是按分類者或分類軟體的分析而定,不一定與使用者的意見一致 2 如果查詢的資訊沒有對應的分類項,則無法進行搜尋。2 機器人的搜尋引擎 robot based sea...
什麼叫元搜尋引擎?什麼是元搜尋引擎?
元搜尋引擎,通過一個統一使用者介面幫助使用者在多個搜尋引擎中選擇和利用合適的 甚至是同時利用若干個 搜尋引擎來實現檢索操作,是對分佈於網路的多種檢索工具的全域性控制機制。一個真正的元搜尋引擎由三部分組成,即 檢索請求提交機制 檢索介面 機制 檢索結果顯示機制。請求提交 負責實現使用者 個性化 的檢索...
搜尋引擎的搜尋原理是什麼?搜尋引擎的原理是什麼?
1 蒐集資訊。機器人程式根據網頁連到其中的超連結,就像日常生活中所說的一傳十,十傳百,從少數幾個網頁開始,連到資料庫上所有到其他網頁的連結。理論上,若網頁上有適當的超連結,機器人便可以遍歷絕大部分網頁。2 整理資訊。搜尋引擎不僅要儲存蒐集起來的資訊,還要將它們按照一定的規則進行編排。這樣,搜尋引擎根...