數(shù)據(jù)庫通用檢索技術與方法.ppt
《數(shù)據(jù)庫通用檢索技術與方法.ppt》由會員分享,可在線閱讀,更多相關《數(shù)據(jù)庫通用檢索技術與方法.ppt(21頁珍藏版)》請在裝配圖網(wǎng)上搜索。
數(shù)據(jù)庫通用檢索技術與方法,nbwangjt@,引言,恒變信息環(huán)境-----日新月異數(shù)據(jù)庫的檢索界面、檢索功能、版本形式經(jīng)常會有變化不變基本技術與基本原理方法或技巧,2,1信息檢索七準則,你得到什么檢索結果,取決于你怎么提問(即主題概念分析)去信息應該在的地方檢索(即選擇數(shù)據(jù)庫)向你的檢索結果提問――信息可能是真的,但內(nèi)容仍然會有錯的(檢索結果的判斷,內(nèi)容的選?。z索是一個多步驟的過程(擴檢、縮檢)檢索結果必須符合需求(檢索結果的選擇)咨詢圖書館員(獲得幫助)信息本身是無意義的,只有人提問之后才有價值(撰寫論文吧,讓信息增值)信息檢索準則編譯自:,3,2數(shù)據(jù)庫檢索常見問題,對信息檢索有畏懼心理不理解信息檢索過程或原理,無法做到觸類旁通。不知道選擇什么樣的數(shù)據(jù)庫檢索,到哪里檢索不知道如何選擇恰當?shù)臋z索詞在文摘索引數(shù)據(jù)庫中想下載全文僅僅用一個詞檢索(不會利用邏輯組配)在外文數(shù)據(jù)庫中輸入中文詞檢索,4,2數(shù)據(jù)庫檢索常見問題(續(xù)),信息環(huán)境意識不強,在網(wǎng)絡中搜索一個數(shù)據(jù)庫就進行檢索用整個論文(或課程)題名在題名項中檢索檢索結果太多(不會用限定和組配)檢索結果太少(課題分析不夠;檢索詞選?。z索結果的處理(排序、下載、閱讀器、復制)說說看,各位還有哪些問題?,5,3信息檢索“高級檢索”界面解讀,,4信息檢索途徑解析,信息檢索途徑也稱為信息檢索字段、檢索項。信息檢索的基本原理就是文本匹配。檢索途徑指定了輸入的關鍵詞進行匹配(比對)的范圍在檢索式的編寫中,如下表示:篇名=評價AND關鍵詞=信息資源配置,,,8,,,,,,,,,,檢索項/檢索途徑對應內(nèi)容,5信息檢索技術與發(fā)展,當前信息檢索是基于文本的可檢索字段信息以文本的形式存儲在數(shù)據(jù)庫(數(shù)據(jù)集合)中即使是多媒體數(shù)據(jù)庫,也是抽象特征進行文本化或說字符化基于文本的匹配技術是信息檢索的核心隨著信息技術的發(fā)展,以后還會有基于顏色、聲音、氣味、質量等等的檢索。,9,5.1認識數(shù)據(jù)庫與數(shù)據(jù)庫檢索,數(shù)據(jù)庫是存儲在一起的相關數(shù)據(jù)(信息)的集合數(shù)據(jù)庫是信息檢索的主要對象,比如針對網(wǎng)絡信息資源的搜索引擎(谷歌、百度、雅虎)就是一個數(shù)據(jù)庫,文獻信息檢索領域的數(shù)據(jù)庫非常多。,10,5.2數(shù)據(jù)庫檢索,匹配技術:有哪些匹配規(guī)則(模糊、精確、截詞)?數(shù)據(jù)庫檢索是一個多步驟的過程擴檢、縮減、檢索詞的選擇與邏輯組配數(shù)據(jù)庫的檢索也是一個知識的探索與發(fā)現(xiàn)的過程,別人沒法替代檢索、瀏覽、判斷、調整策略、再檢索花點時間,了解數(shù)據(jù)庫特點的必要性涵蓋學科或主題范圍文獻類型(出版形式、內(nèi)容層次)收錄年限,收錄對象數(shù)據(jù)量(記錄數(shù))文種全文獲取,5.3布爾邏輯檢索技術,并且【邏輯與】表示當兩個詞都出現(xiàn)在檢索項中的時,這樣的文獻才被檢索出來。是縮檢的方法或者【邏輯或】表示只要其中一個詞出現(xiàn)在檢索項中,這樣的文獻就能檢索出來。是擴檢的方法去除【邏輯非】表示從已經(jīng)檢索的結果中去除含有該檢索詞的文獻。即檢索出的文獻包前面的檢索詞,但不包含去除的詞。是縮檢的方法,12,例:網(wǎng)絡信息資源評價研究綜述,網(wǎng)絡信息、信息資源、網(wǎng)絡信息資源、選擇、利用、評價(網(wǎng)絡信息OR信息資源)AND評價NOT檢索工具(網(wǎng)絡信息OR信息資源)AND(選擇OR利用OR評價)如何對應于數(shù)據(jù)庫的檢索?技巧:每一次檢索解決一個問題,即搜索到一個方面的信息資源。比如:網(wǎng)絡信息資源AND選擇網(wǎng)絡信息資源AND利用網(wǎng)絡信息資源AND評價,13,5.4截詞檢索技術,截詞包括后截、中截、前截等。用?作為截詞符(有些系統(tǒng)用*),主要包括下列情形:截詞符?中截一字符,后截斷n個字符如wom?n可以檢索出:woman,women如coumput?可以檢索出Compute,Computer,Computing,computable,14,,??后、中截二字符如:transplant??可以檢索出:transplant、transplanted、transplanter???后、中截三字符如:comput???可以檢索出:compute;computer;computing,15,通配符,無限截斷,[%][?][*]后方一致(前截斷):“%國慶”將檢索出所有字段為張國慶、歐陽國慶、國慶等的記錄。前方一致(后截斷):如:“信息檢索%”將檢索出信息檢索原來、信息檢索技術等的記錄。,16,,截詞檢索是擴檢(即擴大檢索結果),17,5.5模糊檢索與精確檢索方法,模糊檢索系統(tǒng)根據(jù)檢索詞自動拆分成更小的單元詞如“網(wǎng)絡信息資源”模糊檢索,相當于用:網(wǎng)絡信息資源OR網(wǎng)絡信息OR信息資源OR網(wǎng)絡OR信息OR資源模糊檢索是一些數(shù)據(jù)庫(檢索系統(tǒng))的默認檢索模式。當檢索結果較少或檢索不到信息時,可以選擇模糊檢索。模糊檢索是擴檢(即擴大檢索結果)精確檢索與模糊檢索相對應,檢索詞不能拆分開精確檢索是縮檢(即縮小檢索結果,18,5.6限制檢索,19,主題領域限定年代限定文獻類型限定語種限定文獻層次限定……限制檢索是縮檢(即縮小檢索結果),如在谷歌和百度搜索引擎中的檢索特定的文獻類型:“報告filetype:pdf”檢索指定網(wǎng)址內(nèi)的信息:“報告site:”以后會看到一些數(shù)據(jù)庫通常都有年代/類型等的選擇,20,21,到“中國知網(wǎng)”期刊論文的高級搜索中,如何在檢索框中實現(xiàn)?主題=網(wǎng)絡信息資源AND(選擇OR評價)如何實現(xiàn)檢索2005年以來的論文?如何實現(xiàn)?篇名=網(wǎng)絡信息資源AND(選擇OR評價)如何實現(xiàn)?主題=(網(wǎng)絡資源AND網(wǎng)絡信息)AND篇名=(選擇OR評價),- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 數(shù)據(jù)庫 通用 檢索 技術 方法
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.appdesigncorp.com/p-3887451.html