計算機(jī)科學(xué)理論模式識別課件c.ppt
模式識別PatternRecognition,余莉電話:76434(O),61430(M)E-mail:yuli(民網(wǎng))liliyugfkd.mtn(軍網(wǎng)),課程對象,信息工程專業(yè)本科生的專業(yè)課學(xué)院碩士研究生的學(xué)位課學(xué)院博士研究生的必修課之一,學(xué)習(xí)方法,著重理解基本概念基本方法算法原理注重理論與實踐緊密結(jié)合,基本要求,基本:完成課程學(xué)習(xí),通過考試,獲得學(xué)分。提高:能夠?qū)⑺鶎W(xué)知識和內(nèi)容用于課題研究,解決實際問題。飛躍:通過模式識別的學(xué)習(xí),改進(jìn)思維方式,為將來的工作打好基礎(chǔ),終身受益。,課程內(nèi)容及安排,第一章引論(2學(xué)時)第二章聚類分析(4學(xué)時)第三章判別域代數(shù)界面方程法(4學(xué)時)第四章統(tǒng)計判決(4學(xué)時)第五章統(tǒng)計決策中的學(xué)習(xí)與估計(4學(xué)時)第六章最近鄰方法(2學(xué)時)第七章特征提取與選擇(2學(xué)時)復(fù)習(xí)(2學(xué)時)實驗上機(jī)實驗(8學(xué)時)作業(yè)每章課后布置習(xí)題考核筆試(70%)+實驗(20%)+作業(yè)(10%),教材及參考教材,教材孫即祥,現(xiàn)代模式識別,國防科技大學(xué)出版社,2002.1參考教材J.P.MarquesdeSa,模式識別-原理、方法及應(yīng)用,清華大學(xué)出版社,2002.11邊肇祺等,模式識別(第二版)清華大學(xué)出版社2000.1SergiosTheodoridis,李晶皎等譯,模式識別(第三版),電子工業(yè)出版社,2006,第一章引論,1.1模式和模式識別,1.1.1模式和模式識別的概念識別是人類的基本行為模式識別(PatternRecognition)使用計算機(jī)來辨別事物。機(jī)器識別,計算機(jī)識別,機(jī)器自動識別。,1.2模式識別系統(tǒng),概念,樣本(Sample):一個具體的研究(客觀)對象。如某人寫的一個漢字,一幅圖片等。模式(Pattern):對客體(研究對象)特征的描述(定量的或結(jié)構(gòu)的描述),是取自客觀世界的某一樣本的測量值的集合(或綜合)。模式類(Class):具有某些共同特性的模式的集合。,特征矢量:設(shè)一個研究對象的個特征量測量值分別為,我們將它們作為一個整體來考慮,讓它們構(gòu)成一個維特征矢量。特征空間:各種不同取值的特征矢量的全體構(gòu)成了維特征空間。注:特征矢量就是特征空間中的一個點。,(顏色(綠/紅),似圓度),顏色(綠/紅),似圓度,模式識別:確定一個樣本的類別屬性(模式類)的過程,即把某一樣本歸屬于多個類型中的某個類型。模式分類的過程。,1.1.2機(jī)器與人類識別事物原理的比較,人類:具有抽象抽象概念的能力總結(jié)規(guī)律,抽象出概念機(jī)器:缺乏抽象能力基本方法是計算,1.1.3模式識別技術(shù)的應(yīng)用領(lǐng)域,生物學(xué)自動細(xì)胞學(xué)、染色體特性研究、遺傳研究天文學(xué)天文望遠(yuǎn)鏡圖像分析、自動光譜學(xué)經(jīng)濟(jì)學(xué)股票交易預(yù)測、企業(yè)行為分析醫(yī)學(xué)心電圖分析、腦電圖分析、醫(yī)學(xué)圖像分析,文字識別(CharacterRecognition)OCR(OpticalCharacterRecognition)智能交通(IntelligentTraffic)車牌、車型語音識別(Speechrecognition)翻譯機(jī),身份識別等目標(biāo)識別ATR(AutomaicTargetRecognition),(1)確定患者的病癥:測量體溫、血壓,化驗血沉,詢問臨床表現(xiàn)(模式采集);(2)醫(yī)生運用醫(yī)學(xué)知識和個人經(jīng)驗(分類判決規(guī)則),根據(jù)主要病癥(特征提取/選擇),作出診斷(分類判決):該患者(模式樣本)患了何種疾病(模式類)。,例子1:診斷,1.2模式識別系統(tǒng),1.2模式識別系統(tǒng),數(shù)據(jù)采集特征提取,正確率測試,數(shù)據(jù)采集特征提取,改進(jìn)分類識別規(guī)則,二次特征提取與選擇,分類識別,改進(jìn)采集提取方法,二次特征提取與選擇,改進(jìn)特征提取與選擇,制定改進(jìn)分類識別規(guī)則,待識對象,訓(xùn)練樣本,人工干預(yù),識別結(jié)果,例子2:蘋果和香蕉的分類,顏色(綠/紅),似圓度,1.2模式識別系統(tǒng),18,紙幣識別器對紙幣按面額進(jìn)行分類面額,例子3:紙幣識別系統(tǒng),5元10元20元50元100元,19,長度(mm)寬度(mm)5元1366310元1417020元1467050元15170100元15677,例子3:紙幣識別系統(tǒng),20,磁性金屬條位置(大約)5元有54/8210元有54/8720元有57/8950元有60/91100元有63/93,例子3:紙幣識別系統(tǒng),21,數(shù)據(jù)采集、特征提?。洪L度、寬度、磁性、磁性的位置等等,特征選擇:長度、位置,分類識別:確定紙幣的面額,例子3:紙幣識別系統(tǒng),各類空間(Space)的概念,對象空間,模式空間,特征空間,類型空間,模式采集:從客觀世界(對象空間)到模式空間的過程稱為模式采集。,特征提取和特征選擇:由模式空間到特征空間的變換和選擇。,類型判別:特征空間到類型空間所作的操作。,1.3特征矢量和特征空間,所有樣本觀測數(shù)據(jù)構(gòu)成的空間,1.3特征矢量和特征空間,1.4模式識別方法,統(tǒng)計判決句法結(jié)構(gòu)模糊判決邏輯推理神經(jīng)網(wǎng)絡(luò),(1)統(tǒng)計判決,理論基礎(chǔ):概率論,數(shù)理統(tǒng)計模式描述方法:特征向量主要方法幾何分類:線性分類,非線性分類統(tǒng)計分類:Bayes決策無教師的分類:聚類分析主要優(yōu)點1)比較成熟2)能考慮干擾噪聲等影響3)識別模式基元能力強(qiáng)主要缺點1)對結(jié)構(gòu)復(fù)雜的模式抽取特征困難2)不能反映模式的結(jié)構(gòu)特征,難以描述模式的性質(zhì)3)難以從整體角度考慮識別問題,(2)句法結(jié)構(gòu),理論基礎(chǔ):形式語言,自動機(jī)技術(shù)模式描述方法:符號串,樹,圖模式判定:是一種語言,用一個文法表示一個類,m類就有m個文法,然后判定未知模式遵循哪一個文法。主要優(yōu)點1)識別方便,可以從簡單的基元開始,由簡至繁。2)能反映模式的結(jié)構(gòu)特征,能描述模式的性質(zhì)。3)對圖象畸變的抗干擾能力較強(qiáng)。主要缺點當(dāng)存在干擾及噪聲時,抽取特征基元困難,且易失誤。,(3)模糊判決,理論基礎(chǔ):模糊數(shù)學(xué)模式描述方法:模糊集合A=(a,a),(b,b),.(n,n),模式判定:是一種集合運算。用隸屬度將模糊集合劃分為若干子集,m類就有m個子集,然后根據(jù)擇近原則分類。主要優(yōu)點由于隸屬度函數(shù)作為樣本與模板間相似程度的度量,故往往能反映整體的與主體的特征,從而允許樣本有相當(dāng)程度的干擾與畸變。主要缺點準(zhǔn)確合理的隸屬度函數(shù)往往難以建立,故限制了它的應(yīng)用。,(4)邏輯推理,理論基礎(chǔ):演繹邏輯,布爾代數(shù)模式描述方法:字符串表示的事實模式判定:是一種布爾運算。從事實出發(fā)運用一系列規(guī)則,推理得到不同結(jié)果,m個類就有m個結(jié)果。主要優(yōu)點已建立了關(guān)于知識表示及組織,目標(biāo)搜索及匹配的完整體系。對需要眾多規(guī)則的推理達(dá)到識別目標(biāo)確認(rèn)的問題,有很好的效果。缺點當(dāng)樣本有缺損,背景不清晰,規(guī)則不明確甚至有歧義時,效果不好。,(5)神經(jīng)網(wǎng)絡(luò),理論基礎(chǔ):神經(jīng)生理學(xué),心理學(xué)模式描述方法:以不同活躍度表示的輸入節(jié)點集模式判定:是一個非線性動態(tài)系統(tǒng)。通過對樣本的學(xué)習(xí)建立記憶,然后將未知模式判決為其最接近的記憶。主要優(yōu)點可處理一些環(huán)境信息十分復(fù)雜,背景知識不清楚,推理規(guī)則不明確的問題。允許樣本有較大的缺損、畸變。主要缺點模型在不斷豐富與完善中,目前能識別的模式類還不夠多。,