聚類分析ppt課件
《聚類分析ppt課件》由會員分享,可在線閱讀,更多相關(guān)《聚類分析ppt課件(47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第四節(jié) 聚類分析,聚類要素的數(shù)據(jù)處理 距離的計算 直接聚類法 最短距離聚類法 最遠距離聚類法 系統(tǒng)聚類法計算類之間距離的統(tǒng)一公式 系統(tǒng)聚類分析實例,1,一、聚類要素的數(shù)據(jù)處理,在聚類分析中,聚類要素的選擇是十分重要的,它直接影響分類結(jié)果的準確性和可靠性。 在地理分類和分區(qū)研究中,被聚類的對象常常是多個要素構(gòu)成的。不同要素的數(shù)據(jù)往往具有不同的單位和量綱,其數(shù)值的變異可能是很大的,這就會對分類結(jié)果產(chǎn)生影響。因此當分類要素的對象確定之后,在進行聚類分析之前,首先要對聚類要素進行數(shù)據(jù)處理。,,,,2,假設(shè)有m 個聚類的對象,每一個聚類對象都有個要素構(gòu)成。它們所對應(yīng)的要素數(shù)據(jù)可用3.4.1給出。,表3.4.1 聚類對象與要素數(shù)據(jù),3,在聚類分析中,常用的聚類要素的數(shù)據(jù)處理方法有如下幾種:,① 總和標準化。分別求出各聚類要素所對應(yīng)的數(shù)據(jù)的總和,以各要素的數(shù)據(jù)除以該要素的數(shù)據(jù)的總和,即 這種標準化方法所得到的新數(shù)據(jù)滿足,,(3.4.1),,,4,② 標準差標準化,即 由這種標準化方法所得到的新數(shù)據(jù),各要素的平均值為0,標準差為1,即有,(3.4.2),5,③ 極大值標準化,即 經(jīng)過這種標準化所得的新數(shù)據(jù),各要素的極大值為1,其余各數(shù)值小于1。 ④ 極差的標準化,即 經(jīng)過這種標準化所得的新數(shù)據(jù),各要素的極大值為1,極小值為0,其余的數(shù)值均在0與1之間。,,,(3.4.3),,(3.4.4),6,例題:表3.4.2給出了某地區(qū)九個農(nóng)業(yè)區(qū)的七項指標,它們經(jīng)過極差標準化處理后,如表3.4.3所示。,表3.4.2 某地區(qū)九個農(nóng)業(yè)區(qū)的七項經(jīng)濟指標數(shù)據(jù),7,表3.4.3 極差標準化處理后的數(shù)據(jù),8,二、距離的計算,常見的距離有 ① 絕對值距離 ② 歐氏距離 ③ 明科夫斯基距離,,(3.4.5),,(3.4.6),,(3.4.7),9,④ 切比雪夫距離。當明科夫斯基距 時,有 據(jù)表3.4.3中的數(shù)據(jù),用公式(3.4.5)式計算可 得九個農(nóng)業(yè)區(qū)之間的絕對值距離矩陣如下:,,(3.4.8),(3.4.9),,10,三、直接聚類法,原理:先把各個分類對象單獨視為一類,然后根據(jù)距離最小的原則,依次選出一對分類對象,并成新類。如果其中一個分類對象已歸于一類,則把另一個也歸入該類;如果一對分類對象正好屬于已歸的兩類,則把這兩類并為一類。每一次歸并,都劃去該對象所在的列與列序相同的行。經(jīng)過m-1次就可以把全部分類對象歸為一類,這樣就可以根據(jù)歸并的先后順序作出聚類譜系圖。,11,例:根據(jù)距離矩陣式(3.4.9),用直接聚類法對某地區(qū)的九個農(nóng)業(yè)區(qū)進行聚類分析,步驟如下: ① 在距離矩陣D中,除去對角線元素以外,d49=d94=0.51為最小者,故將第4區(qū)與第9區(qū)并為一類,劃去第9行和第9列; ② 在余下的元素中,除對角線元素以外,d75= d57=0.83為最小者,故將第5區(qū)與第7區(qū)并為一類,劃掉第7行和第7列;,12,③ 在第二步之后余下的元素之中,除對角線元素以外,d82= d28=0.88為最小者,故將第2區(qū)與第8區(qū)并為一類,劃去第8行和第8列;,④ 在第三步之后余下的元素中,除對角線元素以外,d43= d34=1.23為最小者,故將第3區(qū)與第4區(qū)并為一類,劃去第4行和第4列,此時,第3、4、9區(qū)已歸并為一類;,13,⑤ 在第四步之后余下的元素中,除對角線元素以外,d21= d12=1.52為最小者,故將第1區(qū)與第2區(qū)并為一類,劃去第2行和第2列,此時,第1、2、8區(qū)已歸并為一類; ⑥ 在第五步之后余下的元素中,除對角線元素以外,d65= d56=1.78為最小者,故將第5區(qū)與第6區(qū)并為一類,劃去第6行和第6列,此時,第5、6、7區(qū)已歸并為一類;,14,⑦ 在第六步之后余下的元素中,除對角線元素以外,d31= d13=3.10為最小者,故將第1區(qū)與第3區(qū)并為一類,劃去第3行和第3列,此時,第1、2、3、4、8、9區(qū)已歸并為一類; ⑧ 在第七步之后余下的元素中,除去對角線元素以外,只有d51= d15=5.86,故將第1區(qū)與第5區(qū)并為一類,劃去第5行和第5列,此時,第1、2、3、4、5、6、7、8、9、區(qū)均歸并為一類; 根據(jù)上述步驟,可以作出聚類過程的譜系圖(圖3.4.1)。,15,,圖3.4.1 直接聚類譜系圖,16,四、最短距離聚類法,原理:最短距離聚類法,是在原來的m×m距離矩陣的非對角元素中找出 ,把分類對象Gp和Gq歸并為一新類Gr,然后按計算公式 計算原來各類與新類之間的距離,這樣就得到一個新的(m-1)階的距離矩陣; 再從新的距離矩陣中選出最小者dij,把Gi和Gj歸并成新類;再計算各類與新類的距離,這樣一直下去,直至各分類對象被歸為一類為止。,,(3.3.10),,17,例題: 以下根據(jù)式(3.3.9)中的距離矩陣,用最短距離聚類法對某地區(qū)的九個農(nóng)業(yè)區(qū)進行聚類分析。,18,① 在9×9階距離矩陣D中,非對角元素中最小者是d94=0.51,首先將第4區(qū)與第9區(qū)并為一類,記為即G10={G4,G9}。按照公式(3.3.10)式分別計算G1,G2,G3,G5,G6,G7,G8與G10之間的距離得: d1,10=min{d14,d19}= min{2.19,2.62}=2.19 d2,10=min{d24,d29}= min{1.47,1.66}=1.47 d3,10=min{d34,d39}= min{1.23,1.20}=1.20,19,d5,10=min{d54,d59}= min{4.77,4.84}=4.77 d6,10=min{d64,d69}= min{2.99,3.06}=2.99 d7,10=min{d74,d79}= min{4.06,3.32}=3.32 d8,10=min{d84,d89}= min{1.29,1.40}=1.29 ② 這樣就得到G1,G2,G3,G5,G6,G7,G8,G10上的一個新的8×8階距離矩陣:,20,,21,③ 在上一步驟中所得到的8×8階距離矩陣中,非對角元素中最小者為d57=0.83,故將G5與G7歸并為一類,記為G11,即G11={G5,G7}。 按照公式(3.3.10)式計分別算G1,G2,G3,G6,G8,G10與G11之間的距離,可得到一個新的7×7階距離矩陣:,22,,④ 在第二步所得到的7×7階距離矩陣中,非對角元素中最小者為d28=0.88,故將G2與G8歸并為一類,記為G12,即G12={G2,G8}。再按照公式(3.3.10)式分別計算G1,G3,G6,G10,G11與G12之間的距離,可得到一個新的6×6階距離矩陣:,23,⑤ 在第三步中所得的6×6階距離矩陣中,非對角元素中最小者為d6,11=1.07,故將G6與G11歸并為一類,記為G13,即G13={G6,G11}={G6,(G5,G7)}。再按照公式(3.3.10)式計算G1,G3,G10,G12與G13之間的距離,可得到一個新的5×5階距離矩陣:,,24,⑥ 在第四步中所得的5×5階距離矩陣中,非對角線元素中最小者為d3,10=1.20,故將G3與G10歸并為一類,記為G14,即G14={G3,G10}={G3,(G4,G9)}。再按照公式(3.3.10)式計算G1,G12,G13與G14之間的距離,可得一個新的4×4階距離矩陣:,,25,⑦ 在第五步所得到的4×4階距離矩陣中,非對角線元素中最小者為d12,14=1.29,故將G12與G14歸并為一類,記為G15,即G15={G12,G14}={(G2,G8),(G3,(G4,G9))}。再按照公式(3.3.10)式計算G1,G13與G15之間的距離,可得一個新的3×3階距離矩陣:,,,26,⑧ 在第六步所得的3×3階距離矩陣中,非對角線元素中最小者為d1,15=1.32,故將G1與G15歸并為一類,記為G16,即G16={G1,G15}={(G1,(G2,G8),(G3,(G4,G9))}。再按照公式(3.3.10)式計算G13與G16之間的距離,可得一個新的2×2階距離矩陣:,,,27,⑨ 將G13與G16歸并為一類。此時,所有分類對象均被歸并為一類。 綜合上述聚類過程,可以作出最短距離聚類譜系圖(如圖3.4.2所示)。,,,,28,圖3.4.2 最短距離聚類譜系圖,29,五、最遠距離聚類法,最遠距離聚類法與最短距離聚類法的區(qū)別在于計算原來的類與新類距離時采用的公式不同。 最遠距離聚類法的計算公式是:,,(3.3.11),,30,例子: 對于前面的例子,最遠距離聚類法的聚類過程如下: ① 在9×9階距離矩陣中,非對角元素中最小者是d94=0.51,將第4區(qū)與第9區(qū)并為一類,記為G10,即G10={G4,G9}。按照公式(3.3.11)分別計算G1,G2,G3,G5,G6,G7,G8與G10之間的距離,得到一個新的8×8階距離矩陣:,31,32,② 在第一步所得到的8×8階距離矩陣中,非對角線元素中最小者為d57=0.83,故將G5與G7歸并為一類,記為G11,即G11={G5,G7}。按照公式(3.3.11)式分別計算G1,G2,G3,G6,G8,G10與G11之間的距離,得到一個新的7×7階距離矩陣如下:,,33,③ 在第二步中所得到的7×7階距離矩陣中,非對角線元素中最小者為d28=0.88,故將G2與G8歸并為一類,記為G12,即G12={G2,G8}。再按照公式(3.3.11)式分別計算G1,G3,G6,G10,G11與G12之間的距離,得到一個新的6×6階距離矩陣如下:,,34,④ 在第三步中所得的6×6階距離矩陣中,非對角元素中最小者為d3,10=1.23,故將G3與G10歸并為一類,記為G13,即G13={G3,G10}={G3,(G4,G9)}。再按照公式(3.3.11)式計算G1,G6,G11,G12與G13之間的距離,得到一個新的5×5階距離矩陣如下:,,35,⑤ 在第四步所得的5×5階距離矩陣中,非對角線元素中最小者為d1,12=1.52,故將G1與G12歸并為一類,記為G14,即G14={G1,G12}={G1,(G2,G8)}。再按照公式(3.3.11)式分別計算G6,G11,G13與G14之間的距離,得到一個新的4×4階距離矩陣如下:,,36,⑥ 在第五步所得的4×4階距離矩陣中,非對角線元素中最小者為d6,11=1.78,故將G6與G11歸并為一類,記為G15,即G15={G6,G11}={G6,(G5,G7)}。再按照公式(3.3.11)式分別計算G13,G14和G15之間的距離,得到一個新的3×3階距離矩陣如下:,,37,⑦ 在第六步中所得的3×3階距離矩陣中,非對角線元素中最小者為d13,14=3.10,故將G13與G14歸并為一類,記為G16,即G16={G13,G14}={(G3,(G4,G9)),(G1,(G2,G8))}。再按照公式(3.3.11)式計算G15與G16之間的距離,可得一個新的2×2階距離矩陣如下:,38,,⑧ 將G15與G16歸并為一類。此時,各個分類 對象均已歸并為一類。 綜合上述聚類過程,可以作出最遠距離聚類譜 系圖(如圖3.4.3所示)。,39,六、計算類之間距離的統(tǒng)一公式,最短距離和最遠距離:可以用一個公式表示 用下圖表示二者關(guān)系:,,(3.3.12),40,當α、β、γ三個參數(shù)取不同的值時,就形成了不同的聚類方法(見表3.3.4),在表3.3.4中,np是p類中單元的個數(shù),nq是q類中單元的個數(shù),nr=np+nq;β一般取負值。,系統(tǒng)聚類其他方法的公式 :,(3.3.13),41,,,,,,,,,,,八種系統(tǒng)聚類方法的距離參數(shù)值,表3.4.4,42,七、實例分析,表3.4.5給出了某農(nóng)業(yè)生態(tài)經(jīng)濟系統(tǒng)各個區(qū)域單元的有關(guān)數(shù)據(jù),下面我們運用系統(tǒng)聚類法,對該農(nóng)業(yè)生態(tài)經(jīng)濟系統(tǒng)進行聚類分析,步驟如下: ①用標準差標準化方法,對9項指標的原始數(shù)據(jù)進行處理; ②采用歐氏距離測度21個區(qū)域單元之間的距離; ③選用組平均法,計算類間的距離,依據(jù)不同的聚類標準(距離),對各樣本(各區(qū)域單元)進行聚類,并作出聚類譜系圖。,43,表3.4.5 某農(nóng)業(yè)生態(tài)經(jīng)濟系統(tǒng)各區(qū)域單元的有關(guān)數(shù)據(jù),44,45,,圖3.4.5 某農(nóng)業(yè)生態(tài)經(jīng)濟系統(tǒng)區(qū)域單元的系統(tǒng)聚類(組平均法)譜系圖,46,從聚類分析譜系圖(圖3.4.5)可以看出,在不同的聚類標準(距離)下,聚類結(jié)果不同,當距離標準逐漸放大到時,21個區(qū)域單元被依次聚類。 當距離為0時,每個樣本為單獨的一類; 當距離為5,則21個區(qū)域單元被聚為16類; 當距離為10,則21個區(qū)域單元被聚為9類; 當距離為15,則21個區(qū)域單元被聚為5類; 當距離為20,則21個區(qū)域單元被聚為3類; 最終,當聚類標準(距離)擴大到25時,21個區(qū)域單元被聚為1類。,47,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 聚類分析 ppt 課件
鏈接地址:http://m.appdesigncorp.com/p-1490675.html