聚類(lèi)分析ppt課件
《聚類(lèi)分析ppt課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《聚類(lèi)分析ppt課件(47頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第四節(jié) 聚類(lèi)分析,聚類(lèi)要素的數(shù)據(jù)處理 距離的計(jì)算 直接聚類(lèi)法 最短距離聚類(lèi)法 最遠(yuǎn)距離聚類(lèi)法 系統(tǒng)聚類(lèi)法計(jì)算類(lèi)之間距離的統(tǒng)一公式 系統(tǒng)聚類(lèi)分析實(shí)例,1,一、聚類(lèi)要素的數(shù)據(jù)處理,在聚類(lèi)分析中,聚類(lèi)要素的選擇是十分重要的,它直接影響分類(lèi)結(jié)果的準(zhǔn)確性和可靠性。 在地理分類(lèi)和分區(qū)研究中,被聚類(lèi)的對(duì)象常常是多個(gè)要素構(gòu)成的。不同要素的數(shù)據(jù)往往具有不同的單位和量綱,其數(shù)值的變異可能是很大的,這就會(huì)對(duì)分類(lèi)結(jié)果產(chǎn)生影響。因此當(dāng)分類(lèi)要素的對(duì)象確定之后,在進(jìn)行聚類(lèi)分析之前,首先要對(duì)聚類(lèi)要素進(jìn)行數(shù)據(jù)處理。,,,,2,假設(shè)有m 個(gè)聚類(lèi)的對(duì)象,每一個(gè)聚類(lèi)對(duì)象都有個(gè)要素構(gòu)成。它們所對(duì)應(yīng)的要素?cái)?shù)據(jù)可用3.4.1給出。,表3.4.1 聚類(lèi)對(duì)象與要素?cái)?shù)據(jù),3,在聚類(lèi)分析中,常用的聚類(lèi)要素的數(shù)據(jù)處理方法有如下幾種:,① 總和標(biāo)準(zhǔn)化。分別求出各聚類(lèi)要素所對(duì)應(yīng)的數(shù)據(jù)的總和,以各要素的數(shù)據(jù)除以該要素的數(shù)據(jù)的總和,即 這種標(biāo)準(zhǔn)化方法所得到的新數(shù)據(jù)滿(mǎn)足,,(3.4.1),,,4,② 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,即 由這種標(biāo)準(zhǔn)化方法所得到的新數(shù)據(jù),各要素的平均值為0,標(biāo)準(zhǔn)差為1,即有,(3.4.2),5,③ 極大值標(biāo)準(zhǔn)化,即 經(jīng)過(guò)這種標(biāo)準(zhǔn)化所得的新數(shù)據(jù),各要素的極大值為1,其余各數(shù)值小于1。 ④ 極差的標(biāo)準(zhǔn)化,即 經(jīng)過(guò)這種標(biāo)準(zhǔn)化所得的新數(shù)據(jù),各要素的極大值為1,極小值為0,其余的數(shù)值均在0與1之間。,,,(3.4.3),,(3.4.4),6,例題:表3.4.2給出了某地區(qū)九個(gè)農(nóng)業(yè)區(qū)的七項(xiàng)指標(biāo),它們經(jīng)過(guò)極差標(biāo)準(zhǔn)化處理后,如表3.4.3所示。,表3.4.2 某地區(qū)九個(gè)農(nóng)業(yè)區(qū)的七項(xiàng)經(jīng)濟(jì)指標(biāo)數(shù)據(jù),7,表3.4.3 極差標(biāo)準(zhǔn)化處理后的數(shù)據(jù),8,二、距離的計(jì)算,常見(jiàn)的距離有 ① 絕對(duì)值距離 ② 歐氏距離 ③ 明科夫斯基距離,,(3.4.5),,(3.4.6),,(3.4.7),9,④ 切比雪夫距離。當(dāng)明科夫斯基距 時(shí),有 據(jù)表3.4.3中的數(shù)據(jù),用公式(3.4.5)式計(jì)算可 得九個(gè)農(nóng)業(yè)區(qū)之間的絕對(duì)值距離矩陣如下:,,(3.4.8),(3.4.9),,10,三、直接聚類(lèi)法,原理:先把各個(gè)分類(lèi)對(duì)象單獨(dú)視為一類(lèi),然后根據(jù)距離最小的原則,依次選出一對(duì)分類(lèi)對(duì)象,并成新類(lèi)。如果其中一個(gè)分類(lèi)對(duì)象已歸于一類(lèi),則把另一個(gè)也歸入該類(lèi);如果一對(duì)分類(lèi)對(duì)象正好屬于已歸的兩類(lèi),則把這兩類(lèi)并為一類(lèi)。每一次歸并,都劃去該對(duì)象所在的列與列序相同的行。經(jīng)過(guò)m-1次就可以把全部分類(lèi)對(duì)象歸為一類(lèi),這樣就可以根據(jù)歸并的先后順序作出聚類(lèi)譜系圖。,11,例:根據(jù)距離矩陣式(3.4.9),用直接聚類(lèi)法對(duì)某地區(qū)的九個(gè)農(nóng)業(yè)區(qū)進(jìn)行聚類(lèi)分析,步驟如下: ① 在距離矩陣D中,除去對(duì)角線元素以外,d49=d94=0.51為最小者,故將第4區(qū)與第9區(qū)并為一類(lèi),劃去第9行和第9列; ② 在余下的元素中,除對(duì)角線元素以外,d75= d57=0.83為最小者,故將第5區(qū)與第7區(qū)并為一類(lèi),劃掉第7行和第7列;,12,③ 在第二步之后余下的元素之中,除對(duì)角線元素以外,d82= d28=0.88為最小者,故將第2區(qū)與第8區(qū)并為一類(lèi),劃去第8行和第8列;,④ 在第三步之后余下的元素中,除對(duì)角線元素以外,d43= d34=1.23為最小者,故將第3區(qū)與第4區(qū)并為一類(lèi),劃去第4行和第4列,此時(shí),第3、4、9區(qū)已歸并為一類(lèi);,13,⑤ 在第四步之后余下的元素中,除對(duì)角線元素以外,d21= d12=1.52為最小者,故將第1區(qū)與第2區(qū)并為一類(lèi),劃去第2行和第2列,此時(shí),第1、2、8區(qū)已歸并為一類(lèi); ⑥ 在第五步之后余下的元素中,除對(duì)角線元素以外,d65= d56=1.78為最小者,故將第5區(qū)與第6區(qū)并為一類(lèi),劃去第6行和第6列,此時(shí),第5、6、7區(qū)已歸并為一類(lèi);,14,⑦ 在第六步之后余下的元素中,除對(duì)角線元素以外,d31= d13=3.10為最小者,故將第1區(qū)與第3區(qū)并為一類(lèi),劃去第3行和第3列,此時(shí),第1、2、3、4、8、9區(qū)已歸并為一類(lèi); ⑧ 在第七步之后余下的元素中,除去對(duì)角線元素以外,只有d51= d15=5.86,故將第1區(qū)與第5區(qū)并為一類(lèi),劃去第5行和第5列,此時(shí),第1、2、3、4、5、6、7、8、9、區(qū)均歸并為一類(lèi); 根據(jù)上述步驟,可以作出聚類(lèi)過(guò)程的譜系圖(圖3.4.1)。,15,,圖3.4.1 直接聚類(lèi)譜系圖,16,四、最短距離聚類(lèi)法,原理:最短距離聚類(lèi)法,是在原來(lái)的m×m距離矩陣的非對(duì)角元素中找出 ,把分類(lèi)對(duì)象Gp和Gq歸并為一新類(lèi)Gr,然后按計(jì)算公式 計(jì)算原來(lái)各類(lèi)與新類(lèi)之間的距離,這樣就得到一個(gè)新的(m-1)階的距離矩陣; 再?gòu)男碌木嚯x矩陣中選出最小者dij,把Gi和Gj歸并成新類(lèi);再計(jì)算各類(lèi)與新類(lèi)的距離,這樣一直下去,直至各分類(lèi)對(duì)象被歸為一類(lèi)為止。,,(3.3.10),,17,例題: 以下根據(jù)式(3.3.9)中的距離矩陣,用最短距離聚類(lèi)法對(duì)某地區(qū)的九個(gè)農(nóng)業(yè)區(qū)進(jìn)行聚類(lèi)分析。,18,① 在9×9階距離矩陣D中,非對(duì)角元素中最小者是d94=0.51,首先將第4區(qū)與第9區(qū)并為一類(lèi),記為即G10={G4,G9}。按照公式(3.3.10)式分別計(jì)算G1,G2,G3,G5,G6,G7,G8與G10之間的距離得: d1,10=min{d14,d19}= min{2.19,2.62}=2.19 d2,10=min{d24,d29}= min{1.47,1.66}=1.47 d3,10=min{d34,d39}= min{1.23,1.20}=1.20,19,d5,10=min{d54,d59}= min{4.77,4.84}=4.77 d6,10=min{d64,d69}= min{2.99,3.06}=2.99 d7,10=min{d74,d79}= min{4.06,3.32}=3.32 d8,10=min{d84,d89}= min{1.29,1.40}=1.29 ② 這樣就得到G1,G2,G3,G5,G6,G7,G8,G10上的一個(gè)新的8×8階距離矩陣:,20,,21,③ 在上一步驟中所得到的8×8階距離矩陣中,非對(duì)角元素中最小者為d57=0.83,故將G5與G7歸并為一類(lèi),記為G11,即G11={G5,G7}。 按照公式(3.3.10)式計(jì)分別算G1,G2,G3,G6,G8,G10與G11之間的距離,可得到一個(gè)新的7×7階距離矩陣:,22,,④ 在第二步所得到的7×7階距離矩陣中,非對(duì)角元素中最小者為d28=0.88,故將G2與G8歸并為一類(lèi),記為G12,即G12={G2,G8}。再按照公式(3.3.10)式分別計(jì)算G1,G3,G6,G10,G11與G12之間的距離,可得到一個(gè)新的6×6階距離矩陣:,23,⑤ 在第三步中所得的6×6階距離矩陣中,非對(duì)角元素中最小者為d6,11=1.07,故將G6與G11歸并為一類(lèi),記為G13,即G13={G6,G11}={G6,(G5,G7)}。再按照公式(3.3.10)式計(jì)算G1,G3,G10,G12與G13之間的距離,可得到一個(gè)新的5×5階距離矩陣:,,24,⑥ 在第四步中所得的5×5階距離矩陣中,非對(duì)角線元素中最小者為d3,10=1.20,故將G3與G10歸并為一類(lèi),記為G14,即G14={G3,G10}={G3,(G4,G9)}。再按照公式(3.3.10)式計(jì)算G1,G12,G13與G14之間的距離,可得一個(gè)新的4×4階距離矩陣:,,25,⑦ 在第五步所得到的4×4階距離矩陣中,非對(duì)角線元素中最小者為d12,14=1.29,故將G12與G14歸并為一類(lèi),記為G15,即G15={G12,G14}={(G2,G8),(G3,(G4,G9))}。再按照公式(3.3.10)式計(jì)算G1,G13與G15之間的距離,可得一個(gè)新的3×3階距離矩陣:,,,26,⑧ 在第六步所得的3×3階距離矩陣中,非對(duì)角線元素中最小者為d1,15=1.32,故將G1與G15歸并為一類(lèi),記為G16,即G16={G1,G15}={(G1,(G2,G8),(G3,(G4,G9))}。再按照公式(3.3.10)式計(jì)算G13與G16之間的距離,可得一個(gè)新的2×2階距離矩陣:,,,27,⑨ 將G13與G16歸并為一類(lèi)。此時(shí),所有分類(lèi)對(duì)象均被歸并為一類(lèi)。 綜合上述聚類(lèi)過(guò)程,可以作出最短距離聚類(lèi)譜系圖(如圖3.4.2所示)。,,,,28,圖3.4.2 最短距離聚類(lèi)譜系圖,29,五、最遠(yuǎn)距離聚類(lèi)法,最遠(yuǎn)距離聚類(lèi)法與最短距離聚類(lèi)法的區(qū)別在于計(jì)算原來(lái)的類(lèi)與新類(lèi)距離時(shí)采用的公式不同。 最遠(yuǎn)距離聚類(lèi)法的計(jì)算公式是:,,(3.3.11),,30,例子: 對(duì)于前面的例子,最遠(yuǎn)距離聚類(lèi)法的聚類(lèi)過(guò)程如下: ① 在9×9階距離矩陣中,非對(duì)角元素中最小者是d94=0.51,將第4區(qū)與第9區(qū)并為一類(lèi),記為G10,即G10={G4,G9}。按照公式(3.3.11)分別計(jì)算G1,G2,G3,G5,G6,G7,G8與G10之間的距離,得到一個(gè)新的8×8階距離矩陣:,31,32,② 在第一步所得到的8×8階距離矩陣中,非對(duì)角線元素中最小者為d57=0.83,故將G5與G7歸并為一類(lèi),記為G11,即G11={G5,G7}。按照公式(3.3.11)式分別計(jì)算G1,G2,G3,G6,G8,G10與G11之間的距離,得到一個(gè)新的7×7階距離矩陣如下:,,33,③ 在第二步中所得到的7×7階距離矩陣中,非對(duì)角線元素中最小者為d28=0.88,故將G2與G8歸并為一類(lèi),記為G12,即G12={G2,G8}。再按照公式(3.3.11)式分別計(jì)算G1,G3,G6,G10,G11與G12之間的距離,得到一個(gè)新的6×6階距離矩陣如下:,,34,④ 在第三步中所得的6×6階距離矩陣中,非對(duì)角元素中最小者為d3,10=1.23,故將G3與G10歸并為一類(lèi),記為G13,即G13={G3,G10}={G3,(G4,G9)}。再按照公式(3.3.11)式計(jì)算G1,G6,G11,G12與G13之間的距離,得到一個(gè)新的5×5階距離矩陣如下:,,35,⑤ 在第四步所得的5×5階距離矩陣中,非對(duì)角線元素中最小者為d1,12=1.52,故將G1與G12歸并為一類(lèi),記為G14,即G14={G1,G12}={G1,(G2,G8)}。再按照公式(3.3.11)式分別計(jì)算G6,G11,G13與G14之間的距離,得到一個(gè)新的4×4階距離矩陣如下:,,36,⑥ 在第五步所得的4×4階距離矩陣中,非對(duì)角線元素中最小者為d6,11=1.78,故將G6與G11歸并為一類(lèi),記為G15,即G15={G6,G11}={G6,(G5,G7)}。再按照公式(3.3.11)式分別計(jì)算G13,G14和G15之間的距離,得到一個(gè)新的3×3階距離矩陣如下:,,37,⑦ 在第六步中所得的3×3階距離矩陣中,非對(duì)角線元素中最小者為d13,14=3.10,故將G13與G14歸并為一類(lèi),記為G16,即G16={G13,G14}={(G3,(G4,G9)),(G1,(G2,G8))}。再按照公式(3.3.11)式計(jì)算G15與G16之間的距離,可得一個(gè)新的2×2階距離矩陣如下:,38,,⑧ 將G15與G16歸并為一類(lèi)。此時(shí),各個(gè)分類(lèi) 對(duì)象均已歸并為一類(lèi)。 綜合上述聚類(lèi)過(guò)程,可以作出最遠(yuǎn)距離聚類(lèi)譜 系圖(如圖3.4.3所示)。,39,六、計(jì)算類(lèi)之間距離的統(tǒng)一公式,最短距離和最遠(yuǎn)距離:可以用一個(gè)公式表示 用下圖表示二者關(guān)系:,,(3.3.12),40,當(dāng)α、β、γ三個(gè)參數(shù)取不同的值時(shí),就形成了不同的聚類(lèi)方法(見(jiàn)表3.3.4),在表3.3.4中,np是p類(lèi)中單元的個(gè)數(shù),nq是q類(lèi)中單元的個(gè)數(shù),nr=np+nq;β一般取負(fù)值。,系統(tǒng)聚類(lèi)其他方法的公式 :,(3.3.13),41,,,,,,,,,,,八種系統(tǒng)聚類(lèi)方法的距離參數(shù)值,表3.4.4,42,七、實(shí)例分析,表3.4.5給出了某農(nóng)業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)各個(gè)區(qū)域單元的有關(guān)數(shù)據(jù),下面我們運(yùn)用系統(tǒng)聚類(lèi)法,對(duì)該農(nóng)業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)進(jìn)行聚類(lèi)分析,步驟如下: ①用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化方法,對(duì)9項(xiàng)指標(biāo)的原始數(shù)據(jù)進(jìn)行處理; ②采用歐氏距離測(cè)度21個(gè)區(qū)域單元之間的距離; ③選用組平均法,計(jì)算類(lèi)間的距離,依據(jù)不同的聚類(lèi)標(biāo)準(zhǔn)(距離),對(duì)各樣本(各區(qū)域單元)進(jìn)行聚類(lèi),并作出聚類(lèi)譜系圖。,43,表3.4.5 某農(nóng)業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)各區(qū)域單元的有關(guān)數(shù)據(jù),44,45,,圖3.4.5 某農(nóng)業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)區(qū)域單元的系統(tǒng)聚類(lèi)(組平均法)譜系圖,46,從聚類(lèi)分析譜系圖(圖3.4.5)可以看出,在不同的聚類(lèi)標(biāo)準(zhǔn)(距離)下,聚類(lèi)結(jié)果不同,當(dāng)距離標(biāo)準(zhǔn)逐漸放大到時(shí),21個(gè)區(qū)域單元被依次聚類(lèi)。 當(dāng)距離為0時(shí),每個(gè)樣本為單獨(dú)的一類(lèi); 當(dāng)距離為5,則21個(gè)區(qū)域單元被聚為16類(lèi); 當(dāng)距離為10,則21個(gè)區(qū)域單元被聚為9類(lèi); 當(dāng)距離為15,則21個(gè)區(qū)域單元被聚為5類(lèi); 當(dāng)距離為20,則21個(gè)區(qū)域單元被聚為3類(lèi); 最終,當(dāng)聚類(lèi)標(biāo)準(zhǔn)(距離)擴(kuò)大到25時(shí),21個(gè)區(qū)域單元被聚為1類(lèi)。,47,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 聚類(lèi)分析 ppt 課件
鏈接地址:http://m.appdesigncorp.com/p-1490675.html