SPSS數(shù)據(jù)分析教程-10聚類(lèi)分析.ppt

上傳人：za****8

文檔編號(hào)：2984993

上傳時(shí)間：2019-12-05

格式：PPT

頁(yè)數(shù)：47

大?。?65.51KB

《SPSS數(shù)據(jù)分析教程-10聚類(lèi)分析.ppt》由會(huì)員分享，可在線(xiàn)閱讀，更多相關(guān)《SPSS數(shù)據(jù)分析教程-10聚類(lèi)分析.ppt（47頁(yè)珍藏版）》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

SPSS數(shù)據(jù)分析教程,—《SPSS數(shù)據(jù)分析教程》,第10章聚類(lèi)分析,,目錄,10.1 聚類(lèi)分析簡(jiǎn)介 10.2 個(gè)案間的距離 10.2.1 定距數(shù)據(jù)（Scale Mearsurement）距離定義方式 10.2.2 分類(lèi)數(shù)據(jù)的頻數(shù) 數(shù)據(jù)（Count） 10.2.3 二分類(lèi)數(shù)據(jù) 10.3 類(lèi)之間的距離 10.4 系統(tǒng)聚類(lèi)算法過(guò)程 10.5 系統(tǒng)聚類(lèi)案例 10.6 K-均值聚類(lèi) 10.6.1 K-均值法簡(jiǎn)介 10.5.2 K-均值法案例 10.7 兩步法聚類(lèi) 10.7.1 兩步法簡(jiǎn)介 10.7.2 兩步法案例分析 10.8 聚類(lèi)分析注意事項(xiàng),本章學(xué)習(xí)目標(biāo),理解聚類(lèi)分析的基本概念；了解個(gè)案之間距離的定義方式；了解類(lèi)之間距離的定義方式；掌握系統(tǒng)聚類(lèi)方法；掌握兩步法聚類(lèi)方法；掌握K均值聚類(lèi)方法。,10.1 聚類(lèi)分析簡(jiǎn)介,根據(jù)對(duì)象的某些屬性把它們分到一些組中，使得同組內(nèi)的對(duì)象盡可能地相似，不同組中的對(duì)象盡可能地不一樣，即所謂的聚類(lèi)分析。聚類(lèi)分析方法被稱(chēng)為“無(wú)監(jiān)督的分析方法”，意即沒(méi)有因變量。而另外一種分類(lèi)的方法是判別分析，它是把樣本歸入到已知的事先已經(jīng)確定下來(lái)的類(lèi)中去, 它有因變量（即事先確定的類(lèi)別），是“有監(jiān)督的分析方法”。,,,聚類(lèi)分析不必事先知道分類(lèi)對(duì)象的結(jié)構(gòu)，從一批樣品的多個(gè)觀測(cè)指標(biāo)中，找出能度量樣品之間或指標(biāo)（變量）之間相似程度或親疏關(guān)系的統(tǒng)計(jì)量，構(gòu)成一個(gè)對(duì)稱(chēng)相似性矩陣，并按相似程度的大小，把樣品或變量逐一歸類(lèi)。根據(jù)對(duì)樣品聚類(lèi)還是對(duì)變量聚類(lèi)，聚類(lèi)分析分Q型聚類(lèi)和R型聚類(lèi)。對(duì)變量的聚類(lèi)稱(chēng)為R型聚類(lèi)，而對(duì)樣品（即觀測(cè)值）聚類(lèi)稱(chēng)為Q型聚類(lèi)。通俗講，R型聚類(lèi)是對(duì)數(shù)據(jù)中的列分類(lèi)，Q型聚類(lèi)是對(duì)數(shù)據(jù)中的行分類(lèi)。,,SPSS Statistics提供了3種聚類(lèi)方法，它們是系統(tǒng)聚類(lèi)法（又稱(chēng)層次聚類(lèi)）、K-均值聚類(lèi)（又稱(chēng)快速聚類(lèi)法）和兩步法聚類(lèi)。,10.2 個(gè)案間的距離,定距數(shù)據(jù)距離定義方式歐式（Euclidean）距離平方歐式距離余弦距離皮爾遜（Pearson）相關(guān)性距離切比雪夫（Chebychev）距離塊（Block）距離閔考斯基（Minkowski）距離冪（Power）距離,10.2.2 分類(lèi)數(shù)據(jù)之間的距離,卡方度量 Phi方度量,10.3 類(lèi)之間的距離,SPSS提供了7種計(jì)算兩個(gè)類(lèi)距離的方法。組間連接法（Between-groups Linkage）組內(nèi)連接法（Within-Groups Linkage）最近鄰元素法（Nearest Neighbor）最長(zhǎng)距離法（Furthest Neighbor）質(zhì)心聚類(lèi)法（Centroid Clustering）中位數(shù)聚類(lèi)法（Median Clustering) 離差平方和法（Ward’s Method）,10.4 系統(tǒng)聚類(lèi)算法過(guò)程,,系統(tǒng)聚類(lèi)的步驟,第1步：數(shù)據(jù)標(biāo)準(zhǔn)化。把原始數(shù)據(jù)標(biāo)準(zhǔn)化得到標(biāo)準(zhǔn)化數(shù)據(jù)矩陣。第2步：計(jì)算相似系數(shù)矩陣。這里以余弦距離為例。計(jì)算Q型聚類(lèi)任意兩個(gè)樣品xj和xk的相似系數(shù)矩陣。,,第3步：選出有最大相似系數(shù)的樣品組。第4步：把該組樣品加權(quán)平均，這樣就形成了一個(gè)新的組合樣品。第5步：用新的樣品類(lèi)代替原來(lái)的一對(duì)樣品點(diǎn)。第6步：對(duì)新形成的樣品與其余樣品數(shù)據(jù)重新計(jì)算相似系數(shù)矩陣。第7步：如此重復(fù)第2步到第5步的過(guò)程，直到把所有樣品都?xì)w類(lèi)完畢。,,第8步：最后，按下列原則構(gòu)成類(lèi)關(guān)系圖。若兩個(gè)樣品在已經(jīng)連接成的組中未出現(xiàn)過(guò)，則它們連接成一個(gè)新組。若兩個(gè)樣品中有一個(gè)在某組中出現(xiàn)過(guò)，則另一個(gè)就加入該組。若兩個(gè)樣品都在同一組中，則這對(duì)樣品不再分組。若兩個(gè)樣品都在不同組中出現(xiàn)過(guò)，則把這兩組連接在一起。,10.5 系統(tǒng)聚類(lèi)案例,打開(kāi)本章的數(shù)據(jù)文件Cluster_cars.sav。該數(shù)據(jù)是市場(chǎng)上一些品牌汽車(chē)的資料，它包括汽車(chē)制造商、型號(hào)、新車(chē)價(jià)錢(qián)、4年以后的二手車(chē)價(jià)錢(qián)，還有功率、引擎大小、車(chē)重、車(chē)體長(zhǎng)、車(chē)體寬、車(chē)輪大小、油耗等諸多屬性。按照這些數(shù)據(jù)對(duì)當(dāng)前市場(chǎng)上的車(chē)進(jìn)行聚類(lèi)，看看哪些品牌的車(chē)定位有類(lèi)似之處，制造商可以據(jù)此制定相應(yīng)的策略。,,選擇【分析】→【分類(lèi)】→【系統(tǒng)聚類(lèi)】把從“Price in thousand”到“Fuel efficiency”的所有變量選入右邊的“變量框”。把“Model”變量選入“標(biāo)注個(gè)案”框。依次單擊【統(tǒng)計(jì)量】、【繪制】、【方法】和【保存】按鈕,,,,,,,10.6 K-均值聚類(lèi),,K-均值聚類(lèi)的算法過(guò)程,第1步：用戶(hù)給定聚類(lèi)個(gè)數(shù)K。第2步：給出初始類(lèi)中心。第3步：計(jì)算所有個(gè)體到這K個(gè)類(lèi)中心的距離，然后按照到K個(gè)類(lèi)中心距離最短原則，把所有個(gè)體分別劃分到距最近的中心點(diǎn)所在的類(lèi)中，這樣形成了K個(gè)類(lèi)，完成一次迭代過(guò)程。第4步：重新計(jì)算K個(gè)類(lèi)的類(lèi)中心。第5步：重復(fù)進(jìn)行第3步、第4步。直到迭代次數(shù)達(dá)到限制的次數(shù)或者類(lèi)中心不再變化為止。,K-均值法案例,打開(kāi)本章的數(shù)據(jù)文件Cluster_cars.sav。該數(shù)據(jù)是市場(chǎng)上一些品牌汽車(chē)的資料，它包括汽車(chē)制造商、型號(hào)、新車(chē)價(jià)錢(qián)、4年以后的二手車(chē)價(jià)錢(qián)，還有功率、引擎大小、車(chē)重、車(chē)體長(zhǎng)、車(chē)體寬、車(chē)輪大小、油耗等諸多屬性。按照這些數(shù)據(jù)對(duì)當(dāng)前市場(chǎng)上的車(chē)進(jìn)行聚類(lèi)，看看哪些品牌的車(chē)定位有類(lèi)似之處，制造商可以據(jù)此制定相應(yīng)的策略。,,選擇【分析】→【分類(lèi)】→【K-均值聚類(lèi)】,,,,,,10.7 兩步法聚類(lèi),,,兩步法聚類(lèi)又稱(chēng)兩階段聚類(lèi)，它與系統(tǒng)聚類(lèi)相似，是揭示數(shù)據(jù)所蘊(yùn)含的自然組別的一種探索性分析方法。,兩步法聚類(lèi)的特點(diǎn),（1）聚類(lèi)變量可以是連續(xù)變量，也可以是分類(lèi)變量。兩步法聚類(lèi)充分考慮到這兩種變量的不同性質(zhì)，采用對(duì)數(shù)似然距離來(lái)衡量相似性。（2）它能自動(dòng)確定出類(lèi)的個(gè)數(shù)。（3）能夠有效地分析大數(shù)據(jù)集。,兩階段聚類(lèi)算法的兩個(gè)階段,第1步：建立一個(gè)聚類(lèi)特性樹(shù)。第2步：應(yīng)用凝聚算法對(duì)聚類(lèi)特性樹(shù)的葉節(jié)點(diǎn)進(jìn)行分類(lèi)。,兩步法的距離度量,兩步法的距離度量有兩種（1）對(duì)數(shù)似然（SPSS 翻譯為對(duì)數(shù)相似值）：這里由于聚類(lèi)指標(biāo)中含有分類(lèi)變量，所以只能選擇該項(xiàng)。（2）歐式距離（Euclidean）：當(dāng)聚類(lèi)指標(biāo)不含有分類(lèi)變量時(shí)可以選擇該距離。,聚類(lèi)數(shù)量,（1）自動(dòng)確定：可以選擇自動(dòng)確定，這里可以限定類(lèi)個(gè)數(shù)的上限。默認(rèn)最多15個(gè)類(lèi)。也可以據(jù)需要修改類(lèi)個(gè)數(shù)的最大值。（2）指定固定值：如果很有把握，那么你可以輸入你想要的類(lèi)個(gè)數(shù)。,聚類(lèi)準(zhǔn)則,有AIC和BIC兩個(gè)準(zhǔn)則，這兩個(gè)模型選擇準(zhǔn)則在選擇模型方面基本類(lèi)似，都是綜合考慮樣本數(shù)和模型的復(fù)雜程度。AIC或者BIC的值越小，模型越好。,兩步法案例分析,數(shù)據(jù)文件Twosteps_car.sav 選擇【分析】→【分類(lèi)】→【兩步聚類(lèi)】,兩步法聚類(lèi)選項(xiàng)設(shè)置（1）,兩步法聚類(lèi)選項(xiàng)設(shè)置（2）,評(píng)估字段：評(píng)估字段不用于聚類(lèi)過(guò)程，但是可以用它們來(lái)描述兩步法生成的類(lèi)的特征。,兩步法聚類(lèi)的模型摘要,兩步法模型視圖,兩步法模型視圖,兩步法模型視圖,作業(yè),,

下載提示(請(qǐng)認(rèn)真閱讀)

1.請(qǐng)仔細(xì)閱讀文檔，確保文檔完整性，對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
2.下載的文檔，不會(huì)出現(xiàn)我們的網(wǎng)址水印。
3、該文檔所得收入（下載+內(nèi)容+預(yù)覽）歸上傳者、原創(chuàng)作者；如果您是本文檔原作者，請(qǐng)點(diǎn)此認(rèn)領(lǐng)！既往收益都?xì)w您。

同意并開(kāi)始全文預(yù)覽

文檔包含非法信息？點(diǎn)此舉報(bào)后獲取現(xiàn)金獎(jiǎng)勵(lì)！

文檔加載中……請(qǐng)稍候！
如果長(zhǎng)時(shí)間未打開(kāi)，您也可以點(diǎn)擊刷新試試。

下載文檔到電腦，查找使用更方便

9.9 積分

還剩頁(yè)未讀，繼續(xù)閱讀

舉報(bào)

版權(quán)申訴 word格式文檔無(wú)特別注明外均可編輯修改；預(yù)覽文檔經(jīng)過(guò)壓縮，下載后原文更清晰！ 立即下載

配套講稿：: 如PPT文件的首頁(yè)顯示word圖標(biāo)，表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
特殊限制：: 部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片，僅作為作品整體效果示例展示，禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
關(guān) 鍵詞：: SPSS 數(shù)據(jù) 分析教程 10 聚類(lèi)分析

溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

裝配圖網(wǎng)所有資源均是用戶(hù)自行上傳分享，僅供網(wǎng)友學(xué)習(xí)交流，未經(jīng)上傳用戶(hù)書(shū)面授權(quán)，請(qǐng)勿作他用。

關(guān)于本文

本文標(biāo)題：SPSS數(shù)據(jù)分析教程-10聚類(lèi)分析.ppt
鏈接地址：http://m.appdesigncorp.com/p-2984993.html

相關(guān)資源更多

正為您匹配相似的精品文檔

相關(guān)搜索

SPSS 數(shù)據(jù) 分析教程 10 聚類(lèi)分析

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025 zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有聯(lián)系電話(huà)：18123376007

備案號(hào):蜀ICP備2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)

本站為文檔C2C交易模式，即用戶(hù)上傳的文檔直接被用戶(hù)下載，本站只是中間服務(wù)平臺(tái)，本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請(qǐng)立即通知裝配圖網(wǎng)，我們立即給予刪除！

SPSS數(shù)據(jù)分析教程-10聚類(lèi)分析.ppt

最新文檔