SPSS聚類分析具體操作步驟.ppt
《SPSS聚類分析具體操作步驟.ppt》由會員分享,可在線閱讀,更多相關(guān)《SPSS聚類分析具體操作步驟.ppt(20頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
SPSS的聚類分析,,,俗語說,物以類聚、人以群分。 但什么是分類的根據(jù)呢? 舉例:要想把中國的縣分成若干類,就有很多種分類法; 可以按照自然條件來分, 比如考慮降水、土地、日照、濕度等各方面; 也可以考慮收入、教育水準(zhǔn)、醫(yī)療條件、基礎(chǔ)設(shè)施等指標(biāo); 既可以用某一項(xiàng)來分類,也可以同時考慮多項(xiàng)指標(biāo)來分類。,聚類分析概述,(一)概念 (1)聚類分析是統(tǒng)計(jì)學(xué)中研究“物以類聚”的一種方法,屬多元統(tǒng)計(jì)分析方法. 例如:細(xì)分市場、消費(fèi)行為劃分 聚類分析是建立一種分類,是將一批樣本(或變量)按照在性質(zhì)上的“親疏”程度,在沒有先驗(yàn)知識的情況下自動進(jìn)行分類的方法.其中:類內(nèi)個體具有較高的相似性,類間的差異性較大.,,(二)“親疏”程度的衡量 (1)衡量指標(biāo) 相似性:數(shù)據(jù)間相似程度的度量 距離: 數(shù)據(jù)間差異程度的度量.距離越近,越“親密”,聚成一類;距離越遠(yuǎn),越“疏遠(yuǎn)”,分別屬于不同的類 (2)衡量對象 個體間距離 個體和小類間、小類和小類間的距離,兩個距離概念,按照遠(yuǎn)近程度來聚類需要明確兩個概念:一個是點(diǎn)和點(diǎn)之間的距離,一個是類和類之間的距離。 點(diǎn)間距離有很多定義方式。最簡單的是歐式距離,還有其他的距離。 當(dāng)然還有一些和距離相反但起同樣作用的概念,比如相似性等,兩點(diǎn)越相似度越大,就相當(dāng)于距離越短。 由一個點(diǎn)組成的類是最基本的類;如果每一類都由一個點(diǎn)組成,那么點(diǎn)間的距離就是類間距離。但是如果某一類包含不止一個點(diǎn),那么就要確定類間距離, 類間距離是基于點(diǎn)間距離定義的:比如兩類之間最近點(diǎn)之間的距離可以作為這兩類之間的距離,也可以用兩類中最遠(yuǎn)點(diǎn)之間的距離作為這兩類之間的距離;當(dāng)然也可以用各類的中心之間的距離來作為類間距離。在計(jì)算時,各種點(diǎn)間距離和類間距離的選擇是通過統(tǒng)計(jì)軟件的選項(xiàng)實(shí)現(xiàn)的。不同的選擇的結(jié)果會不同,但一般不會差太多。,SPSS中聚類分析分類,(一)按分類對象 對變量的聚類稱為R型聚類 對觀測值聚類稱為Q型聚類 這兩種聚類在數(shù)學(xué)上是對稱的,沒有什么不同。 (二)按聚類的方法分類 分層聚類或系統(tǒng)聚類分析 快速聚類分析 兩步聚類分析:新型的,事先不用確定分多少類:分層聚類,分層聚類或系統(tǒng)聚類(hierarchical cluster)。開始時,有多少點(diǎn)就是多少類。 它第一步先把最近的兩類(點(diǎn))合并成一類,然后再把剩下的最近的兩類合并成一類; 這樣下去,每次都少一類,直到最后只有一大類為止。顯然,越是后來合并的類,距離就越遠(yuǎn)。再對飲料例子來實(shí)施分層聚類。,,對于一個數(shù)據(jù),人們既可以對變量(指標(biāo))進(jìn)行分類(相當(dāng)于對數(shù)據(jù)中的列分類),也可以對觀測值(事件,樣品)來分類(相當(dāng)于對數(shù)據(jù)中的行分類)。 比如學(xué)生成績數(shù)據(jù)就可以對學(xué)生按照理科或文科成績(或者綜合考慮各科成績)分類, 當(dāng)然,并不一定事先假定有多少類,完全可以按照數(shù)據(jù)本身的規(guī)律來分類。,快速聚類,k-均值聚類(k-means cluster,也叫快速聚類,quick cluster)卻要求你先說好要分多少類。看起來有些主觀 假定你說分3類,這個方法還進(jìn)一步要求你事先確定3個點(diǎn)為“聚類種子”(SPSS軟件自動為你選種子);也就是說,把這3個點(diǎn)作為三類中每一類的基石。 然后,根據(jù)和這三個點(diǎn)的距離遠(yuǎn)近,把所有點(diǎn)分成三類。再把這三類的中心(均值)作為新的基石或種子(原來的“種子”就沒用了),重新按照距離分類。 如此疊代下去,直到達(dá)到停止疊代的要求. 適合處理大樣本數(shù)據(jù)。,,特點(diǎn) 聚類分析前所有個體所屬的類別是未知的,類別個數(shù)一般也是未知的,分析的依據(jù)只有原始數(shù)據(jù),可能事先沒有任何有關(guān)類別的信息可參考 嚴(yán)格地,聚類分析并不是純粹的統(tǒng)計(jì)技術(shù),不象其他多元分析,需要從樣本去推斷總體 一般不涉及統(tǒng)計(jì)量分布,也不需顯著性檢驗(yàn) 聚類分析更象是一種建立假設(shè)的方法,而對相關(guān)假設(shè)的檢驗(yàn)還需要借助其他統(tǒng)計(jì)方法,,注意 聚類分析主要用于探索性研究,其分析結(jié)果可提供多個可能的解,最終解的選擇需要研究者的主觀判斷和后續(xù)分析 聚類分析的解完全依賴于研究者所選擇的聚類變量,增加或刪除一些變量對最終解都可能產(chǎn)生實(shí)質(zhì)性的影響 不管實(shí)際數(shù)據(jù)中是否存在不同的類別,利用聚類分析都能得到分成若干類別的解,,下面以對觀測值聚類即Q型聚類為例 演示用spss進(jìn)行聚類分析的具體步驟: 對一個班的數(shù)學(xué)水平進(jìn)行聚類,,Q型聚類,對樣本也就是觀察個案的聚類,單擊“方法”按鈕彈出對話框,下拉框指定的是小類之間的距離計(jì)算方法7種供用戶選擇,,度量標(biāo)準(zhǔn) 計(jì)算樣本距離的方法,點(diǎn)擊“繼續(xù)”接下來指定SPSS分析圖形輸出,,屬性圖以樹的形式展現(xiàn)聚類分析的每一次合并過程。冰柱圖通過表格中的冰柱顯示。 可以指定并主圖的輸出方向,縱向和橫向,顯示凝聚狀態(tài)表,單擊“統(tǒng)計(jì)量”,,,單一方案:輸入一個具體數(shù)值n,n小于樣本總數(shù),表示僅顯示聚類成n類時,個各類的成員構(gòu)成 方案范圍:指定顯示聚成n1類到n2類時,個各類的成員構(gòu)成。,設(shè)定保存層次聚類分析的結(jié)果,無,是指不保存到編輯窗口中。,,結(jié)果與討論,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- SPSS 聚類分析 具體操作 步驟
鏈接地址:http://m.appdesigncorp.com/p-2991618.html