方法:因子分析法.doc
《方法:因子分析法.doc》由會員分享,可在線閱讀,更多相關(guān)《方法:因子分析法.doc(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
因子分析基礎(chǔ)理論知識 1 概念 因子分析(Factor analysis):就是用少數(shù)幾個因子來描述許多指標或因素之間的聯(lián)系,以較少幾個因子來反映原資料的大部分信息的統(tǒng)計學分析方法。從數(shù)學角度來看,主成分分析是一種化繁為簡的降維處理技術(shù)。 主成分分析(Principal component analysis):是因子分析的一個特例,是使用最多的因子提取方法。它通過坐標變換手段,將原有的多個相關(guān)變量,做線性變化,轉(zhuǎn)換為另外一組不相關(guān)的變量。選取前面幾個方差最大的主成分,這樣達到了因子分析較少變量個數(shù)的目的,同時又能與較少的變量反映原有變量的絕大部分的信息。 兩者關(guān)系:主成分分析(PCA)和因子分析(FA)是兩種把變量維數(shù)降低以便于描述、理解和分析的方法,而實際上主成分分析可以說是因子分析的一個特例。 2 特點 (1)因子變量的數(shù)量遠少于原有的指標變量的數(shù)量,因而對因子變量的分析能夠減少分析中的工作量。 (2)因子變量不是對原始變量的取舍,而是根據(jù)原始變量的信息進行重新組構(gòu),它能夠反映原有變量大部分的信息。 (3)因子變量之間不存在顯著的線性相關(guān)關(guān)系,對變量的分析比較方便,但原始部分變量之間多存在較顯著的相關(guān)關(guān)系。 (4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。 在保證數(shù)據(jù)信息丟失最少的原則下,對高維變量空間進行降維處理(即通過因子分析或主成分分析)。顯然,在一個低維空間解釋系統(tǒng)要比在高維系統(tǒng)容易的多。 3 類型 根據(jù)研究對象的不同,把因子分析分為R型和Q型兩種。 當研究對象是變量時,屬于R型因子分析; 當研究對象是樣品時,屬于Q型因子分析。 但有的因子分析方法兼有R型和Q型因子分析的一些特點,如因子分析中的對應分析方法,有的學者稱之為雙重型因子分析,以示與其他兩類的區(qū)別。 4分析原理 假定:有n個地理樣本,每個樣本共有p個變量,構(gòu)成一個np階的地理數(shù)據(jù)矩陣 : 當p較大時,在p維空間中考察問題比較麻煩。這就需要進行降維處理,即用較少幾個綜合指標代替原來指標,而且使這些綜合指標既能盡量多地反映原來指標所反映的信息,同時它們之間又是彼此獨立的。 線性組合:記x1,x2,…,xp為原變量指標,z1,z2,…,zm(m≤p)為新變量指標(主成分),則其線性組合為: Lij是原變量在各主成分上的載荷 無論是哪一種因子分析方法,其相應的因子解都不是唯一的,主因子解僅僅是無數(shù)因子解中之一。 zi與zj相互無關(guān); z1是x1,x2,…,xp的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,…的所有線性組合中方差最大者。則,新變量指標z1,z2,…分別稱為原變量指標的第一,第二,…主成分。 Z為因子變量或公共因子,可以理解為在高維空間中互相垂直的m個坐標軸。 主成分分析實質(zhì)就是確定原來變量xj(j=1,2 ,…,p)在各主成分zi(i=1,2,…,m)上的荷載 lij。 從數(shù)學上容易知道,從數(shù)學上也可以證明,它們分別是相關(guān)矩陣的m個較大的特征值所對應的特征向量。 5分析步驟 5.1 確定待分析的原有若干變量是否適合進行因子分析(第一步) 因子分析是從眾多的原始變量中重構(gòu)少數(shù)幾個具有代表意義的因子變量的過程。其潛在的要求:原有變量之間要具有比較強的相關(guān)性。因此,因子分析需要先進行相關(guān)分析,計算原始變量之間的相關(guān)系數(shù)矩陣。如果相關(guān)系數(shù)矩陣在進行統(tǒng)計檢驗時,大部分相關(guān)系數(shù)均小于0.3且未通過檢驗,則這些原始變量就不太適合進行因子分析。 進行原始變量的相關(guān)分析之前,需要對輸入的原始數(shù)據(jù)進行標準化計算(一般采用標準差標準化方法,標準化后的數(shù)據(jù)均值為0,方差為1)。 SPSS在因子分析中還提供了幾種判定是否適合因子分析的檢驗方法。主要有以下3種: 巴特利特球形檢驗(Bartlett Test of Sphericity) 反映象相關(guān)矩陣檢驗(Anti-image correlation matrix) KMO(Kaiser-Meyer-Olkin)檢驗 (1)巴特利特球形檢驗 該檢驗以變量的相關(guān)系數(shù)矩陣作為出發(fā)點,它的零假設H0為相關(guān)系數(shù)矩陣是一個單位陣,即相關(guān)系數(shù)矩陣對角線上的所有元素都為1,而所有非對角線上的元素都為0,也即原始變量兩兩之間不相關(guān)。 巴特利特球形檢驗的統(tǒng)計量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到。如果該值較大,且其對應的相伴概率值小于用戶指定的顯著性水平,那么就應拒絕零假設H0,認為相關(guān)系數(shù)不可能是單位陣,也即原始變量間存在相關(guān)性。 (2)反映象相關(guān)矩陣檢驗 該檢驗以變量的偏相關(guān)系數(shù)矩陣作為出發(fā)點,將偏相關(guān)系數(shù)矩陣的每個元素取反,得到反映象相關(guān)矩陣。 偏相關(guān)系數(shù)是在控制了其他變量影響的條件下計算出來的相關(guān)系數(shù),如果變量之間存在較多的重疊影響,那么偏相關(guān)系數(shù)就會較小,這些變量越適合進行因子分析。 (3)KMO(Kaiser-Meyer-Olkin)檢驗 該檢驗的統(tǒng)計量用于比較變量之間的簡單相關(guān)和偏相關(guān)系數(shù)。 KMO值介于0-1,越接近1,表明所有變量之間簡單相關(guān)系數(shù)平方和遠大于偏相關(guān)系數(shù)平方和,越適合因子分析。 其中,Kaiser給出一個KMO檢驗標準:KMO>0.9,非常適合;0.8- 1.請仔細閱讀文檔,確保文檔完整性,對于不預覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 方法 因子分析
鏈接地址:http://m.appdesigncorp.com/p-6651309.html