SPSS數(shù)據(jù)分析教程-12因子分析.ppt
SPSS數(shù)據(jù)分析教程,SPSS數(shù)據(jù)分析教程,第12章 因子分析,目錄,12.1 因子分析簡介 12.2 因子分析法的統(tǒng)計理論 12.2.1 因子分析的模型 12.2.2 因子分析模型的求解方法 12.2.3 因子分析的應(yīng)用前提 12.2.4 因子個數(shù)的確定 12.2.5 因子的解釋 12.2.6 因子旋轉(zhuǎn) 12.2.7 因子得分 12.3 因子分析案例 12.3.1 探索變量間的結(jié)構(gòu)關(guān)系 12.3.2 因子分析在市場調(diào)查中的應(yīng)用 12.4 因子分析結(jié)果的有效性 12.5 因子分析和主成分分析的比較,本章要求,了解因子分析模型的基本理論; 了解因子分析法的應(yīng)用條件 因子分析模型的求解方法; 掌握因子分析法的應(yīng)用; 掌握因子分析法輸出結(jié)果的解釋; 了解因子旋轉(zhuǎn)的方法。,12.1 因子分析簡介,有時侯,我們要考察的指標(biāo)是無法直接測量的。比如考察學(xué)生的學(xué)習(xí)能力,可以直接測試的指標(biāo)有數(shù)學(xué)、語文、物理等科目的考試成績,但是一些抽象的指標(biāo),譬如運(yùn)算能力、表達(dá)能力則無法通過直接測試的方法得到,然而這些抽象指標(biāo)卻體現(xiàn)在上述可以測試的指標(biāo)之中。因子分析法就是研究如何來表達(dá)這兩類不同性質(zhì)的指標(biāo)之間的關(guān)系的。,因子分析是一種數(shù)據(jù)降維方法,因子分析試圖用最少個數(shù)的不可觀測的互不相關(guān)的公共因子(例如運(yùn)算能力、表達(dá)能力等公共因子)的線性組合,再加上特殊因子來描述原來一組可觀測的有相互關(guān)系的變量。其目的是盡可能合理地解釋存在于原始變量之間的相關(guān)性,并且簡化變量的維數(shù)和結(jié)構(gòu)。,因子分析的分類,因子分析既可以對變量作因子分析,也可以對樣品作因子分析。前者稱為R型因子分析,后者稱為Q型因子分析。 根據(jù)原始變量之間是否有先驗的關(guān)系結(jié)構(gòu),因子分析法又可以分為探索性因子分析和驗證性因子分析。探索性因子分析事前沒有原始變量之間、原始變量和因子之間以及因子之間關(guān)系的先驗知識,而驗證性因子分析事前給出原始變量和因子的結(jié)構(gòu)關(guān)系。,12.2 因子分析的統(tǒng)計理論,因子分析假設(shè)每一個原始變量都可以表示成不可觀測的公共因子的線性組合和一個特殊因子之和。,因子分析模型(1),這里q為公共因子的個數(shù) ,F(xiàn)1,,Fq表示公共因子 , 也可以表示為下列矩陣形式: (1) 其中,A稱為載荷矩陣,因子分析模型(2),因子分析模型要求方程(1)滿足下列條件: qp:公共因子的個數(shù)不大于原始變量的個 數(shù) 公共因子和特殊因子是不相關(guān)的,即: 公共因子F1,Fq不相關(guān)且方差為1 各個特殊因子不相關(guān),但是方差不要求相等。,因子分析結(jié)果解釋,因子載荷的意義 在因子上的因子載荷實際上是原始變量和公共因子的相關(guān)系數(shù)。它們的大小反映了原始變量對公共因子的重要性。 變量共同度 它反映了公共因子對原始變量的影響程度 公共因子的方差貢獻(xiàn) 它衡量公共因子的重要性。,因子分析模型的求解方法 (1),SPSS中給出了7種求解因子分析模型的方法 主成分 未加權(quán)的最小平方法 綜合最小平方法 最大似然(K) 主軸因子分解 因子分解 映像因子分解法。,因子分析模型的求解方法(2),這7種求解因子分析模型的方法都可以基于相關(guān)系數(shù)矩陣 。 主成分、主軸因子分解和映像因子分解 3種方法既可以基于相關(guān)系數(shù)矩陣,也可以基于協(xié)方差矩陣。,因子分析的應(yīng)用前提,因子分析的主要目的是數(shù)據(jù)降維,如果原始變量之間沒有相關(guān)性,因子分析的意義不大。 判斷原始變量之間是否有相關(guān)性。判斷的方法為Bartlett球形檢驗和KMO方法。 經(jīng)驗上,因子分析方法要求個案個數(shù)是變量個數(shù)的10到25倍。如果個案個數(shù)相對于變量個數(shù)而言較少,那么考慮用主成分法來替代。 建議如果變量中有分類變量,那么分類變量的可取值個數(shù)要不小于5。,因子個數(shù)的確定,有3個方法可以用來確定因子的個數(shù) 方差貢獻(xiàn)率 設(shè)定特征值條件 碎石圖,因子旋轉(zhuǎn),當(dāng)因子分析模型得到的公共因子沒有較好的解釋時,一般可以對因子進(jìn)行旋轉(zhuǎn)以得到原始變量和公共因子之間關(guān)系的較好解釋。 因子旋轉(zhuǎn)分為正交旋轉(zhuǎn)和非正交旋轉(zhuǎn)。在正交旋轉(zhuǎn)下,特殊因子的協(xié)方差、公共因子的協(xié)方差都不變,因此旋轉(zhuǎn)之后的因子仍然是不相關(guān)的。,正交旋轉(zhuǎn),SPSS提供了3種正交旋轉(zhuǎn)的方法,它們是 最大四次方值法(Q: Quartmax Rotaiton) 最大方差法(V:Kaisers Varimax Rotation 最大平衡值法(E: Equamax) 這三種方法的目的都是簡化因子載荷矩陣,使得某些元素為0或者接近于0。并且這三種方法的坐標(biāo)軸都是正交的,旋轉(zhuǎn)后的公共因子仍然是相互無關(guān)的。,因子得分,因子分析中各個變量的公共因子取值稱為因子得分。從因子分析模型知道,原始變量是公共因子的線性組合和特殊因子之和。 SPSS提供了三種估計因子得分的方法,它們是Thomson回歸法、Bartlett法和Anderson-Rubin法。,因子分析案例,SPSS因子分析的菜單是【分析】【降維】【因子分析】,案例1:探索變量間的結(jié)構(gòu)關(guān)系,直接從相關(guān)系數(shù)矩陣或者協(xié)方差矩陣開始,用語法命令的方式來進(jìn)行因子分析。 為了分析(英格蘭)蓋爾語、英語、歷史、算術(shù)、幾何和代數(shù)6門學(xué)科之間的相互關(guān)系,Lawley和Maxwell調(diào)查了220名男學(xué)生的6門學(xué)科的成績,并記錄下它們的相關(guān)系數(shù)矩陣,輸入數(shù)據(jù),MATRIX DATA variables=ROWTYPE_ Gaelic English History Arithmeti Algebra Geometry. begin data. N 220 220 220 220 220 220 SD 1 1 1 1 1 1 CORR 1.00 CORR 0.439 1.00 CORR 0.410 0.351 1.00 CORR 0.288 0.354 0.164 1.0 CORR 0.329 0.320 0.190 0.595 1.00 CORR 0.248 0.329 0.181 0.470 0.464 1.00 END data.,結(jié)果分析(1):相關(guān)系數(shù)矩陣,KMO和Bartlett檢驗,特征值、方差貢獻(xiàn)率和累積方差貢獻(xiàn)率,初始因子載荷矩陣,旋轉(zhuǎn)因子載荷矩陣,碎石圖,因子載荷圖,案例2:因子分析在市場調(diào)查中的應(yīng)用,數(shù)據(jù)文件cereals.sav 某市場調(diào)查項目需要了解消費(fèi)者是否偏愛某個谷物品牌?,F(xiàn)有117個受訪者對12個銷量比較好的谷物產(chǎn)品的25個屬性進(jìn)行評分?,F(xiàn)在用因子分析法對消費(fèi)者的偏好習(xí)慣進(jìn)行分析。哪些品牌的谷物產(chǎn)品易受消費(fèi)者青睞?消費(fèi)者喜歡哪些屬性?這些屬性之間有什么關(guān)系?,因子分析選項設(shè)置(1),因子分析選項設(shè)置(2),如果因子分析的結(jié)果輸出錯誤信息“解不收斂”,可以考慮更改 “最大收斂性迭代次數(shù)”為一個較大的值,然后重新進(jìn)行因子分析。,因子分析選項設(shè)置(3),因子分析結(jié)果(1),因子分析結(jié)果(2),因子分析結(jié)果(3),旋轉(zhuǎn)后的因子載荷矩陣,因子的解釋,第一個因子上載荷較大的原始變量有Fibre、Nutritious、Health、Natural、Regular、Filling、Quality、Energy和Satisfying,所有這些變量都描述了谷物產(chǎn)品的自然健康屬性,我們稱之為“健康因子”。 第二個因子上載荷較大的原始變量有Sugar、Salt、Calories、Sweet和Process,所有這些都是谷物產(chǎn)品的人工添加成分所體現(xiàn)的屬性,稱為“人工成分因子”。 第三個因子上載荷較大的原始變量有Kids、Family和Fun,稱為“群體因子”。,前兩個主成分的因子載荷圖,產(chǎn)品在前兩個公共因子上的定位圖,作業(yè),