因子分析方法.doc
《因子分析方法.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《因子分析方法.doc(4頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
因子分析法 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測(cè)的,即不是具體的變量),以較少的幾個(gè)因子反映原資料的大部分信息。運(yùn)用這種研究技術(shù),我們可以方便地找出影響消費(fèi)者購(gòu)買、消費(fèi)以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運(yùn)用這種研究技術(shù),我們還可以為市場(chǎng)細(xì)分做前期分析。 因子分析法與其他一些多元統(tǒng)計(jì)方法的區(qū)別: 2.主成分分析 主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,了解數(shù)據(jù)。(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無解,這時(shí)候可以使用主成份發(fā)對(duì)變量簡(jiǎn)化。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。 1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合。 2、主成分分析的重點(diǎn)在于解釋各變量的總方差,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。 3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子(specific factor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。 4、主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,可以旋轉(zhuǎn)得到不同的因子。 5、在因子分析中,因子個(gè)數(shù)需要分析者指定(spss根據(jù)一定的條件自動(dòng)設(shè)定,只要是特征值大于1的因子進(jìn)入分析),而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢(shì)。大致說來,當(dāng)需要尋找潛在的因子,并對(duì)這些因子進(jìn)行解釋的時(shí)候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾乎帶有原來所有變量的信息)來進(jìn)入后續(xù)的分析,則可以使用主成分分析。當(dāng)然,這種情況也可以使用因子得分做到。所以這種區(qū)分不是絕對(duì)的。 總得來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,了解數(shù)據(jù)。(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無解,這時(shí)候可以使用主成份發(fā)對(duì)變量簡(jiǎn)化。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。 在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對(duì)角元素不在是變量的方差,而是和變量對(duì)應(yīng)的共同度(變量方差中被各因子所解釋的部分)。 3.聚類分析(Cluster Analysis) 聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類的分析技術(shù) 。 在市場(chǎng)研究領(lǐng)域,聚類分析主要應(yīng)用方面是幫助我們尋找目標(biāo)消費(fèi)群體,運(yùn)用這項(xiàng)研究技術(shù),我們可以劃分出產(chǎn)品的細(xì)分市場(chǎng),并且可以描述出各細(xì)分市場(chǎng)的人群特征,以便于客戶可以有針對(duì)性的對(duì)目標(biāo)消費(fèi)群體施加影響,合理地開展工作。 4.判別分析(Discriminatory Analysis) 判別分析(Discriminatory Analysis)的任務(wù)是根據(jù)已掌握的1批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯(cuò)判的事例最少,進(jìn)而對(duì)給定的1個(gè)新樣品,判斷它來自哪個(gè)總體。根據(jù)資料的性質(zhì),分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準(zhǔn)則,又有費(fèi)歇、貝葉斯、距離等判別方法。 費(fèi)歇(FISHER)判別思想是投影,使多維問題簡(jiǎn)化為一維問題來處理。選擇一個(gè)適當(dāng)?shù)耐队拜S,使所有的樣品點(diǎn)都投影到這個(gè)軸上得到一個(gè)投影值。對(duì)這個(gè)投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(BAYES)判別思想是根據(jù)先驗(yàn)概率求出后驗(yàn)概率,并依據(jù)后驗(yàn)概率分布作出統(tǒng)計(jì)推斷。所謂先驗(yàn)概率,就是用概率來描述人們事先對(duì)所研究的對(duì)象的認(rèn)識(shí)的程度;所謂后驗(yàn)概率,就是根據(jù)具體資料、先驗(yàn)概率、特定的判別規(guī)則所計(jì)算出來的概率。它是對(duì)先驗(yàn)概率修正后的結(jié)果。 距離判別思想是根據(jù)各樣品與各母體之間的距離遠(yuǎn)近作出判別。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,將各樣品數(shù)據(jù)逐一代入計(jì)算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個(gè)母體。 5.對(duì)應(yīng)分析(Correspondence Analysis) 對(duì)應(yīng)分析是一種用來研究變量與變量之間聯(lián)系緊密程度的研究技術(shù)。 運(yùn)用這種研究技術(shù),我們可以獲取有關(guān)消費(fèi)者對(duì)產(chǎn)品品牌定位方面的圖形,從而幫助您及時(shí)調(diào)整營(yíng)銷策略,以便使產(chǎn)品品牌在消費(fèi)者中能樹立起正確的形象。 這種研究技術(shù)還可以用于檢驗(yàn)廣告或市場(chǎng)推廣活動(dòng)的效果,我們可以通過對(duì)比廣告播出前或市場(chǎng)推廣活動(dòng)前與廣告播出后或市場(chǎng)推廣活動(dòng)后消費(fèi)者對(duì)產(chǎn)品的不同認(rèn)知圖來看出廣告或市場(chǎng)推廣活動(dòng)是否成功的向消費(fèi)者傳達(dá)了需要傳達(dá)的信息。 6.典型相關(guān)分析 典型相關(guān)分析是分析兩組隨機(jī)變量間線性密切程度的統(tǒng)計(jì)方法,是兩變量間線性相關(guān)分析的拓廣。各組隨機(jī)變量中既可有定量隨機(jī)變量,也可有定性隨機(jī)變量(分析時(shí)須F6說明為定性變量)。本法還可以用于分析高維列聯(lián)表各邊際變量的線性關(guān)系。 注意: 1.嚴(yán)格地說,一個(gè)典型相關(guān)系數(shù)描述的只是一對(duì)典型變量之間的相關(guān),而不是兩個(gè)變量組之間的相關(guān)。而各對(duì)典型變量之間構(gòu)成的多維典型相關(guān)才共同揭示了兩個(gè)觀測(cè)變量組之間的相關(guān)形式。 2.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求 要求兩組變量之間為線性關(guān)系,即每對(duì)典型變量之間為線性關(guān)系; 每個(gè)典型變量與本組所有觀測(cè)變量的關(guān)系也是線性關(guān)系。如果不是線性關(guān)系,可先線性化:如經(jīng)濟(jì)水平和收入水平與其他一些社會(huì)發(fā)展水之間并不是線性關(guān)系,可先取對(duì)數(shù)。即log經(jīng)濟(jì)水平,log收入水平。 3.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求 所有觀測(cè)變量為定量數(shù)據(jù)。同時(shí)也可將定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后,再放入典型相關(guān)模型中進(jìn)行分析。 7.多維尺度分析(Multi-dimension Analysis) 多維尺度分析(Multi-dimension Analysis) 是市場(chǎng)研究的一種有力手段,它可以通過低維空間(通常是二維空間)展示多個(gè)研究對(duì)象(比如品牌)之間的聯(lián)系,利用平面距離來反映研究對(duì)象之間的相似程度。由于多維尺度分析法通常是基于研究對(duì)象之間的相似性(距離)的,只要獲得了兩個(gè)研究對(duì)象之間的距離矩陣,我們就可以通過相應(yīng)統(tǒng)計(jì)軟件做出他們的相似性知覺圖。 在實(shí)際應(yīng)用中,距離矩陣的獲得主要有兩種方法:一種是采用直接的相似性評(píng)價(jià),先所有評(píng)價(jià)對(duì)象進(jìn)行兩兩組合,然后要求被訪者所有的這些組合間進(jìn)行直接相似性評(píng)價(jià),這種方法我們稱之為直接評(píng)價(jià)法;另一種為間接評(píng)價(jià)法,由研究人員根據(jù)事先經(jīng)驗(yàn),找出影響人們?cè)u(píng)價(jià)研究對(duì)象相似性的主要屬性,然后對(duì)每個(gè)研究對(duì)象,讓被訪者對(duì)這些屬性進(jìn)行逐一評(píng)價(jià),最后將所有屬性作為多維空間的坐標(biāo),通過距離變換計(jì)算對(duì)象之間的距離。 多維尺度分析的主要思路是利用對(duì)被訪者對(duì)研究對(duì)象的分組,來反映被訪者對(duì)研究對(duì)象相似性的感知,這種方法具有一定直觀合理性。同時(shí)該方法實(shí)施方便,調(diào)查中被訪者負(fù)擔(dān)較小,很容易得到理解接受。當(dāng)然,該方法的不足之處是犧牲了個(gè)體距離矩陣,由于每個(gè)被訪者個(gè)體的距離矩陣只包含1與0兩種取值,相對(duì)較為粗糙,個(gè)體距離矩陣的分析顯得比較勉強(qiáng)。但這一點(diǎn)是完全可以接受的,因?yàn)閷?duì)大多數(shù)研究而言,我們并不需要知道每一個(gè)體的空間知覺圖。 多元統(tǒng)計(jì)分析是統(tǒng)計(jì)學(xué)中內(nèi)容十分豐富、應(yīng)用范圍極為廣泛的一個(gè)分支。在自然科學(xué)和社會(huì)科學(xué)的許多學(xué)科中,研究者都有可能需要分析處理有多個(gè)變量的數(shù)據(jù)的問題。能否從表面上看起來雜亂無章的數(shù)據(jù)中發(fā)現(xiàn)和提煉出規(guī)律性的結(jié)論,不僅對(duì)所研究的專業(yè)領(lǐng)域要有很好的訓(xùn)練,而且要掌握必要的統(tǒng)計(jì)分析工具。對(duì)實(shí)際領(lǐng)域中的研究者和高等院校的研究生來說,要學(xué)習(xí)掌握多元統(tǒng)計(jì)分析的各種模型和方法,手頭有一本好的、有長(zhǎng)久價(jià)值的參考書是非常必要的。這樣一本書應(yīng)該滿足以下條件:首先,它應(yīng)該是“淺入深出”的,也就是說,既可供初學(xué)者入門,又能使有較深基礎(chǔ)的人受益。其次,它應(yīng)該是既側(cè)重于應(yīng)用,又兼顧必要的推理論證,使學(xué)習(xí)者既能學(xué)到“如何”做,而且在一定程度上了解“為什么”這樣做。最后,它應(yīng)該是內(nèi)涵豐富、全面的,不僅要基本包括各種在實(shí)際中常用的多元統(tǒng)計(jì)分析方法,而且還要對(duì)現(xiàn)代統(tǒng)計(jì)學(xué)的最新思想和進(jìn)展有所介紹、交代。 因子分析的核心問題有兩個(gè): 一是如何構(gòu)造因子變量;二是如何對(duì)因子變量進(jìn)行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個(gè)核心問題展開的。 ?。╥)因子分析常常有以下四個(gè)基本步驟: ?。?)確認(rèn)待分析的原變量是否適合作因子分析。 ?。?)構(gòu)造因子變量。 ?。?)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。 ?。?)計(jì)算因子變量得分。 ?。╥i)因子分析的計(jì)算過程: ?。?)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級(jí)和量綱上的不同。 ?。?)求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣; ?。?)求相關(guān)矩陣的特征值和特征向量; ?。?)計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率; ?。?)確定因子: 設(shè)F1,F(xiàn)2,…, Fp為p個(gè)因子,其中前m個(gè)因子包含的數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于80%時(shí),可取前m個(gè)因子來反映原評(píng)價(jià)指標(biāo); (6)因子旋轉(zhuǎn): 若所得的m個(gè)因子無法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。 ?。?)用原指標(biāo)的線性組合來求各因子得分: 采用回歸估計(jì)法,Bartlett估計(jì)法或Thomson估計(jì)法計(jì)算因子得分。 ?。?)綜合得分 以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。 F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm ) 此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻(xiàn)率。 ?。?)得分排序:利用綜合得分可以得到得分名次。 在采用多元統(tǒng)計(jì)分析技術(shù)進(jìn)行數(shù)據(jù)處理、建立宏觀或微觀系統(tǒng)模型時(shí),需要研究以下幾個(gè)方面的問題: 簡(jiǎn)化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核??刹捎弥鞒煞址治?、因子分析、對(duì)應(yīng)分析等方法,在眾多因素中找出各個(gè)變量最佳的子集合,從子集合所包含的信息描述多變量的系統(tǒng)結(jié)果及各個(gè)因子對(duì)系統(tǒng)的影響?!皬臉淠究瓷帧保プ≈饕?,把握主要矛盾的主要方面,舍棄次要因素,以簡(jiǎn)化系統(tǒng)的結(jié)構(gòu),認(rèn)識(shí)系統(tǒng)的內(nèi)核。 構(gòu)造預(yù)測(cè)模型,進(jìn)行預(yù)報(bào)控制。在自然和社會(huì)科學(xué)領(lǐng)域的科研與生產(chǎn)中,探索多變量系統(tǒng)運(yùn)動(dòng)的客觀規(guī)律及其與外部環(huán)境的關(guān)系,進(jìn)行預(yù)測(cè)預(yù)報(bào),以實(shí)現(xiàn)對(duì)系統(tǒng)的最優(yōu)控制,是應(yīng)用多元統(tǒng)計(jì)分析技術(shù)的主要目的。在多元分析中,用于預(yù)報(bào)控制的模型有兩大類。一類是預(yù)測(cè)預(yù)報(bào)模型,通常采用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術(shù)。另一類是描述性模型,通常采用聚類分析的建模技術(shù)。 進(jìn)行數(shù)值分類,構(gòu)造分類模式。在多變量系統(tǒng)的分析中,往往需要將系統(tǒng)性質(zhì)相似的事物或現(xiàn)象歸為一類。以便找出它們之間的聯(lián)系和內(nèi)在規(guī)律性。過去許多研究多是按單因素進(jìn)行定性處理,以致處理結(jié)果反映不出系統(tǒng)的總的特征。進(jìn)行數(shù)值分類,構(gòu)造分類模式一般采用聚類分析和判別分析技術(shù)。 如何選擇適當(dāng)?shù)姆椒▉斫鉀Q實(shí)際問題,需要對(duì)問題進(jìn)行綜合考慮。對(duì)一個(gè)問題可以綜合運(yùn)用多種統(tǒng)計(jì)方法進(jìn)行分析。例如一個(gè)預(yù)報(bào)模型的建立,可先根據(jù)有關(guān)生物學(xué)、生態(tài)學(xué)原理,確定理論模型和試驗(yàn)設(shè)計(jì);根據(jù)試驗(yàn)結(jié)果,收集試驗(yàn)資料;對(duì)資料進(jìn)行初步提煉;然后應(yīng)用統(tǒng)計(jì)分析方法(如相關(guān)分析、逐步回歸分析、主成分分析等)研究各個(gè)變量之間的相關(guān)性,選擇最佳的變量子集合;在此基礎(chǔ)上構(gòu)造預(yù)報(bào)模型,最后對(duì)模型進(jìn)行診斷和優(yōu)化處理,并應(yīng)用于生產(chǎn)實(shí)際。- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 因子分析 方法
鏈接地址:http://m.appdesigncorp.com/p-6608851.html