《外語教學(xué)與研究統(tǒng)計(jì)方法.ppt》由會員分享,可在線閱讀,更多相關(guān)《外語教學(xué)與研究統(tǒng)計(jì)方法.ppt(40頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、外語教學(xué)與研究統(tǒng)計(jì)方法,為什么要學(xué)習(xí)統(tǒng)計(jì)方法?,1. 統(tǒng)計(jì)方法給我們一種看問題的視角、分析問題的手段,使我們可以從數(shù)量的角度,分析和認(rèn)識現(xiàn)象的特點(diǎn)、規(guī)律、模式、趨勢或關(guān)系。 2. 統(tǒng)計(jì)方法給我們一種精確測量的手段。例如對于“水平高”的概念,我們可以用數(shù)學(xué)計(jì)量的手段給予更精確的描述。 3. 可以使我們對現(xiàn)象的數(shù)量表現(xiàn),做出更科學(xué)的判斷。 4. 增強(qiáng)研究的自主性。數(shù)據(jù)收集的過程是自主的,對數(shù)據(jù)的處理和分析是原創(chuàng)的,得出的結(jié)論大大避免了抄襲的危險。,第一講 基本概念1. 數(shù)據(jù)類型:定類數(shù)據(jù)與定距數(shù)據(jù)2. 總體與樣本3. 誤差:抽樣誤差與非抽樣誤差4. 顯著性與顯著水平,1. 不同的數(shù)據(jù)需要采用不同的
2、統(tǒng)計(jì)方法; 2. 人們一般研究的都是樣本; 3. 統(tǒng)計(jì)中誤差無所不在; 4. 顯著性反映的是研究結(jié)論的確定性。,數(shù)據(jù)類型之:定類數(shù)據(jù) 定類數(shù)據(jù)是一種分類數(shù)據(jù)。它是對觀測對象按不同特性分類,并統(tǒng)計(jì)各類出現(xiàn)的次數(shù)(頻數(shù))后得到的結(jié)果。,例如可以按性別、班級、課程等進(jìn)行分類統(tǒng)計(jì)。定類測量中的類沒有大小之分,只有頻數(shù)高低。不能在類之間進(jìn)行數(shù)學(xué)運(yùn)算。,數(shù)據(jù)類型之:定距數(shù)據(jù) 定距數(shù)據(jù)是對測量對象按一定尺度測量后得出的數(shù)值。所用測量尺度有恒定的單位,單位之間的距離是相等的。,例如對成績、年齡等的測量通常得到的是定距數(shù)據(jù)。人們可以對定距數(shù)據(jù)進(jìn)行數(shù)學(xué)運(yùn)算,比較不同數(shù)值之間的大小。,總體總體指具有相同特征或
3、者性質(zhì)的所有個體之和??傮w可大可小。例如二語學(xué)習(xí)者是大總體,某校一年級新生則是小總體。,樣本 樣本指從總體中選取的一部分個體。由于常常不能直接研究總體,所以人們常常通過樣本來推斷總體。 樣本有隨機(jī)樣本和非隨機(jī)樣本之分。,抽樣誤差抽樣誤差是客觀存在。只要從總體中抽取樣本,就會存在抽樣誤差。,從一個總體中抽取的樣本均值與總體均值之間多數(shù)存在差異。 從一個總體中抽取的不同樣本均值之間也多數(shù)存在差異。 為了減少抽樣誤差,最好用隨機(jī)抽取的大樣本。,,Mean=28,Mean1=25,Mean2=30,非抽樣誤差非抽樣誤差是由于技術(shù)上原因,如測量工具不準(zhǔn),或是人為操作造成的誤差。,比較典型的非抽樣誤差是考
4、試分?jǐn)?shù)合計(jì)錯誤,或者是數(shù)據(jù)錄入失誤。 避免非抽樣誤差的方法是仔細(xì)測量和認(rèn)真錄入與核對。,顯著性顯著性的概念涉及統(tǒng)計(jì)分析結(jié)果的可靠性。顯著性檢驗(yàn)用于驗(yàn)證統(tǒng)計(jì)結(jié)果是自然存在的還是由偶然因素如誤差造成的。,顯著性水平 顯著性水平是衡量顯著性的標(biāo)準(zhǔn)。在社會科學(xué)和應(yīng)用語言學(xué)研究中,通常設(shè)定的顯著水平為p=0.05。 大于0.05的統(tǒng)計(jì)結(jié)果,通常說無顯著差異,或無顯著相關(guān)。 等于/小于0.05的統(tǒng)計(jì)結(jié)果,通常說有顯著差異,或顯著相關(guān)。,描述統(tǒng)計(jì),平均值、標(biāo)準(zhǔn)差、交互表、頻數(shù)表,平均值:所有個值之和除以個值的數(shù)目。總體均值用表示,樣本均值用表示。,70個學(xué)生的四級平均成績,標(biāo)準(zhǔn)差:是數(shù)據(jù)內(nèi)部差異的一種量度。
5、標(biāo)準(zhǔn)差越大,內(nèi)部差異也越大。例:兩個班期末考試平均分相等,甲班的標(biāo)準(zhǔn)差為5分,乙班的標(biāo)準(zhǔn)差為10分,說明乙班的內(nèi)部差異大于甲班。,70個學(xué)生四級成績的標(biāo)準(zhǔn)差,Empirical Rule1 經(jīng)驗(yàn)法則1,正態(tài)分布的數(shù)據(jù) -1 +1 大約68的數(shù)值在均值的一個標(biāo)準(zhǔn)差范圍內(nèi),,,,,Empirical Rule2,正態(tài)分布的數(shù)據(jù) -2 +2 大約95的數(shù)值在均值的2個標(biāo)準(zhǔn)差范圍內(nèi)。,,,,,Empirical Rule3,正態(tài)分布的數(shù)據(jù) -3 +3 幾乎全部(99.7)數(shù)值在3個標(biāo)準(zhǔn)差范圍內(nèi)。,,,,,大學(xué)英語四級考試成績分布,均值:50
6、0 標(biāo)準(zhǔn)差:70 430 500 570 大約68的四級考試分?jǐn)?shù)在430到570之間。,,,,,大學(xué)英語四級考試成績分布2,360 500 640 大約95的考試分?jǐn)?shù)在360到640之間。,,,,,英語四級考試成績分布,290 500 710 幾乎全部(99.7)數(shù)值在290到710之間。,,,,,交互表交互表是對定類數(shù)據(jù)的一種歸納和表現(xiàn)形式。交互表根據(jù)行數(shù)和列數(shù),分別有2x2表, 2x3表,或者j x k表。,,頻數(shù)表一種頻數(shù)表是簡單羅列數(shù)據(jù)中每個數(shù)值出現(xiàn)的次數(shù);另一種頻數(shù)表是按一定的區(qū)間,分組統(tǒng)計(jì)和羅列數(shù)值出現(xiàn)的次數(shù)。,,推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)主要根據(jù)概率理論,利用
7、各種分布模型,進(jìn)行組之間、變量之間的差異或相關(guān)的顯著性檢驗(yàn)。,推斷統(tǒng)計(jì)主要回答的問題是: 1)不同組或不同變量的均值之間存在的差異是否顯著? 2)兩個變量之間的相關(guān)關(guān)系是否顯著?,常用的差異檢驗(yàn)方法1)獨(dú)立樣本的t檢驗(yàn)2)成對樣本的t檢驗(yàn)3)一元方差分析4)卡方檢驗(yàn),一般情況下: 1)如果數(shù)據(jù)是定距數(shù)據(jù),根據(jù)數(shù)據(jù)情況,分別采用前三種方法; 2)如果數(shù)據(jù)是定類數(shù)據(jù),采用卡方檢驗(yàn)的方法。,獨(dú)立樣本t檢驗(yàn)(independent sample t-test)獨(dú)立樣本t檢驗(yàn)用于檢驗(yàn)同一個變量下的兩組數(shù)值之間是否存在顯著差異。,應(yīng)用的研究問題: 1)一次考試中的兩個班的成績是否存在顯著性差異? 2)一次
8、考試中的男女生的成績是否存在顯著性差異?,獨(dú)立樣本t檢驗(yàn)要看計(jì)算出的t值和對應(yīng)的sig.值,或者說顯著性水平。如果sig.值大于0.05,兩組之間沒有顯著差異,如果sig.值小于0.05,兩組之間存在顯著差異。在報告時,要報告t值和sig.值。,例:獨(dú)立樣本t檢驗(yàn)的結(jié)果顯示,多媒體教學(xué)實(shí)驗(yàn)班和常規(guī)教學(xué)班(對照班)的英語水平不存在顯著性差異(t=1.11, p0.05)。也就是說,多媒體教學(xué)并沒有帶來比常規(guī)教學(xué)更好的教學(xué)效果。,成對樣本的t檢驗(yàn)(paired sample t-test)成對樣本的t檢驗(yàn)用于檢驗(yàn)就同一個變量對同一組對象兩次收集的數(shù)據(jù)之間是否存在顯著差異。,應(yīng)用的研究問題: 1)某
9、年級學(xué)生進(jìn)校時英語水平和現(xiàn)在英語水平之間是否存在顯著差異? 2)某級學(xué)生經(jīng)過一年的學(xué)習(xí)后,學(xué)習(xí)動機(jī)是否發(fā)生了改變?,成對樣本t檢驗(yàn)也看計(jì)算出的t值和對應(yīng)的sig.值,或者說顯著性水平。如果sig.值大于0.05,成對樣本沒有顯著差異,如果sig.值小于0.05,樣本之間存在顯著差異。在報告時,要報告t值和sig.值。,例:成對樣本t檢驗(yàn)的結(jié)果顯示,某年級新生進(jìn)校后經(jīng)過一段時間的學(xué)習(xí),成績有了顯著提高,第二次考試成績顯著高于進(jìn)校時的成績(t=3.12, p<0.05)。,方差檢驗(yàn)(F檢驗(yàn))(F-test)方差檢驗(yàn)用于檢驗(yàn)一個變量下的三組之間是否存在顯著性差異。,例1:研究問題:三種詞匯學(xué)習(xí)方法的
10、效果是否有顯著差異? 方法1:有意學(xué)習(xí) 方法2:附帶學(xué)習(xí) 方法3:附帶學(xué)習(xí)+有意注意 例2:研究問題:三種詞匯教學(xué)方法的效果是否有顯著差異? 方法1:詞表法 方法2:閱讀法 方法3:寫作法,方差分析要看計(jì)算出的F值和對應(yīng)的sig.值,或者說顯著性水平。如果sig.值大于0.05,說明各組間沒有顯著差異,如果sig.值小于0.05,至少兩組之間存在顯著差異。在報告時,要報告F值和sig.值。,例:研究問題:三種不同的詞匯學(xué)習(xí)方法對詞匯學(xué)習(xí)是否有不同的效果? 對詞匯考試數(shù)據(jù)的方差分析顯示,三種方法對詞匯學(xué)習(xí)有不同的效果(F=12, p<0.05)。,方差分析的后檢驗(yàn)(post hoc test),
11、如果要檢驗(yàn)?zāi)莾山M之間存在顯著性差異,可以 1)每兩組之間做獨(dú)立樣本的t檢驗(yàn); 2)做方差分析的后檢驗(yàn),看那兩組之間存在差異。,相關(guān)分析(correlation test)相關(guān)分析考察兩個變量之間是否存在一定的關(guān)系;如果是,這種關(guān)系有多強(qiáng);而且要檢驗(yàn)這種關(guān)系是否具有顯著性。,例如: 1)學(xué)習(xí)者二語詞匯水平與閱讀理解水平的關(guān)系? 2)學(xué)習(xí)者二語詞塊知識與二語水平的關(guān)系? 3)學(xué)習(xí)者二語學(xué)習(xí)動機(jī)與二語水平之間的關(guān)系?,相關(guān)分析要看計(jì)算出的r值和對應(yīng)的sig.值。如果sig.值大于0.05,說明變量之間沒有顯著相關(guān);如果sig.值小于0.05,說明變量之間存在顯著相關(guān)。在報告時,要報告r值和sig.值
12、。,例:經(jīng)過統(tǒng)計(jì),我們發(fā)現(xiàn)搭配能力與語言能力中度相關(guān)。其中, 搭配能力與閱讀能力相關(guān)系數(shù)為.47,顯著性達(dá)到p < .001; 搭配能力與寫作能力的相關(guān)系數(shù)為.514,顯著性達(dá)到p< .001;搭配能力與聽力的相關(guān)系數(shù)為.443,顯著性也達(dá)到p < .001;搭配能力成績與三項(xiàng)成績總和的相關(guān)系數(shù)為.545,顯著性達(dá)到p < .001。(黃強(qiáng),2002),卡方檢驗(yàn)卡方檢驗(yàn)應(yīng)用于定類數(shù)據(jù)。1)對單向(單行、單列)分類數(shù)據(jù)的分析;2)對多向(多行、多列)分類數(shù)據(jù)的分析。,單向分類數(shù)據(jù) 多向分類數(shù)據(jù),卡方檢驗(yàn)用于單向分類數(shù)據(jù)的檢驗(yàn),單向分類數(shù)據(jù)的卡方檢驗(yàn)要回答的問題是:“觀察數(shù)據(jù)的分布是否符合某個期望
13、分布?” 例如: 1)學(xué)生考試成績的分布是否符合均等分布? 或者:各類成績的學(xué)生人數(shù)是否相等? 2)學(xué)生考試成績的分布是否符合正態(tài)分布? 檢驗(yàn)假設(shè)是: 1)學(xué)生考試成績的分布符合均等分布。 或者:各類成績的學(xué)生人數(shù)相等。 2)學(xué)生考試成績的分布符合正態(tài)分布。,卡方檢驗(yàn)用于多向分類數(shù)據(jù)的檢驗(yàn),多向分類數(shù)據(jù)的卡方檢驗(yàn)要回答的問題是:“兩個因素之間是否相互獨(dú)立,或者說不存在任何關(guān)系?” 例如: 1)教齡與對影響學(xué)習(xí)效果因素的看法是否有關(guān)? 檢驗(yàn)假設(shè)是: 1)教齡與看法無關(guān)。,卡方檢驗(yàn)要看計(jì)算出的卡方值和對應(yīng)的sig.值。如果sig.值大于0.05,說明因素之間沒有顯著關(guān)系;如果sig.值小于0.05,說明因素之間存在顯著關(guān)系。在報告時,要報告卡方值和sig.值。,1) 學(xué)生考試成績符合均等分布,即各類成績的學(xué)生人數(shù)是相同的(卡方值=8.783, p=0.0670.05)。 2) 教齡與對影響學(xué)習(xí)效果的因素的看法之間有關(guān)系(卡方值=23.25, p=.000 <0.05)。,,,,,