《《醫(yī)學(xué)統(tǒng)計學(xué) 緒論》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《醫(yī)學(xué)統(tǒng)計學(xué) 緒論》PPT課件.ppt(66頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、醫(yī)學(xué)統(tǒng)計學(xué),第一章 緒論,統(tǒng)計學(xué)與醫(yī)學(xué)統(tǒng)計學(xué) 醫(yī)學(xué)統(tǒng)計學(xué)的內(nèi)容 醫(yī)學(xué)研究的三個步驟 三類資料 醫(yī)學(xué)統(tǒng)計中的基本概念 建立統(tǒng)計學(xué)思維,統(tǒng)計學(xué)是當(dāng)今最重要的科學(xué)技術(shù)之一,美國“科學(xué)84年”雜志選出“20世紀(jì)對人類生活影響最大的20項科技成果”;統(tǒng)計學(xué)入選其中(其它如:相對論、激光、電視、DNA等).,統(tǒng)計學(xué)定義:,Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical data. (Webster) Statist
2、ics is the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable result. (Armitage),“統(tǒng)計學(xué)是收集和分析數(shù)據(jù)的科學(xué)與藝術(shù)?!? 不列顛百科全書,不像其他學(xué)科,統(tǒng)計從來不打算使自己完美無缺,統(tǒng)計意味著你永遠(yuǎn)不需要確定無疑。 GudmundR.lversen,Believe it or not? You are using statistics
3、 almost every day! 我要在中午12:40趕到新街口,12:00走比較好 天氣預(yù)報說今天有70的幾率會下雨,我還是帶傘吧! 我這次找張大夫治療效果不錯,下次還要找他!,醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics),是以醫(yī)學(xué)理論為指導(dǎo),應(yīng)用概率論與數(shù)理統(tǒng)計的有關(guān)原理和方法,研究醫(yī)學(xué)資料的搜集、整理、分析和推斷的一門科學(xué)。,數(shù)理統(tǒng)計學(xué)與生物醫(yī)學(xué)的結(jié)合,生物統(tǒng)計學(xué)(Biostatistics) 應(yīng)用于生物學(xué)研究,又稱生物測量學(xué)Biometrics 醫(yī)學(xué)統(tǒng)計學(xué)(Medical Statistics) 應(yīng)用于醫(yī)學(xué)研究,側(cè)重于醫(yī)學(xué)的生物性 衛(wèi)生統(tǒng)計學(xué)(Health Statisti
4、cs) 應(yīng)用于醫(yī)學(xué)研究,側(cè)重于醫(yī)學(xué)的社會性,三個步驟:,研究設(shè)計 運用醫(yī)學(xué)統(tǒng)計學(xué)的起點,也是高質(zhì)量地完成整個研究的重要基礎(chǔ)。 資料分析 在研究設(shè)計基礎(chǔ)上,通過實驗(試驗)或調(diào)查,將所得數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)處理的過程。 結(jié)論 在數(shù)據(jù)分析的基礎(chǔ)上,應(yīng)用統(tǒng)計學(xué)處理的結(jié)果,進(jìn)行統(tǒng)計學(xué)推斷;同時,依據(jù)相應(yīng)的專業(yè)知識,作出專業(yè)性的結(jié)論。,Example:,1936年美國總統(tǒng)選舉; literary digest,民意調(diào)查; 堪薩斯州州長A1f landon ? 當(dāng)任總統(tǒng),F(xiàn)ranklin D. Roosevelt ? 電話簿和車輛登記簿上的名單 “A1f landon win!” In fact,F(xiàn)ran
5、klin win! why?,三類資料:,(1) 定量資料(quantitative data) (2) 定性資料(qualitative data) (3) 等級資料(ranked data,ordinal data),資料類型的判斷:,另一種分類:,數(shù)值變量資料(numerical variable) 分類資料(categorical variable),二分類(binary( dichotomous) variable) 多分類(polytomous variable ),無序多分類(multinomial) 有序多分類(ordinal) (等級資料,ranked data),數(shù)學(xué)上的分
6、類,連續(xù)型資料(continuous data) 離散型資料(discrete data),1950-2003年全國法定報告?zhèn)魅静〔∷缆?1990-2003年全國甲肝、乙肝發(fā)病率,19852001年全國報告的STD發(fā)病率,近年來全國性病年報告例數(shù)不斷增加,1989年,1998年,1995年,1985年,1955-2003年全國狂犬病發(fā)病率,基本概念(1):,同質(zhì)與變異: 同質(zhì)(homogeneity):觀察單位具有相的性質(zhì)。 異質(zhì)(heterogeneity):性質(zhì)不同。 同質(zhì)性是構(gòu)成研究總體的必備條件; 研究內(nèi)容(指標(biāo)/變量)不同,對同質(zhì)性的要求不同;,制定血紅蛋白參考值范圍時:,制定白細(xì)胞
7、參考值范圍時:,基本概念(2):,個體變異(individual variation) 同質(zhì)個體間的差異。 一種或多種不可控因素(已知的或未知的)作用下所產(chǎn)生的反映的綜合表現(xiàn)。 結(jié)果是隨機(jī)的(無法絕對正確地預(yù)測)。 個體變異是普遍存在的。 個體變異是有規(guī)律的。 沒有個體變異,就沒有統(tǒng)計學(xué)!,例1:個體變異的表現(xiàn),某地所有20歲健康男生的血紅蛋白 某地所有20歲健康男生和女生的血紅蛋白 江蘇和西藏所有20歲健康男生的血紅蛋白 某地所有20歲健康男生和女生的白細(xì)胞計數(shù) ,總體(population) 有限總體(finite) 無限總體(infinite) 個體(individual) 樣
8、本(random sample) 代表性,包含了總體的特性,基本概念(3):,總體參數(shù)(population parameter) 未知的,固有的,不變的,! 樣本統(tǒng)計量(sample statistics) 已知的,變化的,有誤差的! 樣本含量(sample size),基本概念(4):,基本概念(5):,隨機(jī)(random) 機(jī)會均等 隨機(jī)抽樣(random sampling) 有相同的機(jī)會被抽到 隨機(jī)分組(random allocation) 有相同的機(jī)會被分到不同的組中,基本概念(6):,隨機(jī)變量(random variable), 變量 個體觀察指標(biāo),頻率:在n次隨機(jī)
9、試驗中,事件A發(fā)生了m次,則比值 稱為事件A在這n次試驗中出現(xiàn)的頻率(frequency),基本概念(7):,頻率和概率,拋硬幣試驗在概率的統(tǒng)計學(xué)定義上的詮釋,概率(probability):描述了隨機(jī)事件發(fā)生的可能性的大小。是一種參數(shù)。 數(shù)理統(tǒng)計學(xué)中的大數(shù)定理表明:當(dāng)觀察次數(shù)n越來越大,頻率f 的隨機(jī)波動幅度越來越小,并最終趨向于一個常數(shù):隨機(jī)事件A 發(fā)生的概率(又稱為統(tǒng)計學(xué)上的概率定義)。,小概率事件(rare event) 小概率原理如果某事件的發(fā)生概率很小則在一次試驗中,認(rèn)為不發(fā)生。,基本概念(8):,抽樣誤差(sampling error) 由抽樣引起的樣本統(tǒng)計量與總體參數(shù)
10、間的差別 原因:個體變異抽樣 表現(xiàn): 樣本統(tǒng)計量與總體參數(shù)間的差別 不同樣本統(tǒng)計量間的差別 抽樣誤差是有規(guī)律的!,基本概念匯總,總體 個體、個體變異,總體參數(shù) 未知,樣本 代表性、抽樣誤差,,隨機(jī) 抽樣,樣本統(tǒng)計量已知,,,,統(tǒng)計推斷,風(fēng) 險,醫(yī)學(xué)統(tǒng)計學(xué)思維,歸納型思維 推理型思維 從樣本到總體 從個別到一般,,建立醫(yī)學(xué)統(tǒng)計學(xué)思維,生物體的變異是普遍存在的,這種變異是有規(guī)律的; 抽樣誤差是不可避免的,抽樣誤差是有規(guī)律的; 統(tǒng)計推斷是有風(fēng)險的,這種風(fēng)險是可以控制的。,統(tǒng)計學(xué)的作用:,統(tǒng)計學(xué)上得到的結(jié)論都具有概率性,它不能證明什么,但可以提供結(jié)論成立或不成立的概率,從而提高研究者的分辨能
11、力,為科學(xué)決策提供依據(jù)。 發(fā)現(xiàn)規(guī)律,而不是創(chuàng)造規(guī)律,統(tǒng)計學(xué)不能創(chuàng)造原本不存在的結(jié)論。 統(tǒng)計方法是一個中立性的工具。,學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)的要求:,建立統(tǒng)計學(xué)思維 學(xué)會從不確定性、機(jī)遇、風(fēng)險和推斷的角度去思考醫(yī)學(xué)問題提高自身的科學(xué)素質(zhì)和醫(yī)學(xué)研究能力; 學(xué)會設(shè)計 結(jié)合專業(yè)作出嚴(yán)密的試驗設(shè)計并獲得可靠、準(zhǔn)確、完整的資料; 學(xué)會分析與表達(dá) 學(xué)會運用統(tǒng)計方法充分挖掘資料中蘊(yùn)含的信息,恰如其分地進(jìn)行理性概括,寫出具有科學(xué)認(rèn)證的研究報告和學(xué)術(shù)論文。,第二章、統(tǒng)計資料的整理與描述,頻數(shù)分布 描述集中趨勢的指標(biāo) 描述離散程度的指標(biāo),例2:亂七八糟的原始數(shù)據(jù),某地120名14歲女童身高(cm)資料如下,給我給我一雙慧眼
12、吧,讓我把這紛擾看個清清楚楚明明白白真真切切,計量資料的頻數(shù)、頻率分布,2.1 頻數(shù)分布,原因:由于個體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。 現(xiàn)狀:醫(yī)學(xué)研究得到的原始數(shù)據(jù)(raw data)往往是龐大的、混亂的。 解決:頻數(shù)分布的基本思想:將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計各組的頻數(shù),得到頻數(shù)分布表;在將頻數(shù)表繪制成頻數(shù)分布圖。,120名14歲女童身高的頻數(shù)分布圖,某城市892名老年人生存質(zhì)量自評分的頻數(shù)分布,自評分,人 數(shù),102名黑色素瘤患者的生存時間頻數(shù)分布,生存時間(月
13、),人 數(shù),某地某年10000例死亡者年齡分布,死亡年齡(歲),人 數(shù),分類資料的頻數(shù)分布,血型頻數(shù)頻率(%) O205 40.43 A112 22.09 B150 29.59 AB 40 7.89 合計507100.00,頻數(shù)分布所提供的信息,頻數(shù)分布圖用以表示數(shù)據(jù)的分布規(guī)律。 觀察有無可疑值 。 考察分布的類型 。 對稱分布 非對稱分布(偏態(tài)分布) 左偏態(tài)(負(fù)偏態(tài)) 右偏態(tài)(正偏態(tài)) 考察分布的特征 集中趨勢(Central Tendency) 離散程度(Tendency of Dispersion),,,,,289名近視患者Lasik術(shù)后1月裸眼視力,,,,偏態(tài)分布1:老年人生存質(zhì)量自評
14、分,自評分,人 數(shù),偏態(tài)分布2: 黑色素瘤患者的生存時間,生存時間(月),人 數(shù),,偏態(tài),正偏態(tài)和負(fù)偏態(tài),分布不對稱者稱為偏態(tài)分布。偏態(tài)分布又分為正偏分布和負(fù)偏分布。所謂正偏分布是指分布的長尾在峰的右側(cè),又稱右偏分布;所謂負(fù)偏分布是指分布的長尾在峰的左側(cè),又稱左偏分布。,,集中趨勢和離散程度,,2.2 定量資料的統(tǒng)計描述,集中趨勢的描述算術(shù)均數(shù),算術(shù)均數(shù)(arithmetic mean, mean,),加權(quán)均數(shù)(weighted mean) 均數(shù)是加權(quán)均數(shù)的一個特例,集中趨勢的描述幾何均數(shù),幾何均數(shù)(geometric mean,G),例3、幾何均數(shù)(P14),1:10, 1:20, 1:
15、40, 1:80, 1:160,集中趨勢的描述中位數(shù),中位數(shù)(median,M) 將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位數(shù)。 The Median is that value for which 50 percent of the observations, when arranged in order of magnitude, lie on each side.,例4、中位數(shù),9例正常人的發(fā)汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 10例正常人的發(fā)汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2,集中趨勢的描述百分位數(shù),百分位數(shù)(percentile) X% PX (100-X)% 50%分位數(shù)就是中位數(shù) 25%,75%分位數(shù)稱四分位數(shù)(quartile),描述集中趨勢的指標(biāo),平均數(shù)(Average),算術(shù)均數(shù)(Mean),幾何均數(shù)(Geometric Mean),中位數(shù)(Median),百分位數(shù)(Percentile),,Thanks,