《《醫(yī)學統(tǒng)計學 緒論》PPT課件.ppt》由會員分享,可在線閱讀,更多相關《《醫(yī)學統(tǒng)計學 緒論》PPT課件.ppt(66頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、醫(yī)學統(tǒng)計學,第一章 緒論,統(tǒng)計學與醫(yī)學統(tǒng)計學 醫(yī)學統(tǒng)計學的內(nèi)容 醫(yī)學研究的三個步驟 三類資料 醫(yī)學統(tǒng)計中的基本概念 建立統(tǒng)計學思維,統(tǒng)計學是當今最重要的科學技術之一,美國“科學84年”雜志選出“20世紀對人類生活影響最大的20項科技成果”;統(tǒng)計學入選其中(其它如:相對論、激光、電視、DNA等).,統(tǒng)計學定義:,Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical data. (Webster) Statist
2、ics is the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable result. (Armitage),“統(tǒng)計學是收集和分析數(shù)據(jù)的科學與藝術?!? 不列顛百科全書,不像其他學科,統(tǒng)計從來不打算使自己完美無缺,統(tǒng)計意味著你永遠不需要確定無疑。 GudmundR.lversen,Believe it or not? You are using statistics
3、 almost every day! 我要在中午12:40趕到新街口,12:00走比較好 天氣預報說今天有70的幾率會下雨,我還是帶傘吧! 我這次找張大夫治療效果不錯,下次還要找他!,醫(yī)學統(tǒng)計學(medical statistics),是以醫(yī)學理論為指導,應用概率論與數(shù)理統(tǒng)計的有關原理和方法,研究醫(yī)學資料的搜集、整理、分析和推斷的一門科學。,數(shù)理統(tǒng)計學與生物醫(yī)學的結合,生物統(tǒng)計學(Biostatistics) 應用于生物學研究,又稱生物測量學Biometrics 醫(yī)學統(tǒng)計學(Medical Statistics) 應用于醫(yī)學研究,側重于醫(yī)學的生物性 衛(wèi)生統(tǒng)計學(Health Statisti
4、cs) 應用于醫(yī)學研究,側重于醫(yī)學的社會性,三個步驟:,研究設計 運用醫(yī)學統(tǒng)計學的起點,也是高質(zhì)量地完成整個研究的重要基礎。 資料分析 在研究設計基礎上,通過實驗(試驗)或調(diào)查,將所得數(shù)據(jù)進行統(tǒng)計學處理的過程。 結論 在數(shù)據(jù)分析的基礎上,應用統(tǒng)計學處理的結果,進行統(tǒng)計學推斷;同時,依據(jù)相應的專業(yè)知識,作出專業(yè)性的結論。,Example:,1936年美國總統(tǒng)選舉; literary digest,民意調(diào)查; 堪薩斯州州長A1f landon ? 當任總統(tǒng),F(xiàn)ranklin D. Roosevelt ? 電話簿和車輛登記簿上的名單 “A1f landon win!” In fact,F(xiàn)ran
5、klin win! why?,三類資料:,(1) 定量資料(quantitative data) (2) 定性資料(qualitative data) (3) 等級資料(ranked data,ordinal data),資料類型的判斷:,另一種分類:,數(shù)值變量資料(numerical variable) 分類資料(categorical variable),二分類(binary( dichotomous) variable) 多分類(polytomous variable ),無序多分類(multinomial) 有序多分類(ordinal) (等級資料,ranked data),數(shù)學上的分
6、類,連續(xù)型資料(continuous data) 離散型資料(discrete data),1950-2003年全國法定報告?zhèn)魅静〔∷缆?1990-2003年全國甲肝、乙肝發(fā)病率,19852001年全國報告的STD發(fā)病率,近年來全國性病年報告例數(shù)不斷增加,1989年,1998年,1995年,1985年,1955-2003年全國狂犬病發(fā)病率,基本概念(1):,同質(zhì)與變異: 同質(zhì)(homogeneity):觀察單位具有相的性質(zhì)。 異質(zhì)(heterogeneity):性質(zhì)不同。 同質(zhì)性是構成研究總體的必備條件; 研究內(nèi)容(指標/變量)不同,對同質(zhì)性的要求不同;,制定血紅蛋白參考值范圍時:,制定白細胞
7、參考值范圍時:,基本概念(2):,個體變異(individual variation) 同質(zhì)個體間的差異。 一種或多種不可控因素(已知的或未知的)作用下所產(chǎn)生的反映的綜合表現(xiàn)。 結果是隨機的(無法絕對正確地預測)。 個體變異是普遍存在的。 個體變異是有規(guī)律的。 沒有個體變異,就沒有統(tǒng)計學!,例1:個體變異的表現(xiàn),某地所有20歲健康男生的血紅蛋白 某地所有20歲健康男生和女生的血紅蛋白 江蘇和西藏所有20歲健康男生的血紅蛋白 某地所有20歲健康男生和女生的白細胞計數(shù) ,總體(population) 有限總體(finite) 無限總體(infinite) 個體(individual) 樣
8、本(random sample) 代表性,包含了總體的特性,基本概念(3):,總體參數(shù)(population parameter) 未知的,固有的,不變的,! 樣本統(tǒng)計量(sample statistics) 已知的,變化的,有誤差的! 樣本含量(sample size),基本概念(4):,基本概念(5):,隨機(random) 機會均等 隨機抽樣(random sampling) 有相同的機會被抽到 隨機分組(random allocation) 有相同的機會被分到不同的組中,基本概念(6):,隨機變量(random variable), 變量 個體觀察指標,頻率:在n次隨機
9、試驗中,事件A發(fā)生了m次,則比值 稱為事件A在這n次試驗中出現(xiàn)的頻率(frequency),基本概念(7):,頻率和概率,拋硬幣試驗在概率的統(tǒng)計學定義上的詮釋,概率(probability):描述了隨機事件發(fā)生的可能性的大小。是一種參數(shù)。 數(shù)理統(tǒng)計學中的大數(shù)定理表明:當觀察次數(shù)n越來越大,頻率f 的隨機波動幅度越來越小,并最終趨向于一個常數(shù):隨機事件A 發(fā)生的概率(又稱為統(tǒng)計學上的概率定義)。,小概率事件(rare event) 小概率原理如果某事件的發(fā)生概率很小則在一次試驗中,認為不發(fā)生。,基本概念(8):,抽樣誤差(sampling error) 由抽樣引起的樣本統(tǒng)計量與總體參數(shù)
10、間的差別 原因:個體變異抽樣 表現(xiàn): 樣本統(tǒng)計量與總體參數(shù)間的差別 不同樣本統(tǒng)計量間的差別 抽樣誤差是有規(guī)律的!,基本概念匯總,總體 個體、個體變異,總體參數(shù) 未知,樣本 代表性、抽樣誤差,,隨機 抽樣,樣本統(tǒng)計量已知,,,,統(tǒng)計推斷,風 險,醫(yī)學統(tǒng)計學思維,歸納型思維 推理型思維 從樣本到總體 從個別到一般,,建立醫(yī)學統(tǒng)計學思維,生物體的變異是普遍存在的,這種變異是有規(guī)律的; 抽樣誤差是不可避免的,抽樣誤差是有規(guī)律的; 統(tǒng)計推斷是有風險的,這種風險是可以控制的。,統(tǒng)計學的作用:,統(tǒng)計學上得到的結論都具有概率性,它不能證明什么,但可以提供結論成立或不成立的概率,從而提高研究者的分辨能
11、力,為科學決策提供依據(jù)。 發(fā)現(xiàn)規(guī)律,而不是創(chuàng)造規(guī)律,統(tǒng)計學不能創(chuàng)造原本不存在的結論。 統(tǒng)計方法是一個中立性的工具。,學習醫(yī)學統(tǒng)計學的要求:,建立統(tǒng)計學思維 學會從不確定性、機遇、風險和推斷的角度去思考醫(yī)學問題提高自身的科學素質(zhì)和醫(yī)學研究能力; 學會設計 結合專業(yè)作出嚴密的試驗設計并獲得可靠、準確、完整的資料; 學會分析與表達 學會運用統(tǒng)計方法充分挖掘資料中蘊含的信息,恰如其分地進行理性概括,寫出具有科學認證的研究報告和學術論文。,第二章、統(tǒng)計資料的整理與描述,頻數(shù)分布 描述集中趨勢的指標 描述離散程度的指標,例2:亂七八糟的原始數(shù)據(jù),某地120名14歲女童身高(cm)資料如下,給我給我一雙慧眼
12、吧,讓我把這紛擾看個清清楚楚明明白白真真切切,計量資料的頻數(shù)、頻率分布,2.1 頻數(shù)分布,原因:由于個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。 現(xiàn)狀:醫(yī)學研究得到的原始數(shù)據(jù)(raw data)往往是龐大的、混亂的。 解決:頻數(shù)分布的基本思想:將原始數(shù)據(jù)按照一定的標準劃分為若干各組,合計各組的頻數(shù),得到頻數(shù)分布表;在將頻數(shù)表繪制成頻數(shù)分布圖。,120名14歲女童身高的頻數(shù)分布圖,某城市892名老年人生存質(zhì)量自評分的頻數(shù)分布,自評分,人 數(shù),102名黑色素瘤患者的生存時間頻數(shù)分布,生存時間(月
13、),人 數(shù),某地某年10000例死亡者年齡分布,死亡年齡(歲),人 數(shù),分類資料的頻數(shù)分布,血型頻數(shù)頻率(%) O205 40.43 A112 22.09 B150 29.59 AB 40 7.89 合計507100.00,頻數(shù)分布所提供的信息,頻數(shù)分布圖用以表示數(shù)據(jù)的分布規(guī)律。 觀察有無可疑值 。 考察分布的類型 。 對稱分布 非對稱分布(偏態(tài)分布) 左偏態(tài)(負偏態(tài)) 右偏態(tài)(正偏態(tài)) 考察分布的特征 集中趨勢(Central Tendency) 離散程度(Tendency of Dispersion),,,,,289名近視患者Lasik術后1月裸眼視力,,,,偏態(tài)分布1:老年人生存質(zhì)量自評
14、分,自評分,人 數(shù),偏態(tài)分布2: 黑色素瘤患者的生存時間,生存時間(月),人 數(shù),,偏態(tài),正偏態(tài)和負偏態(tài),分布不對稱者稱為偏態(tài)分布。偏態(tài)分布又分為正偏分布和負偏分布。所謂正偏分布是指分布的長尾在峰的右側,又稱右偏分布;所謂負偏分布是指分布的長尾在峰的左側,又稱左偏分布。,,集中趨勢和離散程度,,2.2 定量資料的統(tǒng)計描述,集中趨勢的描述算術均數(shù),算術均數(shù)(arithmetic mean, mean,),加權均數(shù)(weighted mean) 均數(shù)是加權均數(shù)的一個特例,集中趨勢的描述幾何均數(shù),幾何均數(shù)(geometric mean,G),例3、幾何均數(shù)(P14),1:10, 1:20, 1:
15、40, 1:80, 1:160,集中趨勢的描述中位數(shù),中位數(shù)(median,M) 將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位數(shù)。 The Median is that value for which 50 percent of the observations, when arranged in order of magnitude, lie on each side.,例4、中位數(shù),9例正常人的發(fā)汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 10例正常人的發(fā)汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2,集中趨勢的描述百分位數(shù),百分位數(shù)(percentile) X% PX (100-X)% 50%分位數(shù)就是中位數(shù) 25%,75%分位數(shù)稱四分位數(shù)(quartile),描述集中趨勢的指標,平均數(shù)(Average),算術均數(shù)(Mean),幾何均數(shù)(Geometric Mean),中位數(shù)(Median),百分位數(shù)(Percentile),,Thanks,