概率統(tǒng)計模型PPT課件

上傳人:陳** 文檔編號:248733061 上傳時間:2024-10-25 格式:PPT 頁數(shù):72 大小:1.20MB
收藏 版權申訴 舉報 下載
概率統(tǒng)計模型PPT課件_第1頁
第1頁 / 共72頁
概率統(tǒng)計模型PPT課件_第2頁
第2頁 / 共72頁
概率統(tǒng)計模型PPT課件_第3頁
第3頁 / 共72頁

下載文檔到電腦,查找使用更方便

15 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《概率統(tǒng)計模型PPT課件》由會員分享,可在線閱讀,更多相關《概率統(tǒng)計模型PPT課件(72頁珍藏版)》請在裝配圖網上搜索。

1、單擊此處編輯母版標題樣式,,單擊此處編輯母版文本樣式,,第二級,,第三級,,第四級,,第五級,,,*,隨機性模型及,MATLAB 統(tǒng)計工具箱 在建模中的應用,,確定性模型和隨機性模型,隨機因素可以忽略,隨機因素影響可以簡單地以平均值的作用出現(xiàn),隨機因素影響必須考慮,概率模型,統(tǒng)計回歸模型,馬氏鏈模型,確定性模型,隨機性模型,,概 率 模 型,,例:,報童的利潤,為了獲得最大的利潤,報童每天應購進多少份報紙?,162天報紙需求量的調查,報童早上購進報紙零售,晚上將未賣掉的報紙退回。,購進價,b,,(=0.8元),零售價,a,,,(=1元),退回價,c,,(=0.75元),售出一份賺,a-b,退回

2、一份賠,b-c,,136 214 195 219 224 197 213 187,187,,?,,? ? 230 172 227 157 114 156,,問題分析,購進太多,?賣不完退回?賠錢,購進太少,?不夠銷售?賺錢少,應根據(jù)需求確定購進量,每天需求量是隨機的,目標函數(shù)應是長期的日平均利潤,每天收入是隨機的,存在一個合適的購進量,= 每天收入的期望值,隨機性優(yōu)化模型,需求量的隨機規(guī)律由,162天報紙需求量的調查得到,每天需求量為,r,的概率,f,(,r,),, r,=0

3、,1,2…,,,模型建立,,設每天購進,n,份,,日平均收入為,G,(,n,),求,n,使,G,(,n,),最大,已知售出一份賺,a-b,;,退回一份賠,b-c,,r,視為連續(xù)變量,模型建立,,模型建立,由(1)或(2)得到的,n,是每天平均利潤最大的最佳購進量。,,結果解釋,n,P,1,P,2,取,n,使,,a-b ~,售出一份賺的錢,,b-c ~,退回一份賠的錢,0,r,p,,MATLAB,統(tǒng)計工具箱常用命令(一),命令,名稱,輸入,輸出,[n,y]=hist(x,k),頻數(shù)表,x: 原始數(shù)據(jù)行向量,,k:等分區(qū)間數(shù),n: 頻數(shù)行向量,,y: 區(qū)間中點行向量,hist(x,k),直方圖,同

4、上,直方圖,m=mean(x),均值,x: 原始數(shù)據(jù)行向量,均值,m,s=std(x),標準差,同上,標準差,s,,功能,概率,,密度,分布,,函數(shù),逆概率,,分布,均值與,,方差,隨機數(shù),,生成,字符,pdf,cdf,inv,stat,rnd,,分布,均勻,,分布,指數(shù),,分布,正態(tài),,分布,?,2,,分布,t,,分布,F,,分布,二項,,分布,泊松,,分布,字符,unif,exp,norm,chi2,t,f,bino,poiss,MATLAB,統(tǒng)計工具箱常用命令(一),y=normpdf(1.5,1,2) 正態(tài)分布,x,=1.5的概率密度 (,?,=1,,?,=2),y=fcdf(1

5、,10, 50),F,分布,x,= 1的分布函數(shù) (自由度,n,1,=10,,n,2,=50),y =tinv(0.9,10) 概率,?,=0.9的逆t分布 (,?,分位數(shù), 自由度,n,=10),,由 計算,n,用MATLAB,統(tǒng)計工具箱求解報童模型,根據(jù)數(shù)據(jù)確定需求量的概率分布,p,(,x,),baotongdata.m,baotong1.m,,baotongdata.m,,,199 136 214 195 219 224 197 213 187 187 185

6、 162 209 249 177 180 229 202,,262 132 159 169 287 217 182 201 187 239 201 233 228 191 195 205 168 190,,196 159 238 155 172 153 243 173 131 233 258 227 206 166 170 249 246 176,,232 209 185 167 211 127 137 2

7、81 197 305 190 207 237 193 179 257 165 232,,180 230 234 167 221 241 158 214 199 151 189 194 157 122 164 200 131 251,,176 117 204 260 202 206 199 207 235 207 230 220 205 211 161 162 199 214,,164 232 204 309

8、 216 148 215 220 180 209 176 201 217 248 231 94 211 233,,200 234 231 252 249 238 134 160 227 161 176 227 201 243 146 219 135 142,,212 194 155 188 177 164 210 140 213 119 221 214 230 172 227 157 114 156,,b

9、aotong1.m,,x=dlmread(‘baotongdata.m’); % 讀入數(shù)據(jù)文件,,baotongdata.m(18x9矩陣),,y=reshape(x,1,162); % 轉換為向量,,[n,z]=hist(y), % 頻數(shù)表,,hist(y) % 直方圖,,m=mean(y)

10、% 均值,,s=std(y) % 均方差,,h =jbtest(y) % 正態(tài)性檢驗,,pause,,q=(b-a)/(b-c);,,N=norminv(q,m,s) % 按照(2)用逆概,,率分布計算n,,n =,,2 11 12 30 29 35 28 11 2 2,,z =,,104.7500 126.25

11、00 147.7500 169.2500 190.7500,,212.2500 233.7500 255.2500 276.7500 298.2500,,m =,,197.7531,,s =,,38.4653,,h =,,0,,N =,,230.1263,,一 航空公司的預訂票策略,1 問題的提出,有時在機場會出現(xiàn)一些乘客本已訂好了某家航空公司,,的某趟航班,卻被意外地告知此趟航班已滿,航空公司將,,為他們預定稍后的航班的情況。這不但會引起乘客的不便,,,還會加劇他們對航空公司的抱怨程度。,,在如今這個使用計算機系統(tǒng)來實行訂票的時代,是否,,可以通過設計某種系統(tǒng)來抑制這類事件

12、的發(fā)生。,,試建立一個面對航空公司訂票決策的數(shù)學模型。,西北大學數(shù)學系,,2 符號約定,f,—— 維持航班的總費用(成本),,n,—— 乘坐航班的乘客數(shù)量,,g,—— 每名乘客支付的運費(機票票價),,N,—— 航班的滿艙載客數(shù)量,,k,—— 誤機的乘客數(shù),,,——,k,人誤機的概率,m,—— 預定航班的乘客數(shù)量,,S,—— 航班的收支差額,,b,—— 安置一名剩余乘客的費用,,p,—— 訂票乘客登機的概率,,q,—— 訂票乘客誤機的概率(1-,p,),,j,—— 航班賣出折價票的數(shù)量,,r,—— 航班票價的折扣率,,3 建模目標,建立一個面對航空公司訂票決策的數(shù)學模型。,航空公司制定超客

13、訂票策略,是為了從航班中獲得盡可能大的利潤。,,順著這條脈絡,很自然地以求出航空公司期待從一趟預定航班中獲得的利潤來建立模型。,1)初步建模(從簡單情形入手),,首先,摒除對所求利潤帶來復雜影響的參量,從利潤最根本的角度出發(fā)建立基本模型。,4 建立模型,,,一趟航班運行的成本基本與實際搭乘的乘客數(shù)量無關。,,航班的成本包括了航空公司支付的薪水、燃料費用、機場承擔的起飛、降落和操作費用,以及一些其它的費用(比如飛機,維修費用,地面工作人員的薪金,廣告費用)。不管航班是否滿艙,航空公司都必需給飛行員、領航員、工程師和艙內全體職員支付薪金。而相對于半艙的航班,滿艙的航班所多消耗的燃料在總體的燃料負

14、擔中僅占很小的比例。,利潤 = 收入—成本,一趟航班運行的成本記為,,如果一趟航班實際搭載了,,名乘客,那么所得的余額是,其中,,為每名乘客支付的運費。,當乘客的數(shù)目增加時,利潤也跟著增加。最大可得利潤是,其中,,是航班的滿艙載客量。,不同類型的乘客支付不同的運費,例如頭等艙、公務艙、經濟艙都有各自的定價。為了建模方便,現(xiàn)在假設所有的乘客都支付同樣的運費。,一趟航班的收入取決于實際的乘客人數(shù),n,,當乘客所付的總運費恰好能維持航班的費用時,達到一,,個臨界人數(shù),當乘客人數(shù)少于它時,航班的經營將,會造成損失。,容易看出,為了獲得盡可能大的利潤,航空公司應當讓每一趟航班達到滿艙。,誤機者會影響滿艙

15、。,分析初步模型模型,每趟航班能否達到滿艙?,因此,需要在基本模型上加進反映“乘客誤機”這一條件的參量,并考察其對所求利潤的影響。,,2)擴充模型,時也不一,定能保證利潤達到最大,則訂票上限便不應,,局限于N 值。,假設訂票的總人數(shù)是,,,有可能超出,航空公司可能從航班中得到的利潤為,當,考慮到發(fā)生乘客誤機的情況,使得即使訂票數(shù)為,當有,個人誤機時,,,乘客沒有搭乘航班屬于偶然事件,要反映這一事件,必須加進乘客搭乘航班的概率這一參量。設有,個人誤機的概率是,則所得利潤的表達方式只能是利潤的數(shù)學期望值,用,表示,有,設有,如果,,則第一項和不存在,,僅由第二項和表出,并且,求和下限由0代替。,,

16、由于對航班需求的不同,顯然訂票的乘客數(shù)有可能小于航班載,,客量,航空公司并不需要考慮超額訂票的問題。,,根據(jù)求解的問題,需要假設各種情況,不論航空公司決定的最,,大訂票數(shù),為多少,在一些時間的熱門航線中它都是有可能會,達到的。,為研究,對,的影響,將上式改寫為,根據(jù),的定義,,,因此,有,,而在和都為正數(shù)的條件下,有,。則唯一能達到,預期利潤最大值的方法是降低所有的,,使之趨近于0。,當訂票數(shù)量,充分的大于,時,可以達到所要結果。因為,,當訂票的乘客數(shù)目增加時,任意大的誤機人數(shù)出現(xiàn)的概率便,,隨之降低。,,因此,第二個模型通過預測已訂票乘客的真正登機數(shù)目表明,可以令訂票數(shù)充分地大于航班客載量來

17、使預期的利潤趨近于理論上的最大值,即航班滿艙時的可獲得的利潤。在這個模型中對訂票的超額數(shù)量并沒有任何限制,它甚至可能是航班載客量的好幾倍。,但是,一旦實行了超額訂票策略之后,除了對航班的利潤帶來保障外,也會帶一些負面的影響。,,即到達機場要求登機的乘客數(shù) m-k ,,可能要比航班的載客量大得多。,,對被擠兌的乘客數(shù)為,,單從表面上來看,顯然航空公司最后得到的利潤需要扣除這一部分費用,并且這筆費用是隨著 m 的變化而變化。因此,需要在模型里加進代表“被擠兌的乘客所支出的費用”這一參量,并考察其對所求利潤的影響,以及它與 m的相互關系。,被擠兌的乘客造成航空公司兩方面的損失:,滯留費用,機票簽轉的

18、費用。,,來自乘客的抱怨,影響公司形象的潛在費用。,,當出現(xiàn)超額訂票并有超出航班載客量的乘客抵達機場的情況時,假設航空公司通過各種方法處理被擠兌的乘客,每一名所需要的費用是,b,,建立包括處理超出乘,客所需費用在內的,航空公司從某趟航班中期望獲得的平均利潤的模型。,設實際登機的乘客數(shù)為,,則航班所得的利潤為,當,3)改進的模型,,事實上,將利潤看成一隨機變量,有,個人登機所對應的,概率為,,則航空公司從航班中所獲得的預期利潤,或說平,均利潤,便是取遍所有可能的誤機人數(shù)的情況下,利潤的數(shù)學,,期望。因此,有,,,且,表示預計的誤機人數(shù),我們用,表示,有,,現(xiàn)在,已經得到一個相對復雜的中間結果。,

19、將,和從,開始令,代入上式中進行檢驗。這符合,乘客誤機的概率為0,即每一名訂票的乘客都抵達了機場。在,,這種情況下,上式簡化為,從,這個結果表明,如同預測的,如果有,名乘客預定了載客量為,的航班并且他們都抵達了機場,那么利潤將是滿艙的收支差,額,減去承擔,名剩余乘客的費用,。在這種,情況下,最大平均利潤在,時可以達到,就如同最初的基,本模型所表示的一般。,,相較于基本模型,此時的模型已經考慮了“乘客誤機”與“安,,排被擠兌乘客”兩種情況。其中“有,,名乘客誤機”這一偶然,,事件的概率,,還可進一步分解以方便估計與計算。,,接著,便來討論關于,的形式。最簡單地,假設一乘客登,機的概率為,,而誤機

20、的概率為,。進一步假設抵達機場,,的乘客兩兩無關,則可得到,的二項式結構為,當然,事實上這個誤機者兩兩無關的假設并不是完全正確,,的——一部分的乘客是兩人或是以小組為單位一起行動的。,,現(xiàn)在,先從最簡單的情況開始入手。由這個結構,可得,航空公司將要嘗試的就是找出航班所得平均利潤的最大值。,,上式中表達的平均利潤依賴于,和,。成本,,票價,和費用,則在航空公司短期控制范圍之外(運費是由IATA,決定,而不是由個別的航空公司決定),,和,由客觀因素,約束,只有訂票數(shù)目上限,是航空公司可以改變的參數(shù)。,,上式中的部分和結果表明,這個問題可以通過列舉細表來,,得到解決。但是,明顯地,最佳的訂票上限至少

21、不低于航,,班的載客量,。當,時,所得利潤可化簡為,這是關于,的增函數(shù)。,我們計算得,包含各種取值,每一個,對應于一個訂票上限,。通過,和,來求得利潤,并根據(jù)各組不同數(shù)值的,來選出最佳的訂票上限。,式中的和其實是一個關于,的函數(shù),在給出,估算這個和,然后便會發(fā)現(xiàn)預期的利潤是一個關于,的值后,可以編寫計算程序來,,的函數(shù)。,航空公司綜合考慮大量的因素,得出,的臨界人數(shù)大約是航班載客量的60%,所以可以估計一個最,,佳近似值,即是,。因此,可以得到,用計算程序比照訂票數(shù)量來計算一架載客量為300的飛機所,,能得到的預期利潤,假設,和,結果很明顯,依據(jù)超額訂票程度來達到最大的可能利潤是可,,行的。同

22、樣,也可以計算,個或是更多乘客發(fā)生座位沖撞的,概率:,結果表明,當超額訂票的乘客數(shù)分別為20和39時,可以達到,,最大的預期利潤。有5名或更多乘客發(fā)生座位沖撞的概率在,,46%和55%之間。,,當考慮到安排一名被擠兌乘客的費用所帶來的影響時,得到,,的結果和從直觀上所得的結果是一致的,因為安排剩余乘客,,所需費用增加,為從航班中得到的最大預期利潤所需要的超,,額訂票數(shù)便會減少,發(fā)生任意多名乘客座位沖撞的概率(這,,里以發(fā)生5名或更多的乘客座位沖撞例)也就降低了。,能達到最大預期利潤的訂票水平,將作為構成機票價格的一,,部份。對300座的客機,設,對于,值的估計,這筆費用大致是由實際和相對潛在的

23、,例,如公司信譽的損害與將來的潛在客源流失,兩筆花費構成。,,這個討論應該導向關于靈敏度的考慮。,第二個結果顯示,有5名或是更多的乘客座位發(fā)生沖撞的概,,率對,與,的比值變化是非常靈敏的,而相對地,預期的利,潤值對這種變化的反映則并不很大。在實際中,這表示航空,,公司的決策制定者很容易過高地估計,而犯錯。其實要精確,估計,這筆支出費用是相當困難地,在降低平均利潤的條件,下,高估一個小數(shù)目雖然也有益處,但要降低乘客座位沖撞,,概率到一個有意義的數(shù)目的條件是很大的。,,,模型推廣,,資源的所有者在將其對外出借、出租或出售時,必需制定關,,于未來提供給顧客的的服務能否實現(xiàn)的決策。本文討論的航,,班訂

24、票只是這一大類型中的一個,以下列出了三個從此類問,,題中挑選出的例子,通過建模練習可以在這個課題中獲得更,,大的收獲。,1)酒店,,酒店接受房間預訂主要是建立在誠信之上,因此通常不會再,,接受有過失信記錄的顧客的預訂。一些酒店在接受預訂時會,,要求顧客交納押金,以此來確保顧客住房的概率(施行這種,,方案的一般是低價酒店,因為它們的周轉資金往往不多),,,而另一些酒店則可能會給長期訂房或是預付房費的顧客打折。,,這種多價格系統(tǒng)的經營方式是可以考慮的。,2)汽車出租公司,,汽車出租公司一般會保留固定數(shù)量的汽車(至少在短期內),,以出租給顧客。出租公司可能會為頻繁租借汽車的顧客打折,,,以此來確保公

25、司能有最低量的收入。而一些長期出租品(一,,次出租一周或一個月)也會標上優(yōu)惠的價格,因為這給出,,了一個至少確定了未來的一段日子會有收入的策略。在預,,測一些車輛的預訂可能會被取消的情況下,一間公司有可,,能充分地留出比它們計劃中要多的汽車。,3)圖書館,,圖書館都有可能購買一些暢銷書籍的多種版本。特別是在,,學院或大學圖書館里,時常購買一系列課本。某些版本極,,有可能僅限在圖書館內,以方便學生們的使用??梢試L試,,建立書籍使用的模型。,,回 歸 模 型,數(shù)據(jù)擬合方法再討論,,直線擬合:,,a=polyfit(x,y,1),,,b=polyfit(x,z,1),,同一條直線,y=0.33x+0

26、.96(z=0.33x+0.96),從擬合到回歸,x=[ 0 1 2 3 4 ], y=[ 1.0 1.3 1.5 2.0 2.3 ] ( + 號),,x=[ 0 1 2 3 4 ], z=[ 0.6 1.95 0.9 2.85 1.8 ](*號),問題:你相信哪個擬合結果?怎樣給以定量評價,?,得到,,a= 0.33 0.96,,b= 0.33 0.96,,例,1,牙膏的銷售量,,問題,建立牙膏銷售量與價格、廣告投入之間的模型,預測在不同價格和廣告費用下的牙膏銷售量,收集了30個銷售周期本公司牙膏銷售量、價格、廣告費用,及同期其它廠家同類牙膏的平均售價,9.26,0.55

27、,6.80,4.25,3.70,30,7.93,0.05,5.80,3.85,3.80,29,?,?,?,?,?,?,8.51,0.25,6.75,4.00,3.75,2,7.38,-0.05,5.50,3.80,3.85,1,銷售量,,(百萬支),價格差,,(元),廣告費用,,(百萬元),其它廠家價格(元),本公司價格(元),銷售周期,yagaodata.xls,,基本模型,y ~,公司牙膏銷售量,x,1,~其它廠家與本公司,價格差,x,2,~公司廣告費用,x,2,y,x,1,y,x,1,,,x,2,~解釋變量(回歸變量, 自變量),y,~被解釋變量(因變量),?,0,, ?,1,,, ?,

28、2,, ?,3,~,回歸系數(shù),?,~,隨機,誤差(,均值為零的正態(tài)分布隨機變量),,MATLAB,統(tǒng)計工具箱,,模型求解,[b,bint,r,rint,stats]=regress(y,x,alpha),,輸入,,x=,~,n,?,4數(shù)據(jù)矩陣, 第1列為全1向量,alpha,(,置信,水平,,0.05,),,b~,?,的,估計值,bint,~,b,的置信區(qū)間,r,~殘差向量,y,-,xb,,,rint,~,r,的置信區(qū)間,Stats,~,,檢驗統(tǒng)計量,,,R,2,,,F,,,p,,y~,n,維數(shù)據(jù)向量,輸出,,由數(shù)據(jù),y,,x,1,,,x,2,估計,?,yagao.m,,yagao.m,,cl

29、ear,,s=xlsread('yagaodata.xls');,,y=s(:,6);,,x1=s(:,5);,,x2=s(:,4);,,plot(x1,y,'o'),,pause,,plot(x2,y,'ro'),,pause,,x=[ones(30,1) x1 x2 x2.*x2];,,[b,bint,r,rint,stats]=regress(y,x);,,b,bint,stats,,,,,b =,,17.3244,,1.3070,,-3.6956,,0.3486,,bint =,,5.7282 28.9206,,0.6829 1.9311,,-7.4989 0.1077

30、,,0.0379 0.6594,,stats =,,0.9054 82.9409 0.0000,,結果分析,y,的90.54%可由模型確定,參數(shù),,參數(shù)估計值,,置信區(qū)間,,17.3244,,[5.7282 28.9206],,1.3070,,[0.6829 1.9311 ],,-3.6956,,[-7.4989 0.1077 ],,0.3486,,[0.0379 0.6594 ],,R,2,=0.9054,F,=82.9409,p,=0.0000,,?,0,?,1,?,2,?,3,F,遠超過,F,檢驗的臨界值,p,遠小于,?,=,0.05,,?,2,的置信區(qū)間

31、包含零點(右端點距零點很近),x,2,對因變量,y,的影響不太顯著,x,2,2,項顯著,可將,x,2,保留在模型中,模型從整體上看成立,,銷售量預測,價格差,x,1,=其它廠家,價格,x,3,-本公司,價格,x,4,估計,x,3,調整,x,4,控制價格差,x,1,=0.2元,投入廣告費,x,2,=650萬元,銷售量預測區(qū)間為 [7.8230,8.7636](置信度95%),上限用作庫存管理的目標值,下限用來把握公司的現(xiàn)金流,若估計,x,3,=3.9,設定,x,4,=3.7,則可以95%的把握知道銷售額在 7.8320,?,3.7,?,29(百萬元)以上,控制,x,1,通過,x,1,,,x,2,

32、預測,y,(百萬支),,模型改進,x,1,和,x,2,對,y,的,影響獨立,,參數(shù),,參數(shù)估計值,,置信區(qū)間,,17.3244,,[5.7282 28.9206],,1.3070,,[0.6829 1.9311 ],,-3.6956,,[-7.4989 0.1077 ],,0.3486,,[0.0379 0.6594 ],,R,2,=0.9054,F,=82.9409,p,=0.0000,,?,0,?,1,?,2,?,3,,參數(shù),,,參數(shù)估計值,,置信區(qū)間,,29.1133,,[13.7013 44.5252],,11.1342,,[1.9778 20.2906 ],,

33、-7.6080,,[-12.6932 -2.5228 ],,0.6712,,[0.2538 1.0887 ],,-1.4777,,[-2.8518 -0.1037 ],,R,2,=0.9209,F,=72.7771,p,=0.0000,,?,3,?,0,?,1,?,2,?,4,x,1,和,x,2,對,y,的影響有交互作用,yagao1.m,,yagao1.m,,clear,,s=xlsread('yagaodata.xls');,,y=s(:,6);,,x1=s(:,5);,,x2=s(:,4);,,,x=[ones(30,1) x1 x2 x2.*x2 x1.*x2];

34、,,[b,bint,r,rint,stats]=regress(y,x);,,b,bint,stats,,,rcoplot(r,rint),,兩模型銷售量預測,比較,(百萬支),區(qū)間 [7.8230,8.7636],區(qū)間 [7.8953,8.7592],(百萬支),控制價格差,x,1,=0.2元,投入廣告費,x,2,=6.5百萬元,預測區(qū)間長度更短,略有增加,,x,2,=6.5,x,1,=0.2,x,1,x,1,x,2,x,2,兩模型 與,x,1,,,x,2,關系的,比較,,交互作用影響的討論,價格差,x,1,=0.1,價格差,x,1,=0.3,加大廣告投入使銷售量增加,,(,x,2,大于

35、6百萬元),價格差較小時增加的速率更大,x,2,價格優(yōu)勢會使銷售量增加,價格差較小時更需要靠廣告來吸引顧客的眼球,,例,2 軟件開發(fā)人員的薪金,資歷,~,從事專業(yè)工作的年數(shù);管理,~,1,=管理人員,,0,=非管理人員;教育,~,,1,=中學,,2,=大學,,3,=更高程度,建立模型研究薪金與資歷、管理責任、教育程度的關系,分析人事策略的合理性,作為新聘用人員薪金的參考,,編號,,薪金,,資歷,,管理,,教育,,01,,13876,,1,,1,,1,,02,,11608,,1,,0,,3,,03,,18701,,1,,1,,3,,04,,11283,,1,,0,,2,,05,,11767

36、,,1,,0,,3,,編號,,薪金,,資歷,,管理,,教育,,42,,27837,,16,,1,,2,,43,,18838,,16,,0,,2,,44,,17483,,16,,0,,1,,45,,19207,,17,,0,,2,,46,,19346,,20,,0,,1,,46,名軟件開發(fā)人員的檔案資料,,,分析與假設,y~,薪金,,x,1,~,資歷(年),x,2,=,,1,~,管理人員,,x,2,=,,0,~,非管理人員,1,=中學,2,=大學,3,=更高,資歷每加一年薪金的增長是常數(shù);,,管理、教育、資歷之間無交互作用,,教育,線性回歸模型,a,0,,,a,1,, …,,a,4,是待估計的回

37、歸系數(shù),,?,是隨機誤差,中學:,x,3,=1,,x,4,=0,;大學:,x,3,=0,,x,4,=1;,更高:,x,3,=0,,x,4,=0,,模型求解,參數(shù),,參數(shù)估計值,,置信區(qū)間,,a,0,,11032,,[ 10258 11807 ],,a,1,,546,,[ 484 608 ],,a,2,,6883,,[ 6248 7517 ],,a,3,,-2994,,[ -3826 -2162 ],,a,4,,148,,[ -636 931 ],,R,2,=0.957,F,=226,p,=0.000,,R,2,,,F, p,?,模型整體上可用,資歷增加,1,年薪金增

38、長,546,管理人員薪金多,6883,中學程度薪金比更高的少,2994,大學程度薪金比更高的多,148,a,4,置信區(qū)間包含零點,解釋不可靠!,中學:,x,3,=1,,x,4,=0;,大學:,x,3,=0,,x,4,=1;,更高:,x,3,=0,,x,4,=0.,x,2,=,,1,~,管理,,x,2,=,,0,~,非管理,x,1,~,資歷(年),xinjindata.m xinjin1.m,,殘差分析方法,,結果分析,殘差,e,與資歷,x,1,的關系,,e,與管理—教育組合的關系,,殘差全為正,或全為負,管理—教育組合處理不當,,殘差大概分成,3,個水平,,6,種管理—教育組合混在一起,未

39、正確反映,,應在模型中增加管理,x,2,與教育,x,3,,,x,4,的交互項,,組合,,1,,2,,3,,4,,5,,6,,管理,,0,,1,,0,,1,,0,,1,,教育,,1,,1,,2,,2,,3,,3,,管理與教育的組合,,進一步的模型,增加管理,x,2,與教育,x,3,,,x,4,的交互項,參數(shù),,參數(shù)估計值,,置信區(qū)間,,a,0,,11204,,[11044 11363],,a,1,,497,,[486 508],,a,2,,7048,,[6841 7255],,a,3,,-1727,,[-1939 -1514],,a,4,,-348,,[-545 –152],,a,5,

40、,-3071,,[-3372 -2769],,a,6,,1836,,[1571 2101],,R,2,=0.999,F,=554,p,=0.000,,R,2,,,F,有改進,所有回歸系數(shù)置信區(qū)間都不含零點,模型完全可用,,消除了不正?,F(xiàn)象,,異常數(shù)據(jù)(,33,號)應去掉,,e ~ x,1,,e ~,組合,xinjin2.m,,去掉異常數(shù)據(jù)后,的結果,參數(shù),,參數(shù)估計值,,置信區(qū)間,,a,0,,11200,,[11139 11261],,a,1,,498,,[494 503],,a,2,,7041,,[6962 7120],,a,3,,-1737,,[-1818 -1656],,a,4

41、,,-356,,[-431 –281],,a,5,,-3056,,[-3171 –2942],,a,6,,1997,,[1894 2100],,R,2,= 0.9998,F,=36701,p,=0.0000,,e ~ x,1,,e ~,組合,R,2,: 0.957,?,0.999,?,0.9998,,F,: 226,?,,554,?,36701,,置信區(qū)間長度更短,殘差,圖十分正常,最終模型的結果可以應用,xinjin3.m,,模型應用,,制訂,6,種管理—教育組合人員的“基礎”薪金(資歷為,0,),組合,,管理,,教育,,系數(shù),,“基礎”薪金,,1,,0,,1,,a,0,+,a,3,,9

42、463,,2,,1,,1,,a,0,+,a,2,+,a,3,+,a,5,,13448,,3,,0,,2,,a,0,+,a,4,,10844,,4,,1,,2,,a,0,+,a,2,+,a,4,+,a,6,,19882,,5,,0,,3,,a,0,,11200,,6,,1,,3,,a,0,+,a,2,,18241,,中學:,x,3,=1,,x,4,=0,;大學:,x,3,=0,,x,4,=1;,更高:,x,3,=0,,x,4,=0,x,1,=,,0,;,x,2,=,,1,~,管理,,x,2,=,,0,~,非管理,大學程度管理人員比更高程度管理人員的薪金高,,大學程度非管理人員比更高程度非管理人員

43、的薪金略低,,,擬合問題實例,給藥方案 ——,1. 在快速靜脈注射的給藥方式下,研究血藥濃度(單位體積血液中的藥物含量)的變化規(guī)律。,問題,2. 給定藥物的最小有效濃度和最大治療濃度,設計給藥方案 (每次注射劑量, 間隔時間) 。,分析,,t (h) 0.25 0.5 1 1.5 2 3 4 6 8,,c (,?g/ml),19.21 18.15 15.36 14.10 12.89 9.32 7.45 5.24 3.01,實驗:血藥濃度數(shù)據(jù) c(t) (t=0

44、,注射300mg),,半對數(shù)坐標系,(semilogy),下,c,(,t,)的圖形,理論:用一室模型研究血藥濃度變化規(guī)律,負指數(shù)規(guī)律,擬合問題實例,給藥方案 ——,,實驗數(shù)據(jù),t,c,c,0,0,xueyao1.m,,實驗數(shù)據(jù)作圖,,3.血液容積,v,,,t,=0注射劑量,d,, 血藥濃度立即為,d/v,2.藥物排除速率與血藥濃度成正比,比例系數(shù),k,(>0),模型假設,1.機體看作一個房室,室內血藥濃度均勻——一室模型,模型建立,由假設2,由假設3,,給藥方案 設計,設每次注射劑量,D,,,間隔時間,?,血藥濃度,c,(,t,),,應,c,1,?,c,(,t,),?,,c,2,初次劑量,D,

45、0,,應,加大,給藥方案記作,給定,c,1,=10,,c,2,=25,,為確定,只需確定參數(shù),k,v,c,c,2,c,1,0,?,t,,參數(shù)估計,由實驗數(shù)據(jù)擬合曲線,c,(,t,),以估計,k,v,參數(shù)線性化,用實驗數(shù)據(jù)作線性最小二乘擬合,xueyao2.m,,c,1,=10,,c,2,=25,給藥方案 設計,,酶促反應,,問題,研究酶促反應(,酶催化反應),中嘌呤霉素對反應速度與底物,(反應物),濃度之間關系的影響,,建立數(shù)學模型,反映該酶促反應的速度與底物濃度以及經嘌呤霉素處理與否之間的關系,,設計了兩個實驗 :酶經過嘌呤霉素處理;酶未經嘌呤霉素處理。實驗數(shù)據(jù)見下表:,,方案,底物濃度,(

46、ppm),,0.02,,0.06,,0.11,,0.22,,0.56,,1.10,,反應速度,處理,76,47,97,107,123,139,159,152,191,201,207,200,,未處理,67,51,84,86,98,115,131,124,144,158,160,/,,線性化模型,,經嘌呤霉素處理后實驗數(shù)據(jù)的估計結果,,參數(shù),參數(shù)估計值(×10,-3,),置信區(qū)間(×10,-3,),?,1,5.107,[3.539 6.676],?,2,0.247,[0.176 0.319],R,2,=0.8557,F,=59.2975,p,=0.0000,,,對,?,1,,, ?,2,非線

47、性,,對,?,1,,,?,2,線性,,,線性化模型結果分析,,x,較大時,,y,有較大偏差,1/,x,較小時有很好的線性趨勢,,1/,x,較大時出現(xiàn)很大的起落,,參數(shù)估計時,,x,較小,(,1/,x,很大)的數(shù)據(jù)控制了回歸參數(shù)的確定,,1/,y,1/,x,x,y,,[beta,R,J] = nlinfit (x,y,’model’,beta0),beta的置信區(qū)間,MATLAB,統(tǒng)計工具箱,,輸入,,x,~自變量,數(shù)據(jù)矩陣,,y ~因變量數(shù)據(jù)向量,beta,~,參數(shù)的估計值R,~,殘差,J,~,估計預測誤差的Jacobi矩陣,,model,~,模型的函數(shù)M文件名,,beta0,~,給定的參數(shù)初

48、值,,輸出,,betaci =nlparci(beta,R,J),非線性模型參數(shù)估計,function y=f1(beta, x),,y=beta(1)*x./(beta(2)+x);,x= ; y= ;,,beta0=[195.8027 0.04841];,,[beta,R,J]=nlinfit(x,y,’f1’,beta0),;,,betaci=nlparci(beta,R,J);,,beta, betaci,beta~線性化模型估計結果,,非線性模型結果分析,參數(shù),參數(shù)估計值,置信區(qū)間,?,1,212.68,

49、19,[197.2029 228.1609],?,2,0.0641,[0.0457 0.0826 ],畫面左下方的Export 輸出其它統(tǒng)計結果。,拖動畫面的十字線,得,,y,的預測值和預測區(qū)間,剩余標準差,s,= 10.9337,最終反應速度為,,半速度點(,達到最終速度一半時的,x,值,)為,其它輸出,命令nlintool 給出交互畫面,o ~原始數(shù)據(jù),,+ ~ 擬合結果,,,收集一組包含因變量和自變量的數(shù)據(jù);,,選定因變量與自變量之間的模型,利用數(shù)據(jù)按照最小二乘準則計算模型中的系數(shù);,,利用統(tǒng)計分析方法對不同的模型進行比較,找出與數(shù)據(jù)擬合得最好的模型;,,判斷得到的模型是否適合于這組數(shù)據(jù),,,診斷有無不適合回歸模型的異常數(shù)據(jù);,,利用模型對因變量作出預測或解釋。,回歸分析的主要步驟,,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私,請立即通知裝配圖網,我們立即給予刪除!