一、考試要求
1.熟悉區(qū)間估計(jì) (包括置信水平、且信區(qū)間)的概念
2.熟悉正態(tài)總體均值、方差和標(biāo)準(zhǔn)差的置信區(qū)間的求法
3.了解比率p的置信區(qū)間 (大樣本場(chǎng)合)的求法
二、 內(nèi)容講解
第四節(jié) 參數(shù)估計(jì)(續(xù))
二、區(qū)間估計(jì)
(一) 區(qū)間估計(jì)的概念
點(diǎn)估計(jì)僅僅給出參數(shù)一個(gè)具體的估計(jì)值,但是沒(méi)有給出估計(jì)的精度,而區(qū)間估計(jì)是用一個(gè)區(qū)間來(lái)對(duì)未知參數(shù)進(jìn)行估計(jì),區(qū)間估計(jì)體現(xiàn)了估計(jì)的精度。
設(shè) 是總體的一個(gè)待估參數(shù),其一切可能取值組成的參數(shù)空間為 ,記從總體中獲得樣本量為n的樣本為 ,對(duì)給定的 ,確定兩個(gè)統(tǒng)計(jì)量:
與
若對(duì)任意 ∈ 有P( ≤ ≤ )≥l- ,則稱(chēng)隨機(jī)區(qū)間[ , ]是 的置信水平為l- 的置信區(qū)間,簡(jiǎn)稱(chēng)[ , ]是 的l- 的置信區(qū)間, 與 分別稱(chēng)為 的l- 的置信下限與置信上限。
置信區(qū)間的含義是:所構(gòu)造的隨機(jī)區(qū)間 覆蓋(蓋住)未知參數(shù) 的概率為 。由于這個(gè)隨機(jī)區(qū)間隨樣本觀測(cè)值的不同而不同,它有時(shí)覆蓋了參數(shù) ,有時(shí)沒(méi)有覆蓋 ,但是用這種方法做區(qū)間估計(jì)時(shí),100次中大約有100( )個(gè)區(qū)間能覆蓋未知參數(shù) 。圖1.4-1中每一條豎線(xiàn)表示由一個(gè)樣本量為4的樣本按給定的 與 求得的一個(gè)區(qū)間。重復(fù)抽取100個(gè)樣本,就得到100個(gè)這樣的區(qū)間,在( )中,100個(gè)區(qū)間有51個(gè)包含(覆蓋了)參數(shù)真值=50000,這對(duì)50%的置信區(qū)間來(lái)說(shuō)是一個(gè)合理的偏離;在( )中,100個(gè)區(qū)間有90個(gè)包含參數(shù)真值=50000,這與90%的置信區(qū)間一致。
如果P( < )=P( > )= /2,則稱(chēng)這種置信區(qū)間為等尾置信區(qū)間。
下面著重討論正態(tài)總體參數(shù)的置信區(qū)間及比例p的置信區(qū)間,它們都是等尾置信區(qū)間。
(二)正態(tài)總體參數(shù)的置信區(qū)間
設(shè)總體分布為 ,從中抽取的樣本記為 ,樣本均值為 ,樣本方差為 ,樣本標(biāo)準(zhǔn)差為s。
(1)總體均值 的置信區(qū)間的求法: 的估計(jì)一般用樣本均值 ,從 的分布來(lái)構(gòu)造置信區(qū)間。
當(dāng)總體標(biāo)準(zhǔn)差 已知時(shí),利用正態(tài)分布可得 的l- 置信區(qū)間為:
,
今后也記為 ,其中 是標(biāo)準(zhǔn)正態(tài)分布的 分位數(shù)。
當(dāng)總體標(biāo)準(zhǔn)差 未知時(shí), 用其估計(jì)s代替,利用t分布可以得到 的l- 置信區(qū)間為:
其中 表示自由度是n-l的t分布的 分位數(shù)。
(2)總體方差 與標(biāo)準(zhǔn)差 的置信區(qū)間的求法: 的估計(jì)常用樣本方差 ,因此從 的分布來(lái)構(gòu)造置信區(qū)間。
利用 (n-1)分布可以得到 的l- 置信區(qū)間為:
將上式兩邊開(kāi)平方,可得 的l- 置信區(qū)間為:
以上討論總結(jié)如下表1.4-2中,可供選用。
[例1.4-7] 某溶液中的甲醛濃度服從正態(tài)分布,從中抽取一個(gè)樣本量為4的樣本,求得 ,樣本標(biāo)準(zhǔn)差為 ,分別求正態(tài)均值 及標(biāo)準(zhǔn)差 的95%的置信區(qū)間。
解:先求正態(tài)均值 的置信區(qū)間,由于 未知,故采用 分布來(lái)求。
, ,又 , ,查附表1-4得 ,從而正態(tài)均值 的95%的置信區(qū)間為:
再求 的置信區(qū)間。由于 , ,查附表1-5得: , ,則正態(tài)標(biāo)準(zhǔn)差 的95%的置信區(qū)間為:
[例1.4-8] 設(shè)一個(gè)物體的重量 未知,為估計(jì)其重量,用天平去稱(chēng),所得稱(chēng)重(測(cè)量值)與實(shí)際重量間是有誤差的,因此所得的稱(chēng)重是一個(gè)隨機(jī)變量,通常服從正態(tài)分布。如果已知稱(chēng)量的誤差的標(biāo)準(zhǔn)差為0.1克(根據(jù)天平的精度給出),為使 的95%的置信區(qū)間的長(zhǎng)度不超過(guò)0.1,那么至少應(yīng)該稱(chēng)多少次?
解:這是估計(jì)樣本量的問(wèn)題。在 已知時(shí), 的95%的置信區(qū)間為:
其中 ,置信區(qū)間的長(zhǎng)度是:
為使它不超過(guò)0.1,可解不等式 ,得 ,即至少應(yīng)稱(chēng)16次。
(三)比例p的置信區(qū)間
比例p的嚴(yán)格的置信區(qū)間的求法相當(dāng)繁瑣,這里僅給出大樣本情況下根據(jù)中心極限定理的正態(tài)近似的結(jié)果。
設(shè)總體 ,樣本為 ,樣本值之和為k,樣本均值為 =k/n,這便是p的點(diǎn)估計(jì),在樣本量n較大時(shí),由于 的近似分布為N(p,p(1-p)/n),因此p的l- 置信區(qū)間為:
(1.4-2)
其中 是標(biāo)準(zhǔn)正態(tài)分布的 分位數(shù)。
[例1.4-9] 在某電視節(jié)目的收視率調(diào)查中,隨機(jī)調(diào)查了400人,其中100人收看了該節(jié)目,試對(duì)該節(jié)目收視率p作置信水平為0.95的區(qū)間估計(jì)。
解:n=400, =100/400=0.25,在 =0.05時(shí), ,由此得p的置信水平0.95的置信區(qū)間為:
即[0.2076,0.2924]。
1.熟悉區(qū)間估計(jì) (包括置信水平、且信區(qū)間)的概念
2.熟悉正態(tài)總體均值、方差和標(biāo)準(zhǔn)差的置信區(qū)間的求法
3.了解比率p的置信區(qū)間 (大樣本場(chǎng)合)的求法
二、 內(nèi)容講解
第四節(jié) 參數(shù)估計(jì)(續(xù))
二、區(qū)間估計(jì)
(一) 區(qū)間估計(jì)的概念
點(diǎn)估計(jì)僅僅給出參數(shù)一個(gè)具體的估計(jì)值,但是沒(méi)有給出估計(jì)的精度,而區(qū)間估計(jì)是用一個(gè)區(qū)間來(lái)對(duì)未知參數(shù)進(jìn)行估計(jì),區(qū)間估計(jì)體現(xiàn)了估計(jì)的精度。
設(shè) 是總體的一個(gè)待估參數(shù),其一切可能取值組成的參數(shù)空間為 ,記從總體中獲得樣本量為n的樣本為 ,對(duì)給定的 ,確定兩個(gè)統(tǒng)計(jì)量:
與
若對(duì)任意 ∈ 有P( ≤ ≤ )≥l- ,則稱(chēng)隨機(jī)區(qū)間[ , ]是 的置信水平為l- 的置信區(qū)間,簡(jiǎn)稱(chēng)[ , ]是 的l- 的置信區(qū)間, 與 分別稱(chēng)為 的l- 的置信下限與置信上限。
置信區(qū)間的含義是:所構(gòu)造的隨機(jī)區(qū)間 覆蓋(蓋住)未知參數(shù) 的概率為 。由于這個(gè)隨機(jī)區(qū)間隨樣本觀測(cè)值的不同而不同,它有時(shí)覆蓋了參數(shù) ,有時(shí)沒(méi)有覆蓋 ,但是用這種方法做區(qū)間估計(jì)時(shí),100次中大約有100( )個(gè)區(qū)間能覆蓋未知參數(shù) 。圖1.4-1中每一條豎線(xiàn)表示由一個(gè)樣本量為4的樣本按給定的 與 求得的一個(gè)區(qū)間。重復(fù)抽取100個(gè)樣本,就得到100個(gè)這樣的區(qū)間,在( )中,100個(gè)區(qū)間有51個(gè)包含(覆蓋了)參數(shù)真值=50000,這對(duì)50%的置信區(qū)間來(lái)說(shuō)是一個(gè)合理的偏離;在( )中,100個(gè)區(qū)間有90個(gè)包含參數(shù)真值=50000,這與90%的置信區(qū)間一致。
如果P( < )=P( > )= /2,則稱(chēng)這種置信區(qū)間為等尾置信區(qū)間。
下面著重討論正態(tài)總體參數(shù)的置信區(qū)間及比例p的置信區(qū)間,它們都是等尾置信區(qū)間。
(二)正態(tài)總體參數(shù)的置信區(qū)間
設(shè)總體分布為 ,從中抽取的樣本記為 ,樣本均值為 ,樣本方差為 ,樣本標(biāo)準(zhǔn)差為s。
(1)總體均值 的置信區(qū)間的求法: 的估計(jì)一般用樣本均值 ,從 的分布來(lái)構(gòu)造置信區(qū)間。
當(dāng)總體標(biāo)準(zhǔn)差 已知時(shí),利用正態(tài)分布可得 的l- 置信區(qū)間為:
,
今后也記為 ,其中 是標(biāo)準(zhǔn)正態(tài)分布的 分位數(shù)。
當(dāng)總體標(biāo)準(zhǔn)差 未知時(shí), 用其估計(jì)s代替,利用t分布可以得到 的l- 置信區(qū)間為:
其中 表示自由度是n-l的t分布的 分位數(shù)。
(2)總體方差 與標(biāo)準(zhǔn)差 的置信區(qū)間的求法: 的估計(jì)常用樣本方差 ,因此從 的分布來(lái)構(gòu)造置信區(qū)間。
利用 (n-1)分布可以得到 的l- 置信區(qū)間為:
將上式兩邊開(kāi)平方,可得 的l- 置信區(qū)間為:
以上討論總結(jié)如下表1.4-2中,可供選用。
[例1.4-7] 某溶液中的甲醛濃度服從正態(tài)分布,從中抽取一個(gè)樣本量為4的樣本,求得 ,樣本標(biāo)準(zhǔn)差為 ,分別求正態(tài)均值 及標(biāo)準(zhǔn)差 的95%的置信區(qū)間。
解:先求正態(tài)均值 的置信區(qū)間,由于 未知,故采用 分布來(lái)求。
, ,又 , ,查附表1-4得 ,從而正態(tài)均值 的95%的置信區(qū)間為:
再求 的置信區(qū)間。由于 , ,查附表1-5得: , ,則正態(tài)標(biāo)準(zhǔn)差 的95%的置信區(qū)間為:
[例1.4-8] 設(shè)一個(gè)物體的重量 未知,為估計(jì)其重量,用天平去稱(chēng),所得稱(chēng)重(測(cè)量值)與實(shí)際重量間是有誤差的,因此所得的稱(chēng)重是一個(gè)隨機(jī)變量,通常服從正態(tài)分布。如果已知稱(chēng)量的誤差的標(biāo)準(zhǔn)差為0.1克(根據(jù)天平的精度給出),為使 的95%的置信區(qū)間的長(zhǎng)度不超過(guò)0.1,那么至少應(yīng)該稱(chēng)多少次?
解:這是估計(jì)樣本量的問(wèn)題。在 已知時(shí), 的95%的置信區(qū)間為:
其中 ,置信區(qū)間的長(zhǎng)度是:
為使它不超過(guò)0.1,可解不等式 ,得 ,即至少應(yīng)稱(chēng)16次。
(三)比例p的置信區(qū)間
比例p的嚴(yán)格的置信區(qū)間的求法相當(dāng)繁瑣,這里僅給出大樣本情況下根據(jù)中心極限定理的正態(tài)近似的結(jié)果。
設(shè)總體 ,樣本為 ,樣本值之和為k,樣本均值為 =k/n,這便是p的點(diǎn)估計(jì),在樣本量n較大時(shí),由于 的近似分布為N(p,p(1-p)/n),因此p的l- 置信區(qū)間為:
(1.4-2)
其中 是標(biāo)準(zhǔn)正態(tài)分布的 分位數(shù)。
[例1.4-9] 在某電視節(jié)目的收視率調(diào)查中,隨機(jī)調(diào)查了400人,其中100人收看了該節(jié)目,試對(duì)該節(jié)目收視率p作置信水平為0.95的區(qū)間估計(jì)。
解:n=400, =100/400=0.25,在 =0.05時(shí), ,由此得p的置信水平0.95的置信區(qū)間為:
即[0.2076,0.2924]。