Конспект лекций по предмету "Геология"


Лекция 6. Математическая статистика

Лекция 6. Математическая статистика



План лекции

6.2. Точечные оценки параметров
6.3. Примеры некоторых распределений



Табл. 6.3

По­стро­им по­ли­гон вы­бо­роч­но­го рас­пре­де­ле­ния (рис. 6.3).

Wi




… x
0 1 8 9 10 11 12 13 14 15

Рис. 6.3

Мо­дой рас­пре­де­ле­ния Мо яв­ля­ет­ся ва­ри­ан­та 11, для ко­то­рой от­но­си­тель­ная час­то­та наи­боль­шая. Ме­диа­на Ме вы­чис­ля­ет­ся по фор­му­ле:
Ме = .

1


0,5



. . . .
0 1 8 9 10 11 12 13 14 15 x
Рис. 6.4
Эм­пи­ри­че­ская функ­ция рас­пре­де­ле­ния (рис. 6.4), со­от­вет­ст­вую­щая по­лу­чен­ной ста­ти­сти­че­ской таб­ли­це рас­пре­де­ле­ния, стро­ит­ся по той же ме­то­ди­ке, что и в теории вероятностей. Она име­ет сту­пен­ча­тый вид: в точ­ках (i = 1, 2,..., 7) име­ют­ся ”скач­ки” ве­ли­чи­ной Wi , при­чём = 0 для x < и = 1 для x > .
П р и м е р № 2. Из­ме­ре­ния тол­щи­ны (в мм) слю­дя­ных про­кла­док да­ли сле­дую­щие ре­зуль­та­ты: 0,042; 0,030; 0,039; 0,031; 0,042; 0,034; 0,036; 0,030; 0,033; 0,024; 0,031; 0,040; 0,031; 0,033; 0,031; 0,022; 0,031; 0,034; 0,027; 0,032; 0,048; 0,030; 0,026; 0,031; 0,043; 0,030; 0,033; 0,028; 0,028; 0,032; 0,039; 0,031; 0,034; 0,031; 0,035; 0,037; 0,025; 0,029; 0,027; 0,031; 0,028; 0,030; 0,029; 0,045; 0,033; 0.046; 0,036; 0,049; 0,021; 0,037. По­стро­ить гис­то­грам­му.
Р е ш е­ н и е. Объ­ём вы­бор­ки ра­вен n = 50. Сгруп­пи­ру­ем дан­ные в ин­тер­ва­лы, чис­ло ко­то­рых най­дём по фор­му­ле: k = log250 + 1 = 6,6. Ок­руг­лим это чис­ло до бли­жай­ше­го це­ло­го, пре­вы­шаю­ще­го по­лу­чен­ное: k = 7. По­сколь­ку раз­мах вы­бор­ки ра­вен xmax – xmin = 0,049 – 0,021 = 0,028 мм, то ка­ж­дый из ин­тер­ва­лов со­став­ля­ет 0,004 мм. По­счи­та­ем, сколь­ко из­ме­рен­ных зна­че­ний по­па­ло в со­от­вет­ст­вую­щие ин­тер­ва­лы, и со­ста­вим ста­ти­сти­че­скую таб­ли­цу рас­пре­де­ле­ния груп­пи­ро­ван­ных дан­ных (табл. 6.4), до­пол­нив её не­об­хо­ди­мой для по­строе­ния гис­то­грам­мы стро­кой, со­дер­жа­щей зна­че­ния (по ус­ло­вию Dx = 0,004).
За­ме­тим, что объ­ем вы­бор­ки .
В ка­че­ст­ве ва­ри­ант возь­мём се­ре­ди­ны про­ме­жут­ков:


Dхi
[0.021- 0.025)
[0.025-0.029)
[0.029-0.033)
[0.033-0.037)
[0.037-0.041)
[0.041-0.045)
[0.045-0.049]
Wi
3/50
7/50
18/50
10/50
5/50
3/50
4/50
Wi/Dx








Табл. 6.4
Wi /Dx





0,021 0,025 … 0,049 х

Рис. 6.5


Гис­то­грам­ма, со­от­вет­ст­вую­щая по­лу­чен­ной ста­ти­сти­че­ской таб­ли­це, изо­бра­же­на на рис. 6.5. Она яв­ля­ет­ся ана­ло­гом плот­но­сти ве­ро­ят­но­сти слу­чай­ной не­пре­рыв­ной ве­ли­чи­ны Х - тол­щи­ны слю­дя­ной про­клад­ки.


6.2. Точечные оценки параметров

Пусть име­ет­ся вы­бор­ка (x1, x2, ... , xn) из не­ко­то­рой ге­не­раль­ной со­во­куп­но­сти. За­пи­сав не­кое ма­те­ма­ти­че­ское вы­ра­же­ние, со­дер­жа­щее эти зна­че­ния, по­лу­чим функ­цию вы­бор­ки Zn (x1, x2, ... , xn), ко­то­рая са­ма бу­дет слу­чай­ной ве­ли­чи­ной в силу того, что в выборку отбираются случайные элементы из генеральной совокупности. На­при­мер, мож­но рас­смот­реть сред­нее ариф­ме­ти­че­ское зна­че­ние вы­бор­ки (ана­лог ма­те­ма­ти­че­ско­го ожи­да­ния в тео­рии ве­ро­ят­но­стей), ко­то­рое на­зы­ва­ет­ся вы­бо­роч­ным сред­ним: ( x1+ x2+...+ xn ) / n. Раз­брос же зна­че­ний в вы­бор­ке мож­но ха­рак­те­ри­зо­вать ис­прав­лен­ной вы­бо­роч­ной дис­пер­си­ей: .
За­да­ча оцен­ки не­из­вест­но­го па­ра­мет­ра l (на­при­мер, М(Х) или D(Х)), который как-либо связан с ге­не­раль­ной со­во­куп­но­стью, порождённой функцией распределения случайной величины Х, на ос­но­ва­нии по­лу­чен­ной вы­бор­ки (х1, х2, ..., хn), оз­на­ча­ет сле­дую­щее. На­до за­дать (при­ду­мать!) та­кую функ­цию вы­бор­ки Zn, реа­ли­за­ция ко­то­рой Zn = Z(х1, х2, ..., хn) в не­ко­то­ром смыс­ле мог­ла бы рас­смат­ри­вать­ся как «хо­ро­шее» при­бли­жен­ное зна­че­ние па­ра­мет­ра l, т.е. должно выполняться условие l » Zn .
Та­кая функ­ция вы­бор­ки Zn = Z(х1, х2, ..., хn) на­зы­ва­ет­ся то­чеч­ной оцен­кой па­ра­мет­ра l. Реа­ли­зо­вав­шее­ся зна­че­ние функ­ции вы­бор­ки Zn бу­дем на­зы­вать вы­бо­роч­ным (или эм­пи­ри­че­ским) зна­че­ни­ем па­ра­мет­ра l.
То­чеч­ная оцен­ка Zn = Z(х1, х2, ..., хn) па­ра­мет­ра l на­зы­ва­ет­ся не­сме­щен­ной, ес­ли М(Zn) = l.
То­чеч­ная оцен­ка Zn па­ра­мет­ра l на­зы­ва­ет­ся со­стоя­тель­ной, ес­ли Р(|Zn - l| < e) ® 1, при n ® ¥, где e - сколь угод­но ма­лое по­ло­жи­тель­ное чис­ло. То есть со­стоя­тель­ность оцен­ки оз­на­ча­ет, что при очень большой выборке и сколь угод­но ма­лом e > 0, ве­ро­ят­ность со­бы­тия (| Zn - l| < e) сколь угод­но близ­ка к 1.
Нас бу­дут ин­те­ре­со­вать оцен­ки Р(Х = А) - ве­ро­ят­но­сти со­бы­тия А, ма­те­ма­ти­че­ско­го ожи­да­ния М(Х), дис­пер­сии D(Х) и ко­эф­фи­ци­ен­та кор­ре­ля­ции Gxy. Ос­нов­ные тре­бо­ва­ния, предъ­яв­ляе­мые к их оцен­кам, со­сто­ят в не­сме­щён­но­сти и со­стоя­тель­но­сти.
Мы бу­дем ис­поль­зо­вать сле­дую­щие оцен­ки че­ты­рех, пе­ре­чис­лен­ных вы­ше па­ра­мет­ров М(Х), D(Х), Р(Х = А), Gху:
1) - вы­бо­роч­ное сред­нее;
2) - исправленная вы­бо­роч­ная дис­пер­сия;
3)- час­то­та со­бы­тия А, где , ес­ли со­бы­тие А про­изош­ло в i - ом опы­те, и , ес­ли оно не про­изош­ло. Ве­ли­чи­ну мож­но рас­смат­ри­вать как оцен­ку ве­ро­ят­но­сти Р в схе­ме ис­пы­та­ний Бер­нул­ли.
Ес­ли в ге­не­раль­ной со­во­куп­но­сти со­дер­жит­ся две ин­те­ре­сую­щие нас слу­чай­ные ве­ли­чи­ны Х и Y, то­ вы­бор­ка объ­е­ма n со­сто­ит из по­сле­до­ва­тель­но­сти пар В этом слу­чае оцен­ка ко­эф­фи­ци­ен­та кор­ре­ля­ции слу­чай­ных ве­ли­чин Х и Y про­из­во­дит­ся по фор­му­ле:
где

Мож­но дока­зать, что при­ве­ден­ные вы­ше оцен­ки являются не­сме­щён­ными и со­стоя­тель­ными то­чеч­ными оце­нками.
При­ве­ден­ные фор­му­лы для вы­чис­ле­ния со­от­вет­ст­ву­ют не груп­пи­ро­ван­ным вы­бор­кам. Ес­ли про­ве­де­на груп­пи­ров­ка вы­бор­ки объ­е­ма n и по­лу­че­на ста­ти­сти­че­ская таб­ли­ца в виде табл. 6.2, то рас­чет про­во­дят по фор­му­лам:

З а м е ч а н и е. На прак­ти­ке час­то поль­зу­ют­ся для оцен­ки дис­пер­сии D(X) выборочной дисперсией . Но оказывается оценкой смещённой, т.е. М() ¹ D(X). При боль­ших зна­че­ни­ях n зна­че­ния исправленной выборочной дисперсии и выборочной дисперсии прак­ти­че­ски сов­па­да­ют . Поэтому при не­боль­ших объ­е­мах вы­бор­ки луч­ше ис­поль­зо­вать оцен­ку , которую получают по формуле . А про то­чеч­ную оценку можно сказать, что она яв­ля­ет­ся не­сме­щен­ной толь­ко асим­пто­ти­че­ски (при n >> 1).
З а д а ч а. Вернёмся к вы­бор­ке для тол­щи­ны слю­дя­ных про­кладо­к, при­ве­ден­ной в при­ме­ре № 2 п.6.1. Необходимо найти оцен­ки па­ра­мет­ров М(Х), D(Х) и - ма­те­ма­ти­че­ско­го ожи­да­ния, дис­пер­сии и сред­не­квад­ра­ти­че­ско­го от­кло­не­ния для тол­щи­ны слю­дя­ной про­клад­ки.
Р е ш е н и е. Вначале вы­чис­ля­ем вы­бо­роч­ное сред­нее:
= (0,023 × 3 + 0,027 × 7 + 0,031 × 18 + 0,035 × 10 + 0,039 × 5 + 0,043 × 3 + 0,047 × 4)/50 =
= 0,03356 мм.
Теперь находим выборочную дисперсию:=
= (0,0232 × 3 + 0,0272 × 7 + 0,0312 × 18 + 0,0352 × 10 + 0,0392 × 5 + 0.0432 × 3 +
+ 0,0472 × 4) / 50 – 0,033562 = 3,82464 × 10-5 мм2.
Исправленная выборочная дисперсия легко находится:
= × 3,82464 × 10-5 = 3,9027 × 10-5 мм 2.
Выборочное среднеквадратическое отклонение толщины прокладки равно

Из-за того, что в группированной выборке участвуют уже только середины интервалов разбиения, груп­пи­ровка вы­бор­ки приводит к некоторой потере ин­фор­ма­ции, содержащейся в исходной выборке. Поэтому, исходя из опыта, объ­ем вы­бор­ки n берут достаточно большим (не менее нескольких десятков), а чис­ло ин­тер­ва­лов раз­бие­ния k – в пределах от 5 до 15. В этом случае раз­ни­ца в оцен­ках па­ра­мет­ров рас­пре­де­ле­ния, по­лу­чен­ных по груп­пи­ро­ван­ной и не груп­пи­ро­ван­ной вы­бор­кам, оказывается не­зна­чи­тель­ной. Так, в только что рассмотренном примере оценки М(Х) и s, вы­чис­лен­ные по груп­пи­ро­ван­ной вы­бор­ке, оказались рав­ными: А ес­ли вы­бор­ку не груп­пи­ро­вать, то для оценок М(Х) и s получатся соответственно значения 0,0331 мм и 6,25 мк, что весьма незначительно отличается от значений оценок по группированной выборке.
З а м е ч а н и е. В случае малых или, наоборот, больших значений для упрощения вычисления по­лез­но ис­поль­зо­вать фор­му­лу, позволяющую оперировать с привычными числами:
,
где чис­ла C1 и C вы­би­ра­ются, ис­хо­дя из удобств вы­чис­ле­ний.
На­при­мер, вы­чис­ле­ние в предыдущем при­ме­ре проще осу­ще­ст­вить по формуле: .
В за­клю­че­ние от­ме­тим, что воз­мож­ность вы­чис­ле­ния зна­че­ний пре­ду­смот­ре­на в “инженерных” и “научных” каль­ку­ля­то­рах.

6.3. Примеры некоторых распределений

В лекции 2 описано нор­маль­ное рас­пре­де­ле­ни­е слу­чай­ной непрерывной ве­ли­чи­ны. Плот­ность ве­ро­ят­но­сти нор­маль­но­го рас­пре­де­ле­ния величины Х, имеющей математическое ожидание М(Х) = а и дисперсию D(Х) = s2 име­ет вид
.
Мно­же­ст­во нор­маль­но рас­пре­де­лен­ных слу­чай­ных ве­ли­чин с па­ра­мет­ра­ми а и s2 обо­зна­ча­ет­ся N(а, s2). В тео­рии ве­ро­ят­но­стей до­ка­зы­ва­ет­ся, что сум­ма нор­маль­но рас­пре­де­лен­ных слу­чай­ных ве­ли­чин име­ет нор­маль­ное рас­пре­де­ле­ние. По­это­му слу­чай­ная ве­ли­чи­на , где - не­за­ви­си­мые слу­чай­ные ве­ли­чи­ны, будет нор­маль­но рас­пре­де­ле­на с па­ра­мет­ра­ми а и . Иными словами,
З а м е ч а н и е. Ра­вен­ст­ва бы­ли по­лу­че­ны в конце п. 6.3 (задача № 2).
Пусть (х1, х2, ..., хn) - ма­те­ма­ти­че­ская вы­бор­ка из ге­не­раль­ной со­во­куп­но­сти, по­ро­ж­ден­ной рас­пре­де­ле­ни­ем или из ге­не­раль­ной со­во­куп­но­сти, об­ра­зо­ван­ной не­за­ви­си­мы­ми слу­чай­ны­ми ве­ли­чи­на­ми с ма­те­ма­ти­че­ским ожи­да­ни­ем а и дис­пер­си­ей . То­гда мож­но до­ка­зать несколько сле­дую­щих утверждений.
1. Слу­чай­ная ве­ли­чи­на име­ет стан­дар­ти­зи­ро­ван­ное нор­маль­ное рас­пре­де­ле­ние N(0; 1) или асим­пто­ти­че­ски стан­дар­ти­зи­ро­ван­ное нор­маль­ное рас­пре­де­ле­ние, плот­ность ве­ро­ят­но­сти ко­то­ро­го .
В п. 2.6.2.2 было показано, что ес­ли x > 0, то , где - функ­ция Ла­п­ла­са. Для лю­бо­го име­ем
.
Заметим, что функция - чётная: , а функция Лапласа – нечётная: .
Таб­ли­цы зна­че­ний функ­ций и для x > 0 при­во­дят­ся в Приложении (табл. 1 и 2).
2. Рас­смот­рим схе­му ис­пы­та­ний Бер­нул­ли, где в ка­ж­дом из n опы­тов со­бы­тие А реа­ли­зу­ет­ся с ве­ро­ят­но­стью р. Вве­дём слу­чай­ные ве­ли­чи­ны: хi = 1, ес­ли в i-ом опы­те про­изош­ло со­бы­тие А, и хi = 0, ес­ли в i-ом опы­те со­бы­тие А не про­изош­ло. Об­ра­зу­ем слу­чай­ную ве­ли­чи­ну .
До­ка­зы­ва­ет­ся, что слу­чай­ная ве­ли­чи­на име­ет асим­пто­ти­че­ски стан­дар­ти­зи­ро­ван­ное рас­пре­де­ле­ние, т.е. при дос­та­точ­но боль­шом числе опытов .
3. Слу­чай­ная ве­ли­чи­на , где , на­зы­ва­ет­ся ­от­но­ше­ни­ем Стью­ден­та с (n - 1) сте­пе­нью сво­бо­ды. Поясним последнее обстоятельство. Ве­ли­чи­на Т за­ви­сит от слу­чай­ных ве­ли­чин (в силу того, что ) и S, т.е. Т за­ви­сит от (n + 1) слу­чай­ной ве­ли­чи­ны. Но сре­ди этих слу­чай­ных ве­ли­чин есть две функ­цио­наль­ные свя­зи: и . Поэтому не­за­ви­си­мых слу­чай­ных ве­ли­чин, уча­ст­вую­щих в фор­ми­ро­ва­нии слу­чай­ной ве­ли­чи­ны Т, бу­дет , что и является её числом степеней свободы.
За­ме­тим, что в тео­рии ве­ро­ят­но­стей до­ка­зы­ва­ет­ся, что и S - не­за­ви­си­мые слу­чай­ные ве­ли­чи­ны.
Обо­зна­чим плот­ность ве­ро­ят­но­сти слу­чай­ной ве­ли­чи­ны Т с сте­пе­ня­ми сво­бо­ды че­рез . Рас­пре­де­ле­ние ве­ли­чи­ны Т на­зы­ва­ет­ся рас­пре­де­ле­ни­ем Стью­ден­та с k сте­пе­ня­ми сво­бо­ды. Из­вест­но, что эта плот­ность ве­ро­ят­но­сти – функция чётная: , а также, что .
Таб­ли­цы при за­дан­ных зна­че­ни­ях m, g, a для оп­ре­де­ле­ния зна­че­ний x > 0, удов­ле­тво­ряю­щих ра­вен­ст­вам
и ,
при­во­дят­ся в Приложении (табл.4).
4. Слу­чай­ная ве­ли­чи­на име­ет рас­пре­де­ле­ние Стью­ден­та с числом сте­пе­ней сво­бо­ды m = n - 2, ес­ли . Здесь - ко­эф­фи­ци­ент кор­ре­ля­ции слу­чай­ных ве­ли­чин X и Y, а - его вы­бо­роч­ное значение, рав­ное .
5. Слу­чай­ная ве­ли­чи­на име­ет рас­пре­де­ле­ниехи-квад­рат с m = n - 1 сте­пе­нью сво­бо­ды. Обо­зна­чим плот­ность ве­ро­ят­но­сти ве­ли­чи­ны c2 как . То­гда для x > 0 име­ем

Ес­ли , то вероятность случайной величине принять значение между х1 и х2 равна

Таб­ли­ца при за­дан­ных па­ра­мет­рах m = n – 1, 0 < a < 1 для зна­че­ний х, удов­ле­тво­ряю­щих ра­вен­ст­ву , при­во­дит­ся в Приложении (табл. 5).
Математическое ожидание и дисперсия для хи-квадрат распределения равны ; мо­да рас­пре­де­ле­ния, т.е. значение варианты, для которой плот­ность ве­ро­ят­но­сти максимальна, равна xо = m – 2.
Таб­ли­цы для оп­ре­де­ле­ния х, удов­ле­тво­ряю­ще­го урав­не­нию , обыч­но при­во­дят­ся для числа степеней свободы m в диапазоне: . Ес­ли же m > 30, то ис­поль­зу­ет­ся тот факт, что случайная величина рас­пре­де­ле­на асим­пто­ти­че­ски нормально, т.е. Î , m >> 1. Это по­зво­ля­ет по­лу­чить при­бли­жен­ное ре­ше­ние урав­не­ния в ви­де , где Ka - кван­тиль порядка a нор­маль­но­го стан­дар­ти­зи­ро­ван­но­го рас­пре­де­ле­ния (квантиль порядка a случайной величины Х определяется как корень уравнения F(Ka) = , что нормальной случайной величины выглядит так: , где - функ­ция Ла­п­ласа). Ес­ли ве­ли­чи­на a близ­ка к 0 или 1, то сле­ду­ет поль­зо­вать­ся при­бли­же­ни­ем .
З а д а ч а № 1 . Най­ти зна­че­ние х, удов­ле­тво­ряю­щее урав­не­нию
, где m = 100, a = 0,01.
Р е ш е н и е . Т.к. чис­ло сте­пе­ней сво­бо­ды m = 100 > 30, то ис­поль­зо­вать таб­л. 5 нель­зя. Вос­поль­зу­ем­ся фор­му­лой , где Кa - ко­рень урав­не­ния , т.е. . По таб­л. 2 зна­че­ний функ­ции Ла­п­лас­а Ф(х) по­лу­чим: (-Кa) = 2,33, т.е. Кa = -2,33. Затем вы­чис­ля­ем .
Ес­ли же вос­поль­зо­вать­ся фор­му­лой , то по­лу­чим . Т.е. оба при­бли­же­ния да­ют практически одинаковые зна­че­ния х: 69,3 и 70.
З а д а ч а № 2. В предыдущем примере возьмём a = 0,001 и найдём х.
Р е ш е н и е . Зна­че­ние х сле­дую­щее: , где ве­ли­чи­на Кa удов­ле­тво­ря­ет урав­не­нию . По таб­л.2 находим: (-Кa) = 3,08, т.е. Кa = - 3,08, и по­это­му
.
Фор­му­ла да­ет зна­че­ние
.
Итак, с умень­ше­ни­ем ве­ро­ят­но­сти a от 0,01 до 0,001 раз­ни­ца между ис­ко­мыми зна­че­ниями х, вы­чис­лен­ными по двум разным фор­му­лам: и , уве­ли­чи­лась, хо­тя оба при­бли­же­ния и да­ют близ­кие ре­зуль­та­ты (60,8 и 62).


К началу К следующей лекции



К приложению К содержанию К титулу


Не сдавайте скачаную работу преподавателю!
Данный конспект лекций Вы можете использовать для создания шпаргалок и подготовки к экзаменам.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем конспект самостоятельно:
! Как написать конспект Как правильно подойти к написанию чтобы быстро и информативно все зафиксировать.