Какова цель наблюдений над случайной величиной; для чего используются результаты наблюдений; где, как и для чего применить возможности теории вероятностей и прикладной статистики? Ответы на эти, простые с виду, вопросы зависят от многих факторов, обстоятельств и не всегда оказываются конкретными.
Попытаемся всё же сформулировать ответ применительно к конкретной обстановке – при статистических расчетах в экономических системах.
В таких системах основные числовые показатели “жизни” системы в целом и отдельных её элементов можно свести к трем разновидностям:
· продукция, с конкретными ее показателями (вес, объем, количество и т.д.), – величинами на шкале Int или Rel;
· деньги, с единицей измерения по шкале Int или Rel (отрицательные величины обычно означают убытки или долги);
· информация, с несколькими шкалами измерений – в битах (байтах) для количественного описания по шкале Int или в виде сообщений о событиях на шкалах Nom или Ord.
Простые размышления приводят к мысли о возможности допустить, что все эти величины являются, во-первых, случайными и, во-вторых, дискретными. Ясно также, что без учета всех этих величин эффективной экономики быть не может – только знание всех этих показателей позволит управлять экономикой.
Конечно, у многих из вас уже готово решение проблемы – раз уж мы не знаем точно значение величины (скажем – суммы прибыли), так воспользуемся её математическим ожиданием! Это верная мысль…
Но для вычисления математического ожидания надо знать закон распределения вероятностей, т.е. иметь информацию
· обо всех допустимых (возможных) значениях прибыли;
· о соответствующих им значениях вероятностей.
Рассмотрим простейший пример. Пусть у нас есть всего четыре наблюдения над суммой G дневной выручки в 196, 208, 210 и 214 гривен. Легко подсчитать среднее значение – оно составит 207 гривен. Какое доверие к этой цифре? Ведь мы совершенно ничего не знаем о законе распределения СВ, кроме того, что эта величина дискретная и имеет относительную шкалу. Тем не менее, кое–что полезное из таких скудных наблюдений (малой выборки) можно извлечь.
Поступим следующим образом – вместо случайной величины G будем рассматривать другую величину U= (G–M(G)). Математическое ожидание новой СВ будет всегда равно нулю – какие бы гипотезы о значении M(G) мы ни выдвигали,
Теперь подумаем о том, как сформулировать нулевую гипотезу. Вроде бы это надо делать так:
Њ0: дневная выручка имеет некоторый закон распределения
с математическим ожиданием в M(G)=207 гривен.
Теперь результаты наблюдений над выручкой G можно представить в виде четырех наблюдений над U: –11,+1,+3,+7. Теория математической статистики предлагает следующий, т.н. биномиальный критерий проверки гипотез в подобных ситуациях.
Предполагается, что распределение вероятностей наблюдаемой величины U симметрично относительно значения математического ожидания, т.е. относительно нуля.
Далее предлагается рассматривать N имеющихся у нас значений U как совокупность случайных величин, принимающих с вероятностью 0.5 значения по итогам наблюдения или противоположные им по знаку. В нашем примере это приводит к
P(U1=11)=P(U1= –11)= 1/ 2; P(U2=1)=P(U2= –1)= 1/ 2;
P(U3=3)=P(U3= –3)= 1/ 2; P(U4=7)=P(U4= –7)= 1/ 2;
Теперь рассматривается сумма этих случайных величин S – она может принимать 2N различных значений, с одинаковой вероятностью 1/2N.
Таблица 5-1
U1
11
11
11
11
11
11
11
11
-11
-11
-11
-11
-11
-11
-11
-11
U2
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
U3
3
3
-3
-3
3
3
-3
-3
3
3
-3
-3
3
3
-3
-3
U4
-7
7
7
-7
7
-7
7
-7
7
-7
7
-7
7
-7
7
-7
S
8
22
16
2
20
6
14
0
0
-14
-6
-20
-2
-16
-8
-22
Отклонения от гипотетического математического ожидания в сумме составляют в нашем примере точно 0 и нам необходимо определить количество вариантов, в которых сумма S>0. Всего вариантов 16, а вариантов с нулевой или положительной суммой 9. Вероятность ошибки при отклонении Њ0оказалась равной 9/16@0.57, что намного больше контрольных 5 % . Как и следовало ожидать, нам нет смысла отбрасывать нулевую гипотезу – слишком велика ошибка первого рода.
Все было бы хорошо, но если мы выдвинем другую нулевую гипотезу о математическом ожидании выручки, например – Њ0: M(G)= 196 гривен, то после аналогичных расчетов получим результат – и эту гипотезу нет оснований отбрасывать, правда вероятность ошибки первого рода теперь будет иной – “всего лишь” 0.125. Столько же составит вероятность этой ошибки и при Њ0: M(G)= 214. Таким образом, все нулевые гипотезы со значениями от 196 до 214 можно не отвергать (не достигнуто пороговое значение 0.05). Можно ли рекомендовать принятие альтернативной гипотезы и, если – да, то при каком значении гипотетического математического ожидания?
Теория прикладной статистики отвечает на этот вопрос однозначно – нет, рекомендовать нам это она не вправе!
Вспомним “неудобное” свойство статистических выводов или рекомендаций – они никогда не бывают однозначными, конкретными. Поэтому наивно ожидать решения задачи об оценке математического ожидания по данным наблюдений в виде одного, конкретного числа.
Еще раз продумаем, чего мы добиваемся, меняя значение в нулевой гипотезе? Ведь самая большая ошибка первого рода была как раз тогда, когда мы выдвинули такое понятное предположение – математическое ожидание равно среднему.
Более того, проверка нулевой гипотезы такого вида была совершенно бессмысленным делом. Практически всегда в этих случаях альтернативная гипотеза окажется самой вероятной, но практически никогда вероятность ее истинности не достигнет желанных 95 %.
Всё дело в том, что просчитать последствия своего решения мы умеем только отвергая нулевую гипотезу, но, принимая ее, последствия просчитать не можем.
Вот если бы, передвигая воображаемый указатель по шкале СВ мы получили сигнал “СТОП, достаточно! Достигнут уровень ошибки 5 %”, то мы бы запомнили данное значение как левую (или правую) границу интервала, в котором почти “наверняка” лежит искомое нами математическое ожидание. В нашем примере этого не произошло и, оказывается и не могло произойти.
Дело в том, что у нас всего 4 наблюдения (196,208,210,214) со средним значением 207 и среднеквадратичным отклонением около 13.5 гривен (т.е. более 6 % от среднего). И получить значимые статистические выводы в этом случае просто невозможно – надо увеличить объем выборки, число наблюдений.
А вот на вопрос – а сколько же надо наблюдений, каково их достаточное число, прикладная статистика имеет ответ: для “преодоления 5 % барьера” достаточно 5 наблюдений.
Попробуем решить другую задачу об оценке математического ожидания СВ на интервальной шкале, но будем решать её не “по чувству”, а “по разуму”.
· Наблюдения над случайной величиной X: 19,17,15,13,12,11,10,8,7.
· Количество наблюдений: 9, возможных исходов 512.
· Њ0:M(X)= 9, Њ1:M(X)# 9.
Найдем сумму отклонений от гипотетического среднего, S = 31.
Из 512 возможных вариантов суммы отклонений выберем только те, в которых эта сумма составляет 31 и более. Таких вариантов всего 11, значит при принятии нулевой гипотезы Њ0: M(X)= 9 вероятность наблюдать такие суммы P(S ³31) составляет 11/512 @ 0.02 , что меньше порогового значения в 5 % .
Вывод: гипотезу Њ0 следует отвергнуть и считать приемлемым по надежности неравенство M(X) # 9.
До сих пор мы выдвигали гипотезу о значении математического ожидания на “левом крае” распределения наблюдений и могли бы повторять проверки, задаваясь значениями M(X) в 10, 11 и т.д., до тех пор, пока вероятность ошибки первого рода не достигла бы порогового значения.
Можно также исследовать правый край распределения – проверять гипотезы при больших значениях математического ожидания.
Например:
· Наблюдения над случайной величиной X: 19,17,15,13,12,11,10,8,7.
· Количество наблюдений: 9, возможных исходов 512.
· Њ0: M(X)= 17, Њ1: M(X)# 17.
Теперь сумма отклонений от гипотетического среднего окажется S = – 41.
Из 512 возможных вариантов суммы отклонений выберем только те, в которых эта сумма составляет –41 и менее. Таких вариантов всего 3, значит при принятии нулевой гипотезы Њ0: M(X)= 17 вероятность наблюдать такие суммы составляет P(S £ – 31) = 3/512 @ 0.006 , что намного меньше порогового значения в 5 % . Следовательно, можно попробовать гипотезы с меньшим M(X), сужая диапазон или так называемый доверительный интервал для неизвестного нам математического ожидания.