Реферат по предмету "Математика"


Оцінювання розподілу малої вибірки

Міністерство освіти і науки України
Дніпропетровський Національний Університет
Дипломна робота
Оцінювання розподілу малої вибірки
Виконавець:
студентка групи МС-03-1
Яковенко В.В.
Дніпропетровськ
2008
Реферат
Дипломна робота: 65 сторінок, 10 джерел, 33 рисунки, 14 таблиць.
Перелік ключових слів: мала вибірка, обсяг вибірки, розподіл, відхилення емпіричної функції від гіпотетичної, емпірична функція розподілу, незміщена оцінка, спроможна оцінка.
Об’єкт дослідження: функція та щільність розподілу малої вибірки.
Мета роботи: порівняння класичного методу оцінювання розподілу вибірки, в основі якого лежить побудова емпіричної функції розподілу, з сучасними методами оцінювання розподілу малої вибірки.
Зміст
Вступ
1. Класичний метод оцінювання розподілу вибірки
1.1 Незміщені та спроможні оцінки
1.2 Емпірична функція розподілу
1.3 Моделювання неперервних випадкових величин
1.4 Критерій Смірнова
2. Сучасні методи оцінювання розподілу малої вибірки
2.1 Метод прямокутних внесків
2.2 Метод зменшення невизначеності
2.3 Метод апріорно-емпіричних функцій
3. Порівняння класичного методу та сучасних методів оцінювання розподілу малої вибірки
Висновки
Список використаних джерел
Вступ
Для математичної статистики проблема малої вибірки й досі залишається цікавою й актуальною. В сучасній науковій літературі відомості з цього питання різносторонні. Переважає умовний та суб'єктивний підхід. Деякі автори вважають малими вибірками вибірки обсягом до 200 спостережень, інші автори називають малими вибірками вибірки обсягом до 50 спостережень. Експериментально встановлено, що для знаходження стійких оцінок необхідна вибірка обсягом 40-50 спостережень. Вважається, що обсяг вибірки – 30 спостережень є граничним між малими та великими вибірками, оскільки для вибірок з обсягом менше 30 не можна застосовувати асимптотичні методи. Для дуже малих вибірок (обсягом 3-5 спостережень) практична цінність будь-якого висновку, знайденого класичними методами, незначна й для прийняття рішення необхідно використовувати інші методи (спеціально розроблені для вибірок малого обсягу [3]).
Малою вибіркою будемо називати вибірку, яку не можна проаналізувати методами, які базуються на групуванні вибіркових значень. З останнього випливає, що вибірку можна вважати великою, якщо при її обробці ми маємо можливість перейти до групування спостережень.
Межу, яка відтинає великі й малі вибірки, не можна, звичайно, розуміти як точку в ряду дійсних цілих чисел. Достатні вибірки в силу випадковості вибору, утворюють деяку скінчену множину. З означення малої вибірки випливає необхідність індивідуального підходу до кожної окремої реалізації при обробці малої вибірки.
Важливою задачею математичної статистики є знаходження розподілу вибірки. Відомо багато класичних критеріїв для перевірки гіпотези про розподіл вибірки (наприклад, χ2-критерій, критерій Колмогорова). Але для малої вибірки необхідні інші методи та підходи.
В дипломній роботі ставиться задача порівняння класичного методу оцінювання розподілу вибірки, в основі якого лежить побудова емпіричної функції розподілу, та сучасних методів оцінювання розподілу малої вибірки.
1. Класичний метод оцінювання розподілу вибірки
1.1 Незміщені та спроможні оцінки
Постановка задачі оцінювання параметрів розподілів. Нехай />– реалізація вибірки />з розподілом />. Розподіл />залежить від параметра />, який набуває значень із множини />. Значення параметра />в розподілі />невідоме і його треба оцінити (визначити) за реалізацією />вибірки />. У цьому полягає задача оцінювання параметрів розподілів.
Для оцінювання невідомого значення параметра />єдине, що нам відомо, та єдине, за допомогою чого ми можемо оцінювати (визначати) />, є реалізація вибірки />. Крім реалізації />вибірки />ми не маємо нічого, що надавало б якусь інформацію про значення параметра />. Тому оцінити (визначити) значення />за реалізацією />(точно чи хоча б наближено) означає, що реалізації />вибірки />треба поставити у відповідність значення />. Точніше (формально) це означає, що для оцінювання />на вибірковому просторі – множині реалізації вибірок – необхідно визначити (побудувати, задати) функцію />зі значеннями в />– множині можливих значень параметра />— таку, що
/>дорівнює />
або хоча б
/>наближено дорівнює />.
Значення />ми й будемо використовувати як />. Слід зазначити, що для кожної реалізації />значення />, яке використовується як />, буде своє; тому />як функція />є випадковою величиною.
Означення. Борелеву функцію/>, задану на вибірковому просторі />, зі значеннями в />— множині можливих значень параметра />— будемо називати статистикою, а />— борелеву функцію від вибірки зі значеннями в />— оцінкою.--PAGE_BREAK--
Будувати статистики />такі, щоб
/>(1.1.1)
тобто щоб за />можна було точно визначити />, явно не вдається вже хоча б тому, що />є константою, а оцінка />як функція вибірки (функція випадкової величини) є випадковою величиною. Тому (хочемо ми того чи ні) для визначення />ми змушені задовольнятися значеннями />, приймаючи (розглядаючи) їх за наближені значення />. Зазначимо, що для одного й того самого параметра />можна запропонувати багато оцінок.
У зв’язку з постановкою задачі оцінювання параметрів розподілів як задачі одержання наближених значень />для />треба вміти відповідати на запитання: наскільки великою є похибка />при заміні />на />, інакше кажучи, як далеко можуть відхилятися значення оцінки />, обчисленої за вибіркою />, від оцінюваної величини />?
Кількісно міру похибки при заміні />на />(міру розсіювання />відносно />) будемо описувати величиною
/>(1.1.2)
Серед усіх оцінок з однією і тією самою дисперсією />мінімальну міру розсіювання відносно />мають оцінки, для яких />. Останнє випливає з нерівностей
/>(1.1.3)
Означення. Оцінку />будемо називати незміщеною оцінкою параметра />, якщо
/>,(1.1.4)
або, що те саме, />.
Наочно незміщеність оцінки />параметра />можна трактувати так: при багаторазовому використанні оцінки />як значення />, тобто при багаторазовій заміні />на />, середнє значення похибки />дорівнює нулеві.
Часто можна розглядати не одну оцінку />, побудовану за вибіркою />/>, а послідовність оцінок />, />. У цій ситуації природно говорити про асимптотичну поведінку послідовності оцінок />
Означення. Послідовність оцінок />, />, будемо називати спроможною послідовністю оцінок параметра />, якщо для кожного />
/>(1.1.5)
при />.
Означення. Послідовність оцінок />, />, будемо називати асимптотично незміщеною послідовністю оцінок параметра />, якщо
/>(1.1.6)
або, що те саме, />при />.
1.2 Емпірична функція розподілу
Означення. Нехай />– вибірка з неперервного розподілу F. Функцію />, визначену на />рівністю
/>(1.2.1)
будемо називати емпіричною функцією розподілу. />як функція випадкового вектора />є випадковою величиною; тому />також є функцією />, тобто />.
Для кожного фіксованого х емпірична функція розподілу />є незміщеною та спроможною оцінкою значення функції розподілу />.
Надалі буде зручно розглядати вибіркові значення />, розташовані в порядку зростання: />, тобто />– найменше серед значень />; />– друге за величиною і т. д.; />– найбільше з можливих значень />.    продолжение
--PAGE_BREAK--
Означення. Послідовність />,будемо називати варіаційним рядом послідовності />, а, />— порядковими статистиками.
У термінах порядкових статистик емпіричну функцію розподілу можна подати у вигляді
/>(1.2.2)
Безпосередньо з рівності (1.2.2) знайдемо, що при фіксованому />значення />в кожній точці х відрізка />, оскільки кількість таких />, для яких />, дорівнює нулеві; />у кожній точці відрізка />, тому що кількість тих />, при яких />, дорівнює 1 і т. д.; нарешті, />для кожного х з відрізка />.
Із вищенаведеного випливає, що для кожного фіксованого />функція />невід’ємна; вона є сталою на кожному з відрізків />, />(а отже, неперервною зліва) і неспадною – зростає в точках />, стрибками />.
Графік емпіричної функції розподілу />(точніше – реалізації />) зображено на рис.1.2.1.
/>
Рис.1.2.1. Графік реалізації емпіричної функції розподілу />
Зауваження 1. Для вибірок />із неперервних розподілів імовірність збігу вибіркових значень дорівнює нулеві, але оскільки ми фіксуємо результати з заданою точністю (наприклад, до третього знака), деякі вибіркові значення можуть збігатися. При цьому стрибок емпіричної функції розподілу в точці />дорівнює />, де />– кількість вибіркових значень, які збігаються з />, враховуючи й />.
Зауваження 2. Розподіл, що відповідає емпіричній функції розподілу />, будемо називати емпіричним. При кожному фіксованому />це дискретний розподіл, що ставить у відповідність кожній точці />, «масу» />(або />, якщо з />збігаються />вибіркових значень, враховуючи й />)
Про відхилення емпіричної функції розподілу />від функції розподілу />.
Емпірична функція розподілу />є оцінкою функції розподілу />. Тому природно поставити запитання: наскільки емпірична функція розподілу />, побудована за вибіркою />із F, відхиляється від />(якими можуть бути відхилення емпіричної функції розподілу />від />)? Зазначимо, що відхилення />від />є випадковою величиною, і коли ми говоримо про таке відхилення, мусимо говорити про розподіл відхилення.
Міру відхилення емпіричної функції розподілу />від функції розподілу />можна вводити різними способами. Розглянемо поки що відхилення емпіричної функції розподілу />від функції розподілу />(коли остання неперервна), запропоноване А. М. Колмогоровим:
/>(1.2.3)
(далі будемо писати />). Ця міра відхилення має ту важливу властивість, що при досить великих />розподіл />, незалежно від розподілу />, з якого одержано вибірку />, близький до розподілу Колмогорова.
Обчислення />. Нехай />– емпірична функція розподілу, побудована за вибіркою />, точніше – за реалізацією вибірки; />– неперервна функція розподілу. Часто виникає необхідність обчислити
/>(1.2.4)    продолжение
--PAGE_BREAK--
для заданих />та />. Зазначимо, що />не обов’язково є вибіркою з розподілу />.
Для того щоб обчислити
/>,
коли />«перебігає» />, його досить обчислити на кожному з проміжків
/>(1.2.5)
й із знайдених чисел вибрати найбільше.
Обчислимо спочатку
/>(1.2.6)
Значення
/>(1.2.7)
дорівнює одному з чисел
/>(1.2.8)
Функція />стала на кожному з відрізків (1.2.5),/>— неспадна функція; тому функція />-/>на відрізках (1.2.5) неспадна, й отже, (див. також рис.1.2.2)
/>
/>(1.2.9)
/>
/>(1.2.10)
/>(1.2.11)
(при обчисленні границь враховано, що />стала на проміжках (1.2.5) функція, а отже, неперервна зліва (див. також рис. 1.2.2).
/>
Рис.1.2.2. До обчислення />
Отже,
/>
дорівнює
/>(1.2.12)
або
/>,(1.2.13)
/>
Для проміжків />та />маємо
/>(1.2.14)
/>(1.2.15)
Якщо через />позначити довільну точку, що лежить праворуч від />, то за означенням функції />її значення />дорівнює 1 й останню рівність можна записати в тій самій формі, що й інші:
/>(1.2.16)
Таким чином,
/>
дорівнює найбільшому з чисел
/>(1.2.17)
де />.
1.3 Моделювання неперервних випадкових величин
Для розв’язання задач часто необхідно добути на ЕОМ послідовність вибіркових значень випадкової величини з заданим розподілом. Такий процес прийнято називати моделюванням випадкової величини. Випадкові величини зазвичай моделюються за допомогою перетворень одного або декількох незалежних значень рівномірно розподіленої на />випадкової величини />.
Нехай випадкова величина />означена на інтервалі />та має щільність />при />. Позначимо через />функцію розподілу />, яка при />дорівнює
/>(1.3.1)
Випадок />й (або) />не виключається.
Теорема 1.2.1. Випадкова величина />, яка задовольняє рівнянню
/>(1.3.2)
має щільність розподілу />.
Доведення. Оскільки функція />строго зростає в інтервалі />від />до />, тоді рівняння (1.3.2) має єдиний корень при кожному />. При цьому    продолжение
--PAGE_BREAK--
/>(1.3.3)
Випадкова величина />рівномірно розподілена в інтервалі />, тому
/>(1.3.4)
Отже,
/>(1.3.5)
Що і треба було довести.
1.4 Критерій Смірнова
Постановка задачі. Нехай />та />– реалізації вибірок />та />з неперервних розподілів />і />відповідно. Відносно невідомих розподілів />і />висувається гіпотеза
/>.(1.4.1)
Необхідно перевірити гіпотезу />.
Відхилення />між емпіричними функціями розподілу />та />. Смірнов за відхилення між емпіричними функціями розподілу />та />запропонував розглядати величину
/>.(1.4.2)
Так введене відхилення задовольняє умовам, які забезпечують побудову критерію: 1) при справедливій гіпотезі />відхилення />мінімально можливе в порівнянні зі значеннями />, коли />, оскільки/>– незміщена та спроможна оцінка для />, />– незміщена та спроможна оцінка для />;
2) при достатньо великих />розподіл
/>(1.4.3)
мінімально можливого відхилення мало відрізняється від розподілу Колмогорова. Отже, за цей розподіл можна розглядати розподіл Колмогорова. Останнє випливає з теореми.
Теорема Смірнова. Нехай />та />незалежні вибірки з неперервних розподілів />і />; />та />– емпіричні функції розподілів побудовані за вибірками />та />.
Якщо />, тоді при />так, що відношення />має границю, справедливо
/>,(1.4.4)
де />– функція розподілу Колмогорова.
Далі, обчислюємо відхилення (1.4.2) і порівнюємо його з мінімально можливим відхиленням />. При цьому, />порівнюємо з />не безпосередньо (оскільки />– випадкова величина), а порівнюємо з числом />, що відокремлює малі значення />від великих.
Критерій Смірнова. Нехай />та />– незалежні вибірки з неперервних розподілів />і />відповідно. />– верхня />– границя розподілу Колмогорова. Якщо
/>,(1.4.5)
то гіпотезу />відхиляють, і не відхиляють в супротивному разі.
Рівень значущості критерію – />.
Зауваження 1. />– верхня />– границя розподілу Колмогорова визначається як розв’язок рівняння    продолжение
--PAGE_BREAK--
/>.(1.4.6)
/>.
2. Сучасні методи оцінювання розподілу малої вибірки
2.1 Метод прямокутних внесків (МПВ)
Метод прямокутних внесків був запропонований Чавчанідзе В.В. та Кумсішвілі В.А. в 1959 році [4]. Цей метод спрямований на побудову оцінки щільності розподілу f*(x).
Основні припущення метода такі. Множина можливих значень випадкових величин />– відрізок [a,b]. Кожна випадкова величина використовується для побудови оцінки щільності окремо, при цьому кожна випадкова величина рівномірно «розмазується» в прямокутнику
/>.
За додаткову апріорну інформацію передбачається знання інтервалу [а;b], в якому випадкова величина />набуває значень. При цьому вважається, що щільність розподілу f(x) неперервна, не має дуже великих стрибків на заданому інтервалі й
f(x)≥0 при а≤x≤b;(2.1.1)
f(x)≡0 при xb.(2.1.2)
Наявність подібної апріорної інформації, навіть за відсутності реалізацій />вибірки />, дозволяє побудувати оцінку щільності f*(x). Жодній з можливих реалізацій />всередині інтервалу [а;b] не можна віддати перевагу. Саме таку особливість має рівномірний розподіл на [а;b] (див. рис 2.1.1)
/>(2.1.3)
Рис. 2.1.1. Графік щільності рівномірного розподілу на [а;b]
Тому до проведення стохастичного експерименту оцінка щільності має вигляд
f*(x)= f(x).(2.1.4)
Функцію f(x)називатимемо апріорною щільністю розподілу.
Проводиться стохастичний експеримент, результатом якого є реалізація />вибірки />. Поява реалізацій />дає можливість уточнити оцінку (2.1.4). Останнє здійснюється шляхом індивідуального підходу до кожної окремої реалізації />вибірки />, при якому їй приписується елементарна рівномірна щільність на відрізку />:
/>(2.1.5)
Функцію />називають функцією внеску реалізації />, при цьому d – ширина функції внеску, />.
Функція внеску задається симетрично відносно точки />на інтервалі довжини d(див. рис. 2.1.2), отже, інформація про випадкову величину />, одержана від реалізації />«розмазується».
Рис. 2.1.2. Графік і-тої функції внеску
Тоді оцінка щільності />знаходиться підсумовуванням апріорної щільності />та всіх />внесків реалізацій />вибірки />з однією й тією ж вагою />:
/>(2.1.6)
Рис. 2.1.3. Графік оцінки щільності />
При побудові оцінки щільності МПВза формулою (2.1.6) для внесків, що виходять за одну з меж інтервалу [а; b], рекомендується відкидати частини, що виходять за ці межі. Над частиною внеску, що знаходиться всередині інтервалу [а; b], як над основою, слід рівномірно надбудовувати прямокутник, площа якого дорівнює відкинутій.
Оцінка функції розподілу F*(x)для МПВ знайдена інтегруванням щільності f*(x)
/>(2.1.7)
2.2 Метод зменшення невизначеності (МЗН)
Метод зменшення невизначеності був запропонований Єременко В.І. та Свердликом А.Н. в 1963 році [5].
Цей метод дозволяє побудувати оцінку функції розподілу при апріорно відомому інтервалі [a,b], на якому вибірка />набуває значень. На відміну від МПВ, в якому інформація від реалізації />«розмазується» рівномірно на відрізку />, в МЗН пропонується «розподілити рівномірно стрибок імовірностей />в точці />та розповсюдити вплив вказаного перетворення на весь відрізок />».
Розглянемо рисунок 2.2.1, на якому за трьома реалізаціями />побудована оцінка F*(x). Для її знаходження необхідно на інтервалі [a,b] нанести на графік похилі лінії, число яких дорівнює (n+1)=4, під кутом
/>(2.2.1)
до вісі абсцис на однаковій відстані одна від одної, яка дорівнює величині />. Далі будується ламана лінія від точки (a;0) до точки (b;1) через середини відрізків, перпендикулярних вісі абсцис, що відновлені в точках />та замкнених між похилими лініями. Дана ламана лінія і є шуканою оцінкою F*(x).    продолжение
--PAGE_BREAK--
Рис. 2.2.1. Графік оцінки функції розподілу/>
В загальному вигляді вираз для оцінки F*(x) на відрізку /> такий:
/>(2.2.2)
/>
/>(2.2.3)
де />– число випадків збігу реалізацій />.
МЗН є частинним випадком МПВ. Це легко перевірити. Для цього необхідно від оцінки функції розподілу F*(x) перейти до оцінки щільності f*(x). На рис. 2.2.2. зображена перша похідна від оцінки F*(x) за аргументом х, яка є нічим іншим, як оцінкою щільності f*(x). З рисунка 2.2.2, на якому цифри всередині прямокутників означають їх площі, видно, що f*(x) складається з:
1) апріорної рівномірної щільності />, яка займає 25% площі оцінки f*(x), та 2) трьох функцій внеску несиметричної форми, які займають по 25% площі оцінки f*(x).
Рис. 2.2.2. Графік оцінки щільності f*(x) розподілу
Аналітично функцію внеску реалізації />можна записати так:
/>(2.2.4)
де при />реалізація />, а при />реалізація />.
Оцінка f*(x) знаходиться підсумовуванням всіх вказаних компонент />з вагами />. Отже, вираз для МПВ визначає оцінку f*(x) для МЗН. Відміна лише в тому, що прямокутний внесок перетворений у внесок східчастої форми, що складається з двох прямокутників з рівною площею.
Така заміна дозволяє досить легко будувати оцінку функції розподілу.
2.3 Метод апріорно-емпіричних функцій (АЕФ)
Метод апріорно-емпіричних функцій був запропонований Демковим І.П. та Потепун В.Е. в 1970 році [6].
Метод апріорно-емпіричних функцій дозволяє відразу отримати оцінку функції розподілу />.
Оцінка, побудована методом апріорно-емпіричних функцій, визначається так:
/>,(2.3.1)
де />– апріорний розподіл, побудований за апріорними даними;
/> – емпіричний розподіл, побудований за вибіркою />;
/> – коефіцієнт достовірності інформації про апріорний розподіл.
З формули (2.3.1) випливає, що метод апріорно-емпіричних функцій також базується на використанні апріорної інформації, яка представляє собою інтервал [a,b], але при цьому їй приписується деяка вага />та передбачається, що
/>(2.3.2)
/>(2.3.3)
де />– інтервал дискретності, який визначається точністю спостереження (вимірювання) випадкової величини; />– щільність оцінюваної функції розподілу, яка є обмеженою функцією на />та має скінчене число точок розриву. Крім того, при побудові />за допомогою метода апріорно- емпіричних функцій використовується індивідуальний підхід до кожної реалізації вибірки: інформація яка вкладена в реалізації />, розподіляється рівномірно на відрізку дискретності />.
Метод АЕФ передбачає наступний порядок дій для побудови оцінки функції розподілу.
Визначається відрізок [a,b]та відрізок дискретності />. За границі aта b, у випадку, якщо вони невідомі апріорно, рекомендується брати величини />або />, де />— середнє вибіркове для вибірки />, />– вибіркова дисперсія, обчислена за вибіркою />. Такий вибір меж відрізку базується на відомому в математичній статистиці «правилі />».
Обчислюється відрізок означення функції />за умов (2.3.2), (2.3.3).
Задається апріорна функція розподілу />та будується на відрізку />, при цьому
/>(2.3.4)
Задається величина /> та будується на даному відрізку /> лінія обліку за формулою
/>(2.3.5)
де />– номер лінії обліку; />– число реалізацій, рівних за значенням до />.
В точках />відновлюються перпендикуляри до вісі абсцис та знаходяться точки перетину перпендикулярів: в точках />з і-ми лініями обліку, в точках />з (і+1)-ми лініями обліку.    продолжение
--PAGE_BREAK--
Від точки />до точки />будується ламана лінія, яка з’єднує всі знайденні точки перетину, при цьому оскільки точки />та />/>лежать на одній лінії обліку />то ламана між цими точками йде за лініями обліку. Точки />та />з’єднуються відрізком прямої. Знайдена ламана лінія є оцінкою функції розподілу. На рис. 2.3.1, як приклад наведено побудову />за вибіркою обсягом />.
Рис. 2.3.1. Графік оцінки функції розподілу />
Методи АЕФ та МПВ, хоча й спрямовані на побудову оцінок різних функцій, відносяться до однієї групи методів, які базуються на використанні апріорної інформації, індивідуальному підході до реалізацій вибірок та «розмазуванні» інформації. Більш того, можна вважати, що метод АЕФ є теж методом прямокутних внесків. Розглянемо рисунок (2.3.2), де наведена оцінка щільності розподілу />, побудована шляхом диференціювання />, що зображена на рис. 2.3.1, за змінною х.
/>
Рис. 2.3.2. Графік оцінки щільності розподілу />
Оцінка />складається з лінійної суми апріорної рівномірної на відрізку />щільності />та прямокутних внесків />з відповідними вагами. Оцінка аналогічна до (2.1.6) в МПВ, але при цьому ширина внеску />визначається тільки точністю вимірювальної апаратури />. В цьому істотна слабкість методу, оскільки зі зміною точності вимірювань (появи більш досконалого приладу) буде змінюватись ефективність оцінювання.
Метод АЕФ має і сильну сторону. Відмова від прирівняння апріорної інформації та інформації, знайденої від окремої реалізації />, та введення коефіцієнта достовірності інформації />відрізняє метод АЕФ від МПВ та МЗН і є кроком вперед. Дійсно, апріорна інформація, яку має статистик, може мати різну природу, тому достовірність її може бути різною, а задання />, як це зроблено в МПВ та МЗН, є обмеженням, яке знижує ефективність оцінювання розподілу вибірки.
3. Порівняння класичного методу та сучасних методів оцінювання малої вибірки
В дипломній роботі проведено експеримент, в якому кожен з розглянутих сучасних методів було порівняно з класичним методом.
Добувалась реалізація />вибірки />з відомого неперервного розподілу />. Будувалась емпірична функція розподілу />та оцінка функції розподілу />одним з трьох методів оцінювання функції розподілу малої вибірки. Далі обчислювалось колмогорівське відхилення емпіричної функції розподілу від гіпотетичної
/>,(3.1.1)
а також відхилення побудоване аналогічно колмогорівському
/>,(3.1.2)
в якому замість емпіричної функції розподілу береться оцінка функції розподілу />, обчислена одним з трьох методів (МПВ, МЗН, МАЕФ).
Відхилення (3.1.1) та (3.1.2) порівнювались так: фіксувався обсяг вибірки n/>добувалось 20 реалізацій вибірки />, обчислювалось 20 відхилень (3.1.1) та (3.1.2).Для класичного методу рахувалось середнє та дисперсія вибірок з 20 відхилень (3.1.1):    продолжение
--PAGE_BREAK--
/>;(3.1.3)
/>(3.1.4)
Для методів оцінювання функції розподілу малої вибірки рахувалось середнє та дисперсія вибірок з 20 відхилень (3.1.2):
/>;(3.1.5)
/>(3.1.6)
Розглядались три розподіла />: рівномірний на проміжку [,1], нормальний />та експоненціальний з параметром />.
В таблицях (3.1) – (3.9) наведено результати експериментів, які цілком очевидно свідчать на користь запропонованих методів оцінювання функції розподілу малої вибірки.
Метод прямокутних внесків
/> – рівномірний розподіл на [0;1]
Таблиця 3.1. Залежність величин />та />від обсягу вибірки n
Обсяг вибірки
/>
/>
/>


Класичнийметод
Метод прямокутних внесків
Класичний метод
Метод прямокутних внесків
3
0,456
0,166
0,023
0,008
4
0,436
0,166
0,013
0,008
5
0,351
0,129
0,009
0,006
6
0,316
0,118
0,007
0,002
7
0,319
0,141
0,013
0,007
8
0,275
0,116
0,006
0,004
9
0,269
0,114
0,007
0,003
10
0,251
0,111
0,008
0,003
11
0,240
0,111
0,003
0,001
12
0,201
0,103
0,003
0,003
13
0,191
0,096
0,002
0,001
14
0,229
0,097
0,003
0,001
15
0,195
0,093
0,004
0,002
За методом прямокутних внесків для рівномірного на [0;1] розподілу знайдено такі результати: метод виявився більш ефективним за класичний метод, внаслідок менших значень математичного сподівання вибірок. Оскільки дисперсія зі збільшенням обсягу вибірок зменшується, це свідчить про те, що метод стійкий.
Для наочності проілюструємо знайдені результати за допомогою графіків залежностей величин />та />від обсягу вибірки n
/>
Рис. 3.1 Залежність величини />від обсягу вибірки n
/>
Рис. 3.2 Залежність величини />від обсягу вибірки n
Метод прямокутних внесків
/>–нормальний розподіл N(1/2;1/36)
Таблиця 3.2. Залежність величин />та />від обсягу вибірки n
Обсяг вибірки
/>
/>    продолжение
--PAGE_BREAK----PAGE_BREAK----PAGE_BREAK----PAGE_BREAK--
12
0,207
0,160
0,002
0,002
13
0,220
0,156
0,002
0,002
14
0,219
0,164
0,004
0,003
15
0,201
0,158
0,004
0,003
За методом зменшення невизначеності для експоненціального розподілу з параметром λ=5 знайдено такі результати: метод виявився більш ефективним за класичний метод, внаслідок менших значень математичного сподівання вибірок. Оскільки дисперсія зі збільшенням обсягу вибірок зменшується, це свідчить про те, що метод стійкий.
Для наочності проілюструємо знайдені результати за допомогою графіків залежностей величин />та />від обсягу вибірки n
/>
Рис. 3.11 Залежність величини />від обсягу вибірки n
/>
Рис. 3.12 Залежність величини />від обсягу вибірки n
Метод апріорно-емпіричних функцій
/> – рівномірний розподіл на [0;1]
Таблиця 3.7. Залежність величин />та />від обсягу вибірки n
Обсяг вибірки
/>
/>
/>


Класичний метод
Метод апріорно-емпіричних функцій
Класичний метод
Метод апріорно-емпіричних функцій
3
0,413
0,044
0,011
0,000
4
0,387
0,040
0,012
0,000
5
0,320
0,041
0,012
0,000
6
0,302
0,040
0,009
0,000
7
0,303
0,043
0,008
0,000
8
0,279
0,040
0,007
0,000
9
0,275
0,040
0,003
0,000
10
0,234
0,034
0,002
0,000
11
0,229
0,032
0,005
0,000
12
0,240
0,037
0,004
0,000
13
0,219
0,033
0,002
0,000
14
0,199
0,032
0,006
0,000
15
0,209
0,033
0,004
0,000
За методом апріорно-емпіричних функцій для рівномірного на [0;1] розподілу знайдено такі результати: метод виявився більш ефективним за класичний метод, внаслідок менших значень математичного сподівання вибірок. Оскільки дисперсія зі збільшенням обсягу вибірок зменшується, це свідчить про те, що метод стійкий.
Для наочності проілюструємо знайдені результати за допомогою графіків залежностей величин />та />від обсягу вибірки n
/>    продолжение
--PAGE_BREAK--
Рис. 3.13 Залежність величини />від обсягу вибірки n
/>
Рис. 3.14 Залежність величини />від обсягу вибірки n
Метод апріорно-емпіричних функцій
/> – нормальний розподіл N(1/2;1/36)
Таблиця 3.8. Залежність величин />та />від обсягу вибірки n
Обсяг вибірки
/>
/>
/>


Класичний метод
Метод апріорно-емпіричних функцій
Класичний метод
Метод апріорно-емпіричних функцій
3
0,508
0,226
0,019
0,012
4
0,421
0,186
0,014
0,013
5
0,335
0,178
0,013
0,005
6
0,288
0,171
0,004
0,003
7
0,290
0,161
0,005
0,004
8
0,264
0,135
0,006
0,004
9
0,250
0,141
0,006
0,001
10
0,227
0,142
0,004
0,003
11
0,227
0,133
0,004
0,002
12
0,212
0,137
0,005
0,002
13
0,207
0,139
0,004
0,002
14
0,214
0,136
0,005
0,002
15
0,208
0,133
0,004
0,002
За методом апріорно-емпіричних функцій для нормального розподілу N(1/2;1/36) знайдено такі результати: метод виявився більш ефективним за класичний метод, внаслідок менших значень математичного сподівання вибірок. Оскільки дисперсія зі збільшенням обсягу вибірок зменшується, це свідчить про те, що метод стійкий.
Для наочності проілюструємо знайдені результати за допомогою графіків залежностей величин />та />від обсягу вибірки n
/>
Рис. 3.15 Залежність величини />від обсягу вибірки n
/>
Рис. 3.16 Залежність величини />від обсягу вибірки n
Метод апріорно-емпіричних функцій
/> – експоненціальний розподіл з параметром λ=5
Таблиця 3.9. Залежність величин />та />від обсягу вибірки n
Обсяг вибірки
/>
/>
/>


Класичний метод
Метод апріорно-емпіричних функцій
Класичний метод    продолжение
--PAGE_BREAK----PAGE_BREAK----PAGE_BREAK----PAGE_BREAK----PAGE_BREAK--
1,26
10
0,95
1,42
1,58
11
1,90
1,42
1,74
12
2,06
1,42
1,42
13
1,90
1,74
0,95
14
2,53
1,90
1,42
15
2,21
1,11
1,42
Відхилення Смірнова
/>,
обчислене для кожного з методів порівнювалось з />– верхньою />– границею розподілу Колмогорова (/>). Оскільки
/>,
отже, гіпотеза про розподіл Колмогорова, відхилення (3.1.2), відхиляється.
Висновки
Для математичної статистики проблема малої вибірки завжди є цікавою та актуальною.
Трудоємність та матеріальні затрати не завжди дозволяють провести стохастичний експеримент достатню кількість разів для знаходження вибірки потрібного обсягу, тому на практиці доводиться приймати рішення, аналізуючи вибірку малого обсягу.
В сучасній науковій літературі відомості з цього питання різносторонні. Деякі автори вважають малими вибірками вибірки обсягом до 200 спостережень, інші автори називають малими вибірками вибірки обсягом до 50 спостережень. Експериментально встановлено, що для знаходження стійких оцінок необхідна вибірка обсягом 40-50 спостережень. На сьогоднішній день відкритим питанням залишається строго математичне означення малої вибірки.
Вибіркою малого обсягу, або малою вибіркою будемо називати вибірку, для аналізу якої не можна використати асимптотичні методи.
На практиці часто виникає питання: як оцінити розподіл малої вибірки?Яким методом?Адже методи, які засновані на групуванні вибіркових значень, застосовувати до малої вибірки неможна.
В дипломній роботі ставиться задача порівняння класичного методу оцінювання розподілу вибірки, в основі якого лежить побудова емпіричної функції розподілу, та сучасних методів оцінювання розподілу малої вибірки.
Розглянемо кожен з методів. Почнемо з класичного. Нехай />– вибірка з неперервного розподілу F. Функцію, визначену рівністю
/>
називають емпіричною функцією розподілу. Емпірична функція розподілу є незміщеною та спроможною оцінкою функції розподілу F(x). За міру відхилення функції розподілу />від функції розподілу />будемо розглядати міру, запропоновану А. М. Колмогоровим:
/>
Розглянемо три методи оцінювання функції розподілу малої вибірки. Ці методи мають спільну ідею побудови оцінки функції розподілу, яка полягає в таких припущеннях: множина можливих значень випадкових величин />– відрізок [a,b], кожна випадкова величина використовується для побудови оцінки щільності окремо, при цьому кожна випадкова величина рівномірно «розмазується» в деякій області.
Для всіх методів оцінка щільності розподілу складається з двох компонент: апріорної та апостеріорної:
/>
Різним методам оцінювання відповідають різні значення ваги />та різні внески апостеріорої компоненти.
Розглянемо докладніше перший метод.
Метод прямокутних внесків був запропонований Чавчанідзе В.В. та Кумсішвілі В.А. в 1959 році.
Жодній випадковій величині з відрізка [а;b] не можна віддати перевагу. Саме таку властивість має рівномірний розподіл, щільність якого
/>
будемо називати апріорною щільністю розподілу.
За вагу />приймається величина />.
Далі проводиться стохастичний експеримент, результатом якого є реалізація />вибірки />з відомого неперевного розподілу />. За допомогою цієї реалізації можна уточнити апріорну щільність розподілу.
Реалізація />рівномірно «розмазується» в прямокутнику
/>
А саме: припишемо кожній реалізації />елементарну рівномірну щільність на відрізку />:    продолжение
--PAGE_BREAK--
/>
/>
При цьому для прямокутників, що виходять за межі інтервалу />, необхідно відкидати частини, які виходять за межі, а над частиною внеску, що знаходиться всередині відрізку />, як над основою, слід рівномірно надбудовувати прямокутник, площа якого дорівнює відкинутій.
/>
Тоді оцінка щільності розподілу малої вибірки має вигляд
/>
Оцінка функції розподілу F*(x)знаходиться інтегруванням щільності.
/>
Наступний метод – метод зменшення невизначеності був запропонований Єременко В.І. та Свердликом А.Н. в 1963 році.
В цьому методі за апріорну компоненту також береться рівномірний розподіл, а за вагу />— величина />.
На відміну від МПВ, випадкова величина рівномірно «розмазується» у внеску східчатої форми, вигляду
/>
який складається з двох прямокутників однакової площі. Така заміна дозволяє досить легко будувати оцінку щільності розподілу, але виграшу вефективності дати не може, тому, що ширина внеску />є випадкова величина.
/>
Наступний метод – метод апріорно-емпіричних функцій був запропонований Демковим І.П. та Потепун В.Е. в 1970 році.
Оцінка, побудована методом апріорно-емпіричних функцій, визначається формулою:
/>,
де/>
/>
/>
ширина внеску визначається тільки точністюапаратури />. В цьому істотна слабкість методу, оскільки зі зміною точності вимірювань (появи більш досконалого приладу) буде змінюватись ефективність оцінювання. Але цей метод має і сильну сторону. Ввведення коефіцієнта достовірності інформації ,/>, який можна корегувати в залежності від конкретної ситуації, відрізняє метод АЕФ від попередніх. Це дійсно є важливим кроком вперед, тому що на практиці дані, які аналізує статистик, можуть мати різноманітну природу.
В дипломній роботі проведено експеримент, в якому кожен з трьох методів було порівняно з класичним методом.
Добувалась реалізація />вибірки />з відомого розподілу />. Будувалася емпірична функція розподілу та оцінка функції розподілу одним з трьох методів оцінювання функції розподілу малої вибірки. Далі обчислювалось колмогорівське відхилення емпіричної функції розподілу від гіпотетичної
/>,
а також відхилення побудоване аналогічно колмогорівському
/>,
в якому замість емпіричної функції розподілу береться оцінка функції розподілу />, обчислена одним з трьох методів оцінювання функції розподілу малої вибірки (МПВ, МЗН, МАЕФ).
Відхилення порівнювались так: фіксувався обсяг вибірки n/>добувалось 20 реалізацій вибірки/>; обчислювалось 20 відхилень вигляду />та />, рахувалось середнє та дисперсія вибірок даних відхилень.
За розподіл />розглядались рівномірний, нормальний та експоненціальнийрозподіли.
За методом прямокутних внесків знайдено такі результати.
Для рівномірного на [0;1] розподілу метод виявився більш ефективним за класичний метод, в тому сенсі, що середні значення відхилень, знайдені методом прямокутних внесків, менші за середні відхилення, знайдені класичним методом.
Для нормального N(1/2;1/36)та експоненціального з параметром />розподілів метод виявився більш ефективним за класичний метод для вибірок обсягом менше ніж 6 та 10 спостережень відповідно. Для вибірок більшого обсягу метод не ефективний – це обумовлено тим, що за апріорну інформацію приймається рівномірний на [0;1] розподіл.
За методом зменшення невизначеності та методом апріорно-емпіричних функцій отримано такі результати.
Для всіх розглянутих розподілів методи виявилися більш ефективними за класичний метод. Середні значення відхилень, знайдені даними методоми, менші за середні відхилення, знайдені класичним методом. Оскільки дисперсія зі збільшенням обсягу вибірки зменшується методи можна вважати стійкими.
Крім цього експерименту було проведено порівняння методів МПВ, МЗН та МАЕФ між собою.
При порівнянні виявилось, що метод апріорно-емпіричних функцій ефективніший ніж метод прямокутних внесків та метод зменшення невизначеності, внаслідок того, що відхилення />набагато менші за відхилення />, знайдені класичним методом.Це пов’язано з тим, що в методі апроіорно-емпіричних функцій, на відміну від методу прямокутних внесків та методу зменшення невизначеності, введено коефіцієнт достовірності апріорної інформації.
Список використаних джерел
1. Турчин В.Н., Теория вероятностей и математическая статистика: В 2 т. — Т.2: Математическая статистика, Днепропетровск: ДГУ, 1996. — 248 с.
2. Турчин В.М., Математична статистика, К.: «Академія», 1999. – 240 с.
3. ГаскаровД.В., ШаповаловВ.И. Малая выборка. М., «Статистика», 1978. – 248 с.
4. Чавчанидзе В.В., Кумсишвили В.А., Об определении законов распределения на основе малого числа наблюдений. – В кн.: Применение вычислительной техники для автоматизации производства (Труды совещания 1959 г.). М., Машгиз, 1961, с. 71-75.
5. Еременко И.В., Свердлик А.Н. Об одном методе построения законов распределения величин при малом числе испытаний. – В кн.: Некоторые вопросы специального применения вычислительной техники. Л., ЛВИКА им.А.Ф. Можайского, 1963, с. 18 – 29.
6. Демаков И.П., Потепун В.Е. Статистические методы определения законов распределения при анализе точности и надежности промышленных изделий по результатам эксперимента. Л., 1970. 39 с.
7. Методы статистического анализа и обработка малого числа наблюдений при контроле качества и надежности приборов и машин. Л., 1974. 92 с.
8. Березин О.П. Определение законов распределения малых выборок методом прямоугольных вкладов. – Доклады к НТК по надежности судового электрооборудования, вып. 65. Л., 1965, с. 190 – 198.
9. Ермаков С.М., Михайлов Г.А. Статистическое моделирование. – 2-е изд., дополн. – М.: Наука, 1982. – 296 с.
10. Корн Г., Корн Т. Справочник по математике. М., Наука, 1970. 720 с.


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Сейчас смотрят :

Реферат Политический портрет Лейбы Давыдовича Троцкого
Реферат Philosophy Essay Research Paper
Реферат Вибiр оптимального рiшеня в умовах невизначеностi
Реферат Экологический налог
Реферат П.А.Толстой дипломат Петра Великого
Реферат Биография спортсменки Марион Джонс
Реферат Лекции по международному частному праву
Реферат Відмінності життєвого циклу об'єкта права інтелектуальної власності від життєвого циклу нового товару
Реферат Разработка модуля проверки диапазона исходных данных и нахождения номера первого символа в строке
Реферат Інструкція щодо заповнення форми державного статистичного спостереження №2-інвестиції (квартальна) "Капітальні інвестиції"
Реферат Учение о государстве и праве Р Иеринга и Л Гумпловича
Реферат 1 «Порядок создания организации. Миссия и цели организации»
Реферат Керамическое панно
Реферат Уравнение Лапласа, решение задачи Дирихле в круге методом Фурье
Реферат Анализ прибыли и пути её увеличения в ОАО "Тамбовский жировой комбинат"