СИСТЕМИ ВИПАДКОВИХ ВЕЛИЧИН
(реферат)
Вступ
N-вимірний вектор /> (t-індекс транспонування)називається випадковим, якщо його координати є випадковими величинами. Вектор /> називають дискретним,якщо його координати — дискретні випадкові величини, неперервним, якщойого компоненти — неперервні випадкові величини і змішаним, якщо частина йогокомпонент – дискретні випадкові величини, а інша частина – неперервні випадковівеличини. Випадкові N-вимірні вектори називають ще системою Nвипадкових величин або багатовимірними випадковими величинами. Вподальшому розглядаються двовимірні випадкові вектори (системи двох випадковихвеличин), які позначаються />.
1.Розподіли системи двох випадкових величин
Система двохдискретних випадкових величин однозначно визначається сумісним розподіломймовірностей, який можна задати матрицею
y1 y2 … ym
/>/>, (1.1)
(/>).
Стовпчики матрицівідповідають значенням /> випадковоївеличини Y, а рядки – значенням /> випадковоївеличини X. Події /> утворюютьповну групу подій, тому сума елементів матриці /> дорівнює1:
/>.
Розподіли
/>,
/>
називають розподіламикомпонент системи двох випадкових величин />.Події />,/>,...,/> є несумісними, тому за теоремоюдодавання ймовірностей несумісних подій сума елементів і-рядка матриці /> дорівнює ймовірностізначення />:
/>.(1.1а)
Аналогічно, сумаелементів j-стовпчика дорівнює ймовірності значення />:
/>.(1.1b)
Приклад 1.1. Система двох випадковихвеличин /> задана сумісним розподілом
y1 y2
/>/>
Знайти розподіликомпонент системи випадкових величин.
Розв’язування. За формулами (1.1а) та(1.1b)
/>;
/>;
/>;
/>; />.
Отже, розподіликомпонент
/>
/>.
Будь-якийдвовимірний випадковий вектор (неперервний чи дискретний) однозначно визначаєтьсяінтегральною функцією сумісного розподілу
/>, (1.2)
яка визначаєймовірність того, що випадкова величина X приймає значення менше ніж x,а /> - менше ніж y.Геометрична інтерпретація інтегральної функції сумісного розподілу полягає втому, що вона визначає ймовірність попадання випадкової точки /> у нескінченнийзаштрихований квадрат із вершиною в точці /> (рис1.1).
Інтегральнафункція розподілу випадкового вектора /> маєтакі очевидні властивості.
Властивість 1.
/>.
Властивість 2.Функція /> неспадна по кожномуаргументу
/>, якщо />;
/>, якщо />.
Властивість 3.Мають місце граничні співвідношення
/>, />,/>, />.
Властивість Для функція /> мають місце ще і такіграничні співвідношення
/>,
/>,
/> - інтегральна функціярозподілу компоненти X випадкового вектора />.
/> - інтегральна функціїрозподілу компоненти Y випадкового вектора />.
З використаннямфункції розподілу (1.2) легко можна обчислити ймовірність попадання випадковоїточки у напівсмугу /> та />(рис 1.2)
/>, (1.3а)
/>.(1.3б)
Імовірністьпопадання випадкової точки у напівсмугу дорівнює приросту інтегральноїфункції сумісного розподілу по відповідному аргументу.
Доведення. Імовірність попадання унапівсмугу /> дорівнює різниці ймовірностіпопадання точки у нескінченний квадрат з вершиною /> (/>)і ймовірності попаданняточки у нескінченний квадрат з вершиною />(/>. Звідси і слідує рівність(1.3а)
Імовірністьпопадання випадкової точки у прямокутник утворений прямими
/>
(рис.1.3)обчислюється за формулою
/>(1.4)
Доведення. Імовірність попадання упрямокутникдорівнює різниці ймовірності попадання точки у напівсмугу /> (/>)і ймовірності попадання унапівсмугу />(/>). Звідси і слідує рівність(1.3а)
Приклад 1.2. Знайти ймовірність пападаннявипадкової точки /> у прямокутникобмеженний прямими />, />, />, />, якщо відома інтегральнафункція сумісного розподілу
/>
Розв’язування. За формулою (1.4) в якій />, />, />, />
/>
/>
/>
Система двохнеперервних випадкових величин /> однозначновизначається густиною сумісного розподілу ймовірностей
/>. (1.5)
Приклад 1.3. Знайти густину сумісногорозподілу системи випадкових величин/>, якщовідома інтегральна функція сумісного розподілу
/>
Розв’язування. За формулою (1.5)
/>/>
/>
Інтегральнафункція сумісного розподілу неспадна по кожному аргументу і тому
/>.
Завідомою густиною сумісного розподілу інтегральну функцію сумісного розподілуможна визначити за формулою
/> (1.6)
Приклад 1. Знайти інтегральну функціюсумісного розподілу системи випадкових величин/>,якщо відома густина сумісного розподілу
/>.
Розв’язування. За формулою (1.6)
/>
/>
/>.
Враховуючи, що /> (властивість 3), длягустини сумісного розподілу /> можназаписати рівність нормування
/>.
Ймовірністьпопадання випадкової точки /> удовільну область (рис.1.3) обчислюється за формулою
/>,(1.7)
якаодразу слідує з означення подвійного інтеграла
Приклад 1.5. Система випадкових величин /> задана густиною сумісногорозподілу
/>.
Знайтиймовірність попадання випадкової точки у прямокутник з вершинами />, />,/>,/>.
Розв’язування. За формулою (1.7)
/>
/>.
/>.
Функції
/>,(1.8a)
/>.(1.8b)
є інтегральнимифункціями розподілу компонент системи двох неперервних величин />.
Приклад 1.6. Система випадкових величин /> задана густиною сумісногорозподілу
/>.
Знайти інтегральні функціїкомпонент.
Розв’язування. За формулою (1.8а)
/>
/>.
За формулою(1.8б)
/>
/>.
За відомоюгустиною сумісного розподілу ймовірностей системи двох випадкових величин можнаобчислити густину розподілу кожної її компоненти:
/> (1.9a)
/>(1.9b)
Доведення. З означення густинирозподілу компоненти />та з врахуванням(1.8a)
/>.
Аналогічно длядругої компоненти:
/>
Приклад 1.7. Двовимірний вектор /> задан густиною сумісногорозподілу
/>
Знайти густинирозподілів компонент X та Y.
Розв’язування. За формулою(1.9а)при />
/>,
і при />/>.Отже,
/>
За формулою(1.9b)при />
/>,
і при />/>.Отже,
/>
Дискретнівипадкові двовимірні вектори однозначно визначаються також умовнимирозподілами компонент X,Y:
/>,
/> - умовна ймовірність події /> за умови того, що подія /> вже настала,
/> - умовна ймовірність події /> за умови, що подія /> вже настала.
За теоремоюмноження ймовірностей залежних подій
/>,(1.10а)
(/>),
/>, (1.10b)
(/>).
Приклад 1.8. Необхідно обчислити умовнірозподіли компоненти X системи випадкових подій /> із сумісним розподілом
y1 y2
/>
при />.
Розв’язування. Імовірність події (/>) за формулою (1.1b).
/>
За формулою(1.10а)
/>,
/>,
/>.
Умовний розподілкомпоненти X при />
/>
Імовірність події(/>) за формулою (1.1b).
/>.
За формулою(1.10а)
/>,
/>,
/>.
Умовний розподілкомпоненти X при />
/>.
Імовірність події(/>) за формулою (1.1a)
/>.
За формулою(1.10b)
/>,
/>.
Умовний розподілкомпоненти Y при />
/>.
Імовірність події(/>) за формулою (1.1a)
/>.
За формулою(1.10b)
/>,
/>.
Умовний розподілкомпоненти Y при />
/>
Імовірність події(/>) за формулою (1.1a)
/>.
За формулою(1.10b)
/>,
/>.
Умовний розподілкомпоненти Y при />
/>.
Умовні густинирозподілу компонент системи двох неперервнихвипадкових величин /> визначаютьсярівностями
/>,(1.11a)
/>,(1.11b)
/> - умовна густина розподілуймовірності компоненти X при фіксованому значенню />, /> - умовна густина розподілуймовірності компоненти Y при фіксованому значенню />.
Приклад 1.9. Двовимірний вектор /> заданий густиною сумісногорозподілу
/>.
Знайти умовнірозподіли компонент X та Y.
Розв’язування./> в крузі радіуса r ітому за формулою (1.11a)
/>
при /> і
/> при />.
У підсумку
/>
Аналогічно заформулою (1.11b)
/>
Як і будь-якіінші густини розподілу, умовні ймовірності мають такі властивості
/>
/>,
/> />.
Дві випадковівеличини є незалежними, якщо закон розподілу однієї з них не залежитьвід значення іншої. Умовні розподіли незалежних величин дорівнюють їхрозподілам:
/>
для неперервнихвеличин і
/> .
для дискретнихвипадкових величин.
Необхідною тадостатньою умовою незалежності випадкових величин є
/>,(1.12а)
або, як наслідок,
/>.(1.12b)
2.Характеристики системи двох випадкових величин
Система двохвипадкових величин /> з достатньоюточністю може характеризуватися початковими та центральними моментами компонентпорядку />, які є числами і томуназиваються чисельними характеристиками, і умовними початковими та центральнимимоментами компонент порядку />, які єфункціями можливих значень компонент.
Початкові тацентральні моменти означаються рівностями
/>(2.1а)
/>(2.1б)
Найбільшважливими серед них є математичне сподівання компонент, дисперсії компонент такореляційний момент.
Математичнісподівання компонент означаються так:
/>(2.2а)
/>(2.2б)
З використанням математичнихсподівань компонент початкові та центральні моменти системи двох випадковихвеличин можна означити більш зручним способом:
/>,(2.3а)
/>,(2.3б)
(/> — центровані компоненти);
Дисперсіїкомпонент означаються тотожностями
/>,(2.4а)
/>;(2.4б)
Кореляційниймомент характеризує лінійний зв’язок між випадковими величинами. Вінозначається як центральний момент /> іпозначається />:
/>,(2.5)
/>(2.6)
Кореляційниймомент часто називають коваріацією і позначається />.
З використаннямкореляційного моменту і коефіцієнта кореляції 3 –у властивість дисперсії (3.3.2.7)можна узагальнити на випадок суми (різниці) довільних випадкових величин:
/>.(2.7)
Доведення.
/>
/>
/>.
/>.
Для незалежнихвипадкових величин кореляційний момент дорівнює нулю:
/>.
Доведення.
/>
/>.
Абсолютнавеличина кореляційного моменту випадкових величин не перевищує середньогеометричногозначення дисперсій:
/>(2.8)
Доведення. Дисперсія випадкової величини /> дорівнює
/>.(1*)
Дійсно:
/>,
/>,
/>
/>.
За означеннямдисперсія невід’ємна, тому з (1*)
/>
звідки
/>.(2*)
Аналогічно,дисперсія випадкової величини />дорівнює
/>,
звідки
/>.(3*)
Нерівності (2*)та (3*) рівносильні одній нерівності
/>=/>.
З означеннякореляційного моменту слідує, що його розмірність дорівнює добутку розмірностейвипадкових величин. Іншими словами, величина (точніше, число, яке визначає цювеличину) кореляційного моменту залежить від одиниць вимірювання випадковихвеличин. Цього недоліку немає коефіцієнт кореляції, який визначається відношеннямкореляційного моменту випадкових величин і добутку середньоквадратичнихвідхилень компонент /> та />:
/>(2.9)
Абсолютнавеличина коефіцієнта кореляції не перевищує одиниці:
/>.(2.10)
Нерівність (2.10)очевидна, якщо розділити нерівність (2.8) на />.
Дві випадковівеличини X та Y називають корельованими, якщо їхкоефіцієнт кореляції не дорівнює нулю і, відповідно, некорельованими, якщокоефіцієнт кореляції дорівнює нулю. Дві випадкові корельовані величиниобов’язково залежні. (з умови /> одразуслідує, що />, а для незалежних величинкореляційний момент обов’язково дорівнює нулю). Залежні величини можуть бути яккорельованими, так і некорельованими.
Приклад 2.1.Двовимірна випадкова величина /> задана густиною сумісногорозподілу:
/>.
Довести, щовипадкові величини X та Y – залежні некорельовані величини.
Доведення. Необхідно довести, що />та />. З прикладу 1.7.густини розподілу компонент
/>
/>
Видно, що />, а це означає, щовипадкові величини X та Y залежні. Математичні сподіваннярозподілів компонет />і />як симетричних розподілів.З врахуванням цього, з означення кореляційного моменту (2.5)
/>,
(інтеграли віднепарних функцій у симетричних границях дорівнюють нулю), а це і означає, щозалежні випадкові величини X та Y некорельовані.
Незалежні випадкові величиниобов’язково некорельовані. Некорельовані випадкові величини можуть бути якнезалежними, так і залежними. Проте, некорельовані випадкові величині із нормальнимрозподілом у сукупності
/>(2.11)
обов’язковонезалежні (/> та /> — математичні сподівання випадковихвеличин /> та/>.
Доведення Якщо />(некорельованість випадковихвеличин), то (2.11) переходить у
/>
/>
/> (незалежність випадковихвеличин).
З використаннямсумісного розподілу системи випадкових величин /> тамоментів можна строго довести властивості математичного сподівання випадковоївеличини (3.3.1.5) та (3.3.1.6)Доведення 3-ї властивостіматематичного сподівання. За означенням для дискретних величини
/>
/>.
Для неперервнихвеличин
/>
/>
Доведення 4-ївластивості математичного сподівання. За означенням для дискретних величини
/>.
(враховано, щодля незалежних подій />)
Для неперервнихвеличин
/>
/>.
Умовні початковіта центральні моменти порядкуk компонент означаються рівностями
/>(2.12a)
/>(2.12b)
/>(2.13а)
/>(2.13b)
Найбільшважливими серед умовних моментів є умовні математичні сподівання компонент
/>(2.14а)
/>(2.14b)
Умовніматематичні сподівання компонент характеризують зв’язок між випадковими величинамиУмовне математичне сподівання компоненти Y є функцією x іназивається функцією регресії Y на X. Аналогічно, умовне математичнесподівання компонентиX є функцією y і називається функцієюрегресії X на Y.
Приклад 2.2.Дискретна випадкова величина заданасумісним розподілом
y1=3y2=6
/>
Необхіднообчислити функцію регресії Y на X та функцією регресії X на Y.
Розв’язування.За означенням (2.14b) регресія Yна X
/>. (1*)
За формулою(1.1a)
/>,
За формулою(1.10а)
/>, />.
За формулою (1*)
/>.
Аналогічно длярешти значень випадкової величини X .
/>, />, />,
/>.
/>, />, />,
/>.
/>, />, />,
/>.
Отже, функція регресії Y на X
/>
За означенням(2.14a) регресія X на Y
/>.(2*)
За формулою(1.1b)
/>.
За формулою(1.10b)
/>, />, />,
/>.
За формулою (2*)
/>.
Аналогічно дляіншого значення випадкової величини Y.
/>,
/>,/>,
/>, />,
/>.
Отже, функціярегресії X на Y
/>.
Середньоквадратичнарегресія.
Нехай />система двох залежнихвипадкових величин. І нехай необхідно дослідити залежність випадкових величинодне від одного. Досить часто випадкова величина Y апроксимуєтьсялінійною функцією випадкової величини X:
/>,(3.1)
a,b -параметри,які необхідно обчислити. Функція />, яказабезпечує мінімум математичного сподівання
/>
називається середньоквадратичноюрегресією Y на X. Дещо громізкими, але простими викладками можна довести, що
/>.(3.2)
Доведення.
/>/>
/>
/>
/>
/>
/>
/>
Точки мінімумуфункції /> знаходяться як розв’язоксистеми рівнянь
/>/>
/>
З врахуваннямцього ця система рівнянь запишеться у вигляді
/>,
розв’язок якої
/>, />,(3.3)
а значитьсередньоквадратична регресія Y на X остаточно запишеться увигляді
/>(3.4)
Коефіцієнт />називають коефіцієнтомсередньоквадратичної регресії Y на X, а пряму
/>(3.5)
прямою середньоїквадратичної регресії Y на X.
Мінімальнезначення функції /> (3.2)призначеннях a,b(3.3б)дорівнює /> і називається залишковоюдисперсією випадкової величини Y відносно величини X. Вона характеризуєпохибку апроксимації />.При /> залишкова дисперсіядорівнює 0. Це означає, що при таких значеннях коефіцієнта кореляціївипадкові величини X та Y зв’язані лінійною функціональноюзалежністю. Значна величина залишкової дисперсії є ознакою того,апроксимація (3.1) є невдалою. У цьому випадку слід користуватися апроксимацієюполіномами другої, третьої, і вище, степені.
Аналогічно, можнаодержати пряму середньоквадратичної кореляції X на Y:
/>.(3.6)
(коефіцієнт /> — коефіцієнтсередньоквадратичної регресіїX наY, /> — залишковадисперсія випадкової величини X відносно величини Y.При />обидві прямі регресіїспівпадають.
З рівностей (3.4)та (3.6) слідує, що обидві прямі проходять через точку />. Цю точку називають центромсумісного розподілу двовимірної випадкової величини.
Лінійнакореляція нормальних величин
Якщо обидвіфункції регресій X наY та Y на X є лінійнимифункціями, то говорять, що X таY зв’язані лінійноюкореляційною залежністю. Графіки лінійних регресій – прямі лінії, якіспівпадають з прямими середньоквадратичних регресій.
Якщо двовимірнавипадкова величина (X ,Y) має нормальний закон розподілу усукупності, тоX таY зв’язані лінійною кореляційною залежністю.
Доведення.Для спрощення густину нормальногосумісного розподілу можна записати у вигляді
/>,
/>, />, />, />.
Для знаходженнярегресії /> необхідно знайти розподілкомпоненти />:
/>,
/>
/>
/>
/>
/>.
З врахуваннямцього
/>
/>.
/>,
/>
/>,
Тому
/>.
Густина умовногорозподілу компоненти />
/>
/>
/>.
Порівнюючиодержану густину умовного розподілу з густиною нормального розподілу можназробити висновок, що умовний розподіл компоненти /> єнормальним з математичним сподіванням (функцією регресії /> на />)
/>
та умовноюдисперсією
/>.
Аналогічно можнаодержати функцію регресії /> на />
/>.
Видно, що обидвіфункцій регресій є лінійними, а значить кореляція між /> та />є лінійною, що й треба булодовести. Крім того видно, що прямі регресій
/>
/>
співпадають зпрямими середньоквадратичної регресії (3.5) та (3.6).