Копула
У статистиці копула або зв'язка використовується як загальний метод формулювання сукупного розподілу випадкових величин таким чином, що можна зобразити різні загальні типи залежності[1].
Нехай і — випадкові вели��ини, функції розподілу імовірностей яких визначені на множинах та відповідно. Позначимо і-ту реалізацію j-ї випадкової величини як . Називатимемо функцію зростаючою за кожною зі змінних і , якщо для неї виконується така умова:
- , коли ;
Визначимо підкопулу як двовимірну функцію двох змінних і , визначену на такій множині , що і , з областю значень , що задовольняє таким умовам:
- Обмеження знизу, тобто , якщо
- , якщо
- Зростання за кожною зі змінних.
Копула — це підкопула у разі, коли і . Саме на даному етапі можливо застосувати копули до моделювання спільних ймовірнісних розподілів, оскільки імовірність будь-якої випадкової величини також належить відрізку від нуля до одиниці.
- Обмеженість: .
- Для будь-якої зв'язки виконується нерівність (границя Фреше-Хефдинга, Frechet-Hoeffding): .
- Упорядкованість (домінування): зв'язка домінує над зв'язкою , якщо виконується .
Цей клас методів припускає параметризацію як граничних розподілів, так і зв'язки. Якщо базовий підхід — метод найбільшої правдоподібності (англ. Maximum Likelihood Estimation) передбачає максимізацію функції правдоподібності одночасно за граничними розподілами і за зв'язкою, то метод «від маргіналів» (Inference for Margin — IFM) передбачає два етапи оцінки: спочатку — параметризація граничних розподілів, потім — копули.
Напівпараметричні методи також припускають двоетапну оцінку копули. Але на першому етапі замість оцінки граничних розподілів використовується емпіричний розподіл. На другому ж етапі відбувається параметрична оцінка копули. У роботі [Kim G., Silvapulle M., Silvapulle P. (2007)] показано, що напівпараметричний метод (SP — semi-parametric) дає більш ефективні і стійкі оцінки ніж параметричні методи у випадках, коли тип оцінюваного розподілу не відомий і, як наслідок, виникає загроза їхньої неправильної специфікації.
Серед непараметричних методів оцінки копул можна виділити підходи на основі оцінки емпіричної копули і ядерних оцінок. Перший підхід передбачає оцінку функції розподілу емпіричної копули, що відображає кількість випадків, коли реалізації випадкових величин одночасно потрапили в обрану групу розбиття нескінченного ймовірнісного простору (докладніше див. [Nelsen (2006), p. 219]).
Найпоширенішим критерієм вибору оптимальної копули є критерій на основі значення функції максимальної правдоподібності — критерії Акаіке (AI) і Шварца (BI). Наступними за частотою застосування є тести Колмогорова-Смирнова й Андерсона-Дарлінга. Третім є метод оцінки дистанції до емпіричної копули.
Мінімальна копула — це нижня границя для всіх копул, тільки в двовимірному випадку відповідає строго негативній кореляції між випадковими величинами:
Максимальна копула — це верхня границя для всіх копул, відповідає строго позитивній кореляції між випадковими величинами:
Одна часткова проста форма копули:
де називають функцією-генератором. Такі копули називаються архімедовими. Кожна функція-генератор, що задовольняє наведеним нижче властивостям є основою для правильної копули:
Копула-добуток, також називана незалежною копулою, — це копула, що не має залежностей між змінними, її функція щільності завжди дорівнює одиниці.
Копула Клейтона (Clayton):
Для у копулі Клейтона випадкові величини статистично незалежні.
Підхід, заснований на функціях-генераторах, може бути розповсюджений для створення багатовимірних копул за допомогою простого додавання змінних.
При аналізі даних із невідомим розподілом, можна побудувати «емпіричну копулу» шляхом підбору згортки таким чином, щоб граничні розподіли вийшли рівномірними. Математично це можна записати так:
- Число пар таких що
де x(і) — і-та порядкова статистика x.
Моделювання залежностей за допомогою копул широко використовується для оцінювання фінансових ризиків. Крім того, копули також застосовувалися до задач страхування життя як гнучкий інструмент, що дозволяє моделювати тривалість життя двох і більше осіб чи час до настання певної події.
Копули було успішно використано для формування бази даних для аналізу надійності мостів[2] і для різноманітних багатовимірних симуляцій моделей в цивільному, механічному машинобудуванні, а також будівництва у відкритому морі.
- ↑ Nelsen, Roger B. (1999), An Introduction to Copulas, New York: Springer, ISBN 0387986235.
- ↑ Onken, A; Grünewälder, S; Munk, MH; Obermayer, K (2009), Aertsen, Ad (ред.), Analyzing Short-Term Noise Dependencies of Spike-Counts in Macaque Prefrontal Cortex Using Copulas and the Flashlight Transformation, PLoS Computational Biology, 5 (11): e1000577, doi:10.1371/journal.pcbi.1000577, PMC 2776173, PMID 19956759, архів оригіналу за 9 червня 2011, процитовано 15 березня 2011
{{citation}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)