Что значит эксцесс в статистике

коэффициент эксцесса

коэффициент эксцесса (Kurtosis) — в статистике — мера остроты пика в распределении случайной величины.

эксцесс характеризует распределения, в которых значения величин либо сосредоточены близко к средней величине, либо наоборот распределены далеко от нее.

положительный эксцесс (leptokurtic) — острая вершина, когда пик выше чем пик нормального распределения.

отрицательный эксцесс (platykurtic) — тупая вершина, когда пик ниде пика нормального распределения).

Что значит эксцесс в статистике

Что значит эксцесс в статистике

Как правило, доходы от рынка акций распределены с положительным эксцессом.

Если мы используем распределение с положительным эксцессом, то мы недооцениваем риск очень плохого или очень хорошего сценария.

19 октября 1987 изменение S&P500 за день отстояло на 20 стандартных отклонений от среднего дневного изменения. Вероятность такого события равна нулю, если применять нормальное распределение.

Если дневные доходы распределены нормально, то вероятность события отстоящего на 4 сигмы (станд. откл.) равна 1 раз в 50 лет. Величина которая отстоит больше чем на 5 сигм — 1 раз в 7000 лет.

Исходя из этого, можно заключить, что нормальное распределение лучше описывает годовые изменения индекса S&P500, чем месячные или ежедневные.

Источник

7. Асимметрия и эксцесс эмпирического распределения

В предыдущих статьях мы познакомились с показателями центральной тенденции и вариации, и сейчас рассмотрим ещё пару характеристик статистической совокупности. Для тех, кто зашёл с поисковика и хочет изучить тему с азов, сразу ссылка на организационный урок: Математическая статистика для «чайников», там же, в конце, список всех статей курса. И до статьи 7-й – как рукой подать, после чего будет небольшой и очень приятый экзамен.

Итак, что такое асимметрия и эксцесс? Говоря простым языком, это показатели, характеризующие геометрическую форму распределения. Асимметрия характеризует меру скошенности графика влево / вправо, а эксцесс – меру его высоты.

Данные показатели рассчитываются как для эмпирических, так и для теоретических распределений, которые мы изучили в курсе теории вероятностей, и за «эталон» симметрии принято нормальное распределение:
Что значит эксцесс в статистике
Очевидно, что любое нормальное распределение строго симметрично относительно своего центра, следовательно, его асимметрия равна нулю. Данный график кажется пологим, но стандартное отклонение Что значит эксцесс в статистикев данном примере достаточно велико (см. на синие точки) и на самом деле такая высота «гармонична». Поэтому эксцесс нормального распределения (любого) принимают за «отправную» нулевую точку.

Почему именно нормальное распределение? Потому что философское – обязательно прочитайте эту интереснейшую статью по ссылке, если ещё не успели этого сделать!

В теории вероятностей существуют строгие формулы для вычисления коэффициентов асимметрии Что значит эксцесс в статистикеи эксцесса Что значит эксцесс в статистике(будут ниже), но на практике мне такие задачи не встречались. И поэтому я сразу перехожу к статистике и распределениям эмпирическим, т.к. здесь таких задач как раз выше крыши. С положительным эксцессом, если выразиться тематически 🙂

Начнём с асимметрии. Асимметрия характеризует меру скошенности полигона или гистограммы влево / вправо относительно самого высокого участка, и во многих случаях для «прикидки» асимметрии достаточно взглянуть на соответствующие чертежи. Так, например, посмотрим на полигон частот из Примера 8:
Что значит эксцесс в статистике
И, в принципе, тут всё видно – пациент скорее симметричен, чем асимметричен 🙂

Простейшим критерием симметрии является равенство средней, моды и медианы: но в жизни такого идеального совпадения, конечно, не бывает (даже тело человека немного асимметрично), и поэтому у «почти симметричных» распределений эти показатели должны располагаться очень близко друг к другу. И в самом деле, как мы вычислили в Примере 8: Что значит эксцесс в статистике.

Обратите внимание, что рассматриваемые распределения имеют единственную модальную вершину, и далее речь пойдёт только о таких распределениях.

Правосторонняя асимметрия характеризуется удлинённым правым «хвостом», смотрим на гистограмму Примера 10:
Что значит эксцесс в статистике
Простейшим признаком правосторонней асимметрии является тот факт, что Что значит эксцесс в статистике, и это неудивительно – ведь справа находится значительное количество вариант, и поэтому средняя Что значит эксцесс в статистикесмещена вправо. И поэтому английский статистик Карл Пирсон, который ещё не раз нас порадует своими методами, предложил следующую формулу для расчёта коэффициента асимметрии:

Что значит эксцесс в статистике, где Что значит эксцесс в статистикесреднее квадратическое отклонение статистической совокупности. Что тоже логично, ведь у разных распределений – разный «разброс» значений и разные представления о мере асимметрии.

Левостороння асимметрия, наоборот, характеризуются удлинённым левый «хвостом» и неравенством Что значит эксцесс в статистике,…. картинки быстро не нашлось, поэтому просто разверну чертёж в графическом редакторе:
Что значит эксцесс в статистике
Из формулы Что значит эксцесс в статистикеследует, что в левостороннем случае коэффициент асимметрии отрицателен (т.к. Что значит эксцесс в статистике), а в правостороннем – положителен (Что значит эксцесс в статистике), и чем больше Что значит эксцесс в статистикепо модулю – тем сильнее скос распределения.

Недостаток формулы Пирсона состоит в том, что она описывает лишь центральную часть распределения и практически не учитывает «периферию». И, чтобы вас томить, сразу продвинутая формула, которая охватывает все варианты, для определённости запишу её для выборочной совокупности объёма Что значит эксцесс в статистике:

Что значит эксцесс в статистике, где Что значит эксцесс в статистике– куб стандартного выборочного отклонения, а Что значит эксцесс в статистике– так называемый центральный эмпирический момент третьего порядка. Для несгруппированной статической совокупности он рассчитывается так:
Что значит эксцесс в статистике( Что значит эксцесс в статистикевыборочная средняя),
а для сформированного вариационного ряда – так:
Что значит эксцесс в статистике, где Что значит эксцесс в статистикеварианты дискретного ряда или середины частичных интервалов интервального ряда, а Что значит эксцесс в статистике– соответствующие частоты.

Смысл знаков тот же самый: если Что значит эксцесс в статистике, то распределение скошено вправо, если Что значит эксцесс в статистике– то влево. При этом принята следующая условная градация: если полученное значение по модулю меньше, чем 0,25, то асимметрия незначительна, если Что значит эксцесс в статистике, то умеренная, и если Что значит эксцесс в статистике, то существенная.

И чем МЕНЬШЕ по модулю Что значит эксцесс в статистике, тем рассматриваемое эмпирическое распределение БЛИЖЕ к нормальному распределению с параметрами Что значит эксцесс в статистике.

Справочно формулы теории вероятностей: асимметрия случайной величины рассчитывается по «родственной» формуле Что значит эксцесс в статистике, где Что значит эксцесс в статистике– среднее квадратическое отклонение, а Что значит эксцесс в статистикецентральный теоретический момент 3-го порядка. Для дискретной случайной величины он рассчитывается так: Что значит эксцесс в статистике, а для непрерывной – через интеграл: Что значит эксцесс в статистике.

Теперь об эксцессе замолвим слово. Он характеризует высоту и очень коварный. В том смысле, что глаза будут часто обманывать. Так, например, вернёмся к Примеру 7 статьи Интервальный вариационный ряд, единственное, я рассмотрю равные интервалы, как это на самом деле было в оригинальной задаче:
Что значит эксцесс в статистике
Ну видно же – гистограмма серьёзно вытянута вверх. Но это только кажется. Дело в том, что стандартное отклонение Что значит эксцесс в статистикеданной выборки невелико, и для сего небольшого рассеяния такая высота ДАЖЕ МАЛА. МалА – по сравнению с «эталонным» нормальным распределением с параметрами Что значит эксцесс в статистике.

Поэтому аналитика и ещё раз аналитика. Коэффициент эксцесса эмпирического распределения рассчитывается по формуле:

Что значит эксцесс в статистике, где Что значит эксцесс в статистикецентральный эмпирический момент четвёртого порядка:
Что значит эксцесс в статистике– для несгруппированных данных, и
Что значит эксцесс в статистике– для сформированного вариационного ряда.

Для случайных величин из тервера формула схожа: Что значит эксцесс в статистике, где Что значит эксцесс в статистике– для дискретной, и Что значит эксцесс в статистике– для непрерывной случайной величины.

Если Что значит эксцесс в статистике, то эмпирическое распределение является более высоким («островершинным») – относительно «эталонного» нормального распределения с параметрами Что значит эксцесс в статистике. Если же Что значит эксцесс в статистике– то более низким и пологим. И чем больше Что значит эксцесс в статистикепо модулю, тем «аномальнее» высота в ту или иную сторону.

В примере выше, как ни странно, Что значит эксцесс в статистике, и сейчас мы убедимся в этом аналитически:

Итак, сто пачек чая из Примера 7 ( Что значит эксцесс в статистике– середины равных интервалов):
Что значит эксцесс в статистике

и нам требуется вычислить коэффициенты асимметрии и эксцесса

Решение: поскольку в формулах асимметрии и эксцесса фигурирует стандартное отклонение, то сначала нужно рассчитать выборочную среднюю и дисперсию.

Вычислим произведения Что значит эксцесс в статистике, их сумму и Что значит эксцесс в статистикеграмм – средний вес пачки чая. Дисперсию здесь сподручнее найти не по формуле, а по определению: Что значит эксцесс в статистике. Для этого рассчитаем произведения Что значит эксцесс в статистикеи сразу Что значит эксцесс в статистике:
Что значит эксцесс в статистике

Ловкость рук и никаких трудностей, вы удивитесь, как всё быстро:

Собственно, финальные расчёты:
Что значит эксцесс в статистике
здесь правильнее, конечно, отклонение поправить, но обычно этим пренебрегают.

Центральные моменты 3-го и 4-го порядков:
Что значит эксцесс в статистике

И, наконец, коэффициенты. Вычислим коэффициент асимметрии:
Что значит эксцесс в статистике, то есть, распределение обладает существенной правосторонней асимметрией, что, кстати, хорошо было видно по чертежу.

Вычислим коэффициент эксцесса:
Что значит эксцесс в статистике– вот оно как! Оказывается, распределение не то что выше, а заметно ниже, чем нормальное распределение с параметрами Что значит эксцесс в статистике

Ответ: Что значит эксцесс в статистике

Вот такой вот у нас получился эксекас 🙂

Помимо геометрических форм, эти коэффициенты позволяют «прикинуть», насколько близка к нормальному (или другому) распределению не только выборочная, но и вся генеральная совокупность. Это одна из важнейших задач статистики, которую мы разберём в разделе Статистические гипотезы.

Ну а сейчас я предлагаю вам небольшое экзаменационное задание по первым семи урокам. Оно типично для студенческой практики – дана статистическая совокупность, и требуется выполнить много-много чего. Внимательно проверьте, всё ли вы усвоили, всё ли умеете:

В результате эксперимента получены данные, записанные в виде статистического ряда:
Что значит эксцесс в статистике
…это ещё ерунда 🙂

И сразу обратите внимание, что в условии речь идёт о результатах эксперимента, а значит, перед нами выборочная совокупность, т.к. теоретически опыты можно повторять бесконечное количество раз.

1) Составить интервальный вариационный ряд, состоящий из 9 равных интервалов. Видео в помощь.

3) Найти моду и медиану.

5) Вычислить коэффициенты асимметрии и эксцесса, сделать выводы.

Не тушуйтесь – я с вами! Краткое решение для сверки внизу страницы.

И на этом, как вы правильно догадались, дело не заканчивается, поэтому сохраните файл с решением! Типовая задача содержит больше пунктов, и после изучения гипотезы о законе распределения генеральной совокупности, выполняем следующие задания:

6) По найденным характеристикам сделать вывод о форме эмпирического ряда распределения.

7) Построить нормальную кривую по опытным данным на графике гистограммы.

8) Произвести оценку степени близости теоретического распределения эмпирическому ряду с помощью критерия согласия Пирсона на уровне значимости 0,05.

Пример 20. Решение:

1) По статистическим данным находим: Что значит эксцесс в статистике, Что значит эксцесс в статистике.
Вычислим размах вариации: Что значит эксцесс в статистикеед.
По условию, выборку следует разделить на Что значит эксцесс в статистикеравных интервалов, таким образом, длина частичного интервала:
Что значит эксцесс в статистикеед.
Разметим интервалы и подсчитаем частоты Что значит эксцесс в статистикепо каждому интервалу, после чего убедимся, что объём выборки Что значит эксцесс в статистике. Вычислим относительные частоты Что значит эксцесс в статистикеи относительные накопленные частоты Что значит эксцесс в статистике:
Что значит эксцесс в статистике

2) Построим гистограмму относительных частот. Поскольку длина частичного интервала Что значит эксцесс в статистике, то плотности относительных частот Что значит эксцесс в статистикесовпадают с соответствующими частотами Что значит эксцесс в статистике:

Что значит эксцесс в статистике

Построим эмпирическую функцию распределения:
Что значит эксцесс в статистике

3) Моду вычислим по формуле Что значит эксцесс в статистике, в данном случае:
Что значит эксцесс в статистике– нижняя граница модального интервала;
Что значит эксцесс в статистике– длина модального интервала;
Что значит эксцесс в статистике– частота модального интервала;
Что значит эксцесс в статистике– частота предыдущего интервала;
Что значит эксцесс в статистике– частота следующего интервала.

Таким образом:
Что значит эксцесс в статистикеед.

Медиану вычислим по формуле Что значит эксцесс в статистике, в данном случае:
Что значит эксцесс в статистике– объём выборочной совокупности;
половину вариант содержит интервал Что значит эксцесс в статистикеи Что значит эксцесс в статистике– его нижняя граница;
Что значит эксцесс в статистике– длина медианного интервала;
Что значит эксцесс в статистике– частота медианного интервала;
Что значит эксцесс в статистике– накопленная частота предыдущего интервала.

Таким образом:
Что значит эксцесс в статистикеед.

4) Найдём середины Что значит эксцесс в статистикеинтервалов, произведения Что значит эксцесс в статистикеи вычислим выборочную среднюю Что значит эксцесс в статистикеед., после чего заполним оставшуюся часть таблицы и рассчитаем остальные показатели:
Что значит эксцесс в статистике
Выборочная дисперсия:
Что значит эксцесс в статистике,
выборочное среднее квадратическое отклонение:
Что значит эксцесс в статистикеед.,
коэффициент вариации:
Что значит эксцесс в статистике

5) Вычислим центральные эмпирические моменты 3-го и 4-го порядков:
Что значит эксцесс в статистике
коэффициент асимметрии:
Что значит эксцесс в статистике
и коэффициент эксцесса:
Что значит эксцесс в статистике

Таким образом, выборочная совокупность практически симметрична, но несколько ниже, чем нормальное распределение с параметрами Что значит эксцесс в статистике.

Автор: Емелин Александр

(Переход на главную страницу)

Что значит эксцесс в статистике Zaochnik.com – профессиональная помощь студентам

cкидкa 15% на первый зaкaз, прoмoкoд: 5530-hihi5

Что значит эксцесс в статистике Tutoronline.ru – онлайн репетиторы по математике и другим предметам

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *