Что называют доверительным интервалом и доверительной вероятностью надежностью
Доверительная вероятность и доверительный интервал.
Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности,а сам интервал — доверительным интервалом.
.
на так называемый коэффициент Стьюдента. Коэффициенты Стьюдента для ряда значений и n приведены в таблице.
Число измерений n | Доверительная вероятность y | ||
0,67 | 0,90 | 0,95 | 0,99 |
2,0 | 6,3 | 12,7 | 63,7 |
1,3 | 2,4 | 3,2 | 5,8 |
1,2 | 2,1 | 2,8 | 4,6 |
1,2 | 2,0 | 2,6 | 4,0 |
1,1 | 1,8 | 2,3 | 3,3 |
1,0 | 1,7 | 2,0 | 2,6 |
Окончательно, для измеряемой величины y при заданной доверительной вероятности y и числе измерений n получается условие
Величину мы будем называть случайной погрешностьювеличины y.
Пример: см. лекцию №5 – ряд чисел.
При числе измерений – 45 и доверительной вероятности – 0,95 получим, что коэффициент Стьюдента приблизительно равен 2,15. Тогда доверительный интервал для данного ряда измерений равен 62,6.
Источником грубых погрешностей нередко бывают резкие изменения условий измерения и ошибки, допущенные оператором:
— неправильный отсчет по шкале измерительного прибора, происходящий из-за неверного учета цены малых делений шкалы;
— неправильная запись результата наблюдений, значений отдельных мер использованного набора, например, гирь;
— хаотические изменения параметров напряжения, питающего средства измерения, например, его амплитуды или частоты.
Доверительные интервалы и доверительная вероятность
Точечные оценки имеют тот недостаток, что по ним нельзя судить о точности полученных оценок. Поэтому возникает задача определения на основании выборочных значений такого интервала, который покрывал бы неизвестной значение параметра с заданной вероятностью.
В отличие от точечной оценки, интервальная оценка позволяет получить вероятностную характеристику точности оцениваемого параметра.
Выборочные параметры являются случайными величинами, их отклонения от генеральных (т.е. погрешности их определения) также будут случайными. Оценка этих отклонений носит вероятностный характер – можно лишь указать вероятность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервалами и доверительными вероятностями.
Доверительный интервал – интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения.
Доверительная вероятность – вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным.
Оценивание с помощью доверительного интервала – способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.
Пусть для генерального параметра a получена из опыта несмещенная оценка a*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность β – такую, что событие с этой вероятностью можно считать практически достоверным, и найдем такое значение ε для которого
(5.8.1)
называемой уровнем значимости или риском. Уровень значимости часто выражают в процентах. Иначе формулу ( (5.8.1* ) можно интерпретировать как вероятность того, что истинное значение параметра а лежит в пределах
Вероятность β называется доверительной вероятностью, доверительным уровнем или надежностью, т.к. она характеризует надежность полученной оценки.
Интервал называется доверительным интервалом. Границы интервала и доверительными границами. Доверительный интервал при данной доверительной вероятности определяет точность оценки параметра.
При этом отметим следующее. Ранее мы рассматривали вероятность попадания случайной величины на заданный (неслучайный) интервал. В данном случае дело обстоит иначе: величина ане случайна, зато случаен интервал I b . Случайно его положение на числовой прямой, определяемое его центром а * , случайна и длина интервала 2 e, так как величина e вычисляется, как правило, по опытным данным, т.е. по результатам эксперимента. Поэтому в рассматриваемом случае удобно толковать интервал I как вероятность того, что случайный интервал I b накроет величину а.
Величина доверительного интервала зависит от доверительной вероятности, с которой гарантируется нахождение параметра внутри доверительного интервала: чем больше величина β, тем больше и ε (т.е. с чем большей вероятностью мы хотим гарантировать полученный результат, тем в большем интервале он должен находиться).
Увеличение числа опытов проявляется в сокращении доверительного интервала при постоянной доверительной вероятности или в повышении доверительной вероятности при сохранении доверительного интервала.
ППри построении доверительного интервала решается задача об абсолютном отклонении:
(5.8.2.)
Таким образом, если известен закон распределения оценки a*, то задача определения доверительного интервала решается довольно просто.
Рассмотрим построение доверительного интервала для математического ожидания нормально распределенной случайной величины с известным генеральным стандартом σх.
Понятие генерального стандарта тесно связано с понятием точности прибора. Класс точности прибора – это выраженная в процентах относительная предельная погрешность измерения величины, равной пределу измерения прибора. В измерительной технике в большинстве отраслей промышленности под предельной погрешностью понимается величина, равная двум среднеквадратическим отклонениям
Пусть имеется выборка объема n значений случайной величины. Оценкой mx является среднее выборки:
Для построения доверительного интервала необходимо знать распределение этой оценки. Для выборок из генеральной совокупности, распределенной нормально можно показать, что также имеет нормальное распределение с математическим ожиданием mx и средним квадратическим отклонением . Тогда
. (5.8.3.)
Задавшись доверительной вероятностью, определим по таблице значение функции Лапласа . Тогда доверительный интервал для математического ожидания будет иметь вид
или
Из оценки видно, что уменьшение доверительного интервала обратно пропорционально квадратному корню из числа наблюдений. Следовательно, если надо уменьшить возможную ошибку в два раза надо увеличить число наблюдений в 4 раза.
Если закон распределения оценки не известен, то в математической статистике применяют обычно два метода:
1) приближенный – при n более 50 заменяют неизвестные параметры их оценками;
2) от случайной величины a * переходят к другой случайной величине, закон распределения которой не зависит от оцениваемого параметра а, а зависит только от объема выборки n и от вида распределения величины Х. Такого рода величины наиболее подробно изучены для нормального закона. В качестве доверительных границ берут симметричные квантили
,
Если выразить через р,
.
На практике, как правило, число измерений конечно и не превышает 10…30. При малом числе измерений фактическая дисперсия неизвестна, поэтому для построения доверительного интервала математического ожидания используют выборочную дисперсию и приведенную случайную величину:
t – случайная величина, имеющая распределение, отличное от нормального, зависящее от числа степеней свободы(t – распределение или распределение Стьюдента). При больших значениях n распределение Стьюдента приближается к стандартному нормальному распределению. И, по аналогии, получаем построение доверительного интервала
Дата добавления: 2020-12-22 ; просмотров: 512 ; Мы поможем в написании вашей работы!
Точность оценки, доверительная вероятность (надежность). Доверительный интервал
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше,- точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т. е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Однако важно подчеркнуть, что для малых выборок (n 2 с k степенями свободы, то величина
(*)
распределена по закону Стьюдента с k степенями свободы. Пусть количественный признак X генеральной совокупности распределен нормально, причем М(Х)=а, σ(Х)= σ. Если из этой совокупности извлекать выборки объема n и по ним находить выборочные средние, то можно доказать, что выборочная средняя распределена нормально, причем (см. гл. VIII, § 9)
, .
Тогда случайная величина
(**)
также имеет нормальное распределение как линейная функция нормального аргумента (см. гл. XII, § 10, замечание), причем М (Z) = 0, σ(Z)=l. Доказано, что случайные величины Z и
(***)
Следовательно, подставив (**) и (***) в (*), получим величину
,
которая распределена по закону Стьюдента с k = n-1 степенями свободы.
Доверительный интервал и доверительная вероятность
Для подавляющего большинства простых измерений достаточно хорошо выполняется так называемый нормальный закон случайных погрешностей (закон Гаусса), выведенный из следующих эмпирических положений.
1) погрешности измерений могут принимать непрерывный ряд значений;
2) при большом числе измерений погрешности одинаковой величины, но разного знака встречаются одинаково часто,
3) чем больше величина случайной погрешности, тем меньше вероятность ее появления.
, (2)
где — функция распределения случайных ошибок (погрешностей), характеризующая вероятность появления ошибки , σ – средняя квадратичная ошибка.
Величина σ не является случайной величиной и характеризует процесс измерений. Если условия измерений не изменяются, то σ остается постоянной величиной. Квадрат этой величины называют дисперсией измерений. Чем меньше дисперсия, тем меньше разброс отдельных значений и тем выше точность измерений.
Точное значение средней квадратичной ошибки σ, как и истинное значение измеряемой величины, неизвестно. Существует так называемая статистическая оценка этого параметра, в соответствии с которой средняя квадратичная ошибка равняется средней квадратичной ошибке среднего арифметического . Величина которой определяется по формуле
, (3)
где — результат i-го измерения; — среднее арифметическое полученных значений; n – число измерений.
Чем больше число измерений, тем меньше и тем больше оно приближается к σ. Если истинное значение измеряемой величины μ, ее среднее арифметическое значение, полученное в результате измерений , а случайная абсолютная погрешность , то результат измерений запишется в виде .
Интервал значений от до , в который попадает истинное значение измеряемой величины μ, называется доверительным интервалом. Поскольку является случайной величиной, то истинное значение попадает в доверительный интервал с вероятностью α, которая называется доверительной вероятностью, или надежностью измерений. Эта величина численно равна площади заштрихованной криволинейной трапеции. (см. рис.)
Все это справедливо для достаточно большого числа измерений, когда близка к σ. Для отыскания доверительного интервала и доверительной вероятности при небольшом числе измерений, с которым мы имеем дело в ходе выполнения лабораторных работ, используется распределение вероятностей Стьюдента. Это распределение вероятностей случайной величины , называемой коэффициентом Стьюдента, дает значение доверительного интервала в долях средней квадратичной ошибки среднего арифметического .
. (4)
Функция распределения табулирована (табл.1). Значение коэффициента Стьюдента находится на пересечении строки, соответствующей числу измерений n, и столбца, соответствующего доверительной вероятности α
Таблица 1.
n | α | n | α | ||||
0,8 | 0,9 | 0,95 | 0,98 | 0,8 | 0,9 | 0,95 | 0,98 |
1,9 | 2,9 | 4,3 | 7,0 | 1,5 | 2,0 | 2,6 | 3,4 |
1,6 | 2,4 | 3,2 | 4,5 | 1,4 | 1,9 | 2,4 | 3,1 |
1,5 | 2,1 | 2,8 | 3,7 | 1,4 | 1,9 | 2,4 | 3,9 |
Пользуясь данными таблицы, можно:
1) определить доверительный интервал, задаваясь определенной вероятностью;
2) выбрать доверительный интервал и определить доверительную вероятность.
При косвенных измерениях среднюю квадратичную ошибку среднего арифметического значения функции вычисляют по формуле
. (5)
Доверительный интервал и доверительная вероятность определяются так же, как и в случае прямых измерений.
Доверительный интервал для вероятности события:
Пусть вероятность
По заданному уровню надежности из таблицы функции Лапласа (см. прил., табл. П2) можно найти такое что Правая часть равенства (3.2.1) будет равна , если
откуда При подстановке такого в (3.2.1) получается равенство
К сожалению, в формуле (3.2.2) доверительные границы для вероятности выражаются через саму эту неизвестную вероятность. Это затруднение можно обойти, заметив, что Тогда формулу (3.2.2) можно записать в виде
Оценка величиной 1/4 приемлема, если есть уверенность, что неизвестная вероятность близка к 1/2. Но при значениях p близких к 0 или 1 такая оценка слишком груба. Например, при получаем всего лишь вместо 0,25. Можно точный доверительный интервал заменить приближенным, если учесть, что при большом числе опытов Тогда из (3.2.2) следует, что
Пример:
Для обследования большой партии изделий (несколько тысяч штук) наугад выбрано 160 изделий. Среди них оказалось 56 изделий низкого сорта. Оценить долю изделий низкого сорта в этой партии с надежностью 0,95.
Решение. Так как партия изделий крупная, то для упрощения можно считать, что по мере выбора изделий состав партии заметно не изменяется и вероятность выбрать наугад изделие низкого сорта равна доле низкосортных изделий в этой партии. Тогда задача сводится к построению доверительного интервала для вероятности выбрать из этой партии изделие низкого сорта. Частота изделий низкого сорта в выборке равна Из таблицы функции Лапласа (см. прил., табл. П2) следует, что Поэтому
или Итак, по данной выборке можно с вероятностью 0,95 утверждать, что во всей партии содержится от 27% до 42% изделий низкого сорта.
Пример:
Было проведено 400 испытаний механизма катапультирования. В этих испытания не зарегистрировано ни одного отказа. С надежностью 0,95 оценить вероятность отказа механизма катапультирования.
Решение. В данной серии испытаний частота появления отказа Поэтому непосредственно использовать формулу (3.2.4) нельзя. Заметим, что так как Функция Лапласа строго возрастает. Поэтому меньшему значению аргумента соответствует меньшее значение функции. В расчете на худший вариант можно воспользоваться формулой (3.2.3). По таблице функции Лапласа (см. прил., табл. П2) находим, что Поэтому и
Еще раз подчеркнем, что доверительный интервал (3.2.3) построен в расчете на худший вариант, когда вероятность события близка к Но большое число опытов и нулевая частота события в них позволяют с уверенностью утверждать, что вероятность события близка к нулю. Если несколько ухудшить статистику испытаний и посчитать что один отказ все-таки наблюдался, то Тогда по формуле (3.2.4) получаем приближенный доверительный интервал
или Это приближенный доверительный интервал, но он определенно более точен, чем грубая оценка по формуле (3.2.3).
Ответ.
Пример:
При штамповке 70% деталей выходит первым сортом, 20% – вторым и 10% – третьим. Определить, сколько нужно взять деталей, чтобы с вероятностью равной 0,997 можно было утверждать, что доля первосортных среди них будет отличаться от вероятности изготовления первосортной детали не более чем на 0,05 в ту или другую сторону? Ответить на тот же вопрос, если процент первосортных деталей неизвестен.
Решение. Изготовление каждой детали можно считать независимым испытанием с вероятностью «успеха» Нужно выбрать такое число испытаний чтобы по формуле (3.2.1):
По таблице функции Лапласа (см. прил., табл. П2) находим, что Тогда откуда Если процент первосортных деталей неизвестен, то
Учитывая, что и замену на 1/4 придется компенсировать некоторым увеличением получим или
Доверительные вероятности, доверительные интервалы
В материалах сегодняшней лекции мы рассмотрим доверительные вероятности и доверительные интервалы.
При статистической обработке результатов наблюдений необходимо знать не только точечную оценку параметра , но и уметь оценить точность этой оценки. Для этого введём понятие доверительного интервала.
Доверительным интервалом для параметра называется интервал содержащий значение с заданной вероятностью .
Число называется доверительной вероятностью.
Пусть -заданное число (оно обычно равно 0,8, 0,9,
0,95. ).
Так как ТО
интервал содержит (накрывает) значение (рис. 1).
Интервал — это доверительный интервал для параметра .
Покажем, как найти доверительный интервал для математического ожидания с заданной доверительной вероятностью
Пусть точечная оценка математического ожидания.
Используя центральную предельную теорему, можно считать, что случайная величина для больших п распределена по нормальному закону, а значит вероятности можно считать, используя функцию Лапласа Ф(х).
Тогда
Отсюда
Здесь находится по таблице Лапласа в обратном порядке: по
значению функции Ф(х) находится аргумент
Таким образом, доверительный интервал для математического ожидании имеет вид
Заключение по лекции:
В лекции мы рассмотрели доверительные вероятности и доверительные интервалы.
При копировании любых материалов с сайта evkova.org обязательна активная ссылка на сайт www.evkova.org
Сайт создан коллективом преподавателей на некоммерческой основе для дополнительного образования молодежи
Сайт пишется, поддерживается и управляется коллективом преподавателей
Whatsapp и логотип whatsapp являются товарными знаками корпорации WhatsApp LLC.
Cайт носит информационный характер и ни при каких условиях не является публичной офертой, которая определяется положениями статьи 437 Гражданского кодекса РФ. Анна Евкова не оказывает никаких услуг.