Что называют мощностью критерия гипотеза но

Ошибки I и II рода при проверке гипотез, мощность

Общий обзор

Большинство проверяемых гипотез сравнивают между собой группы объектов, которые испытывают влияние различных факторов.

Например, можно сравнить эффективность двух видов лечения, чтобы сократить 5-летнюю смертность от рака молочной железы. Для данного исхода (например, смерть) сравнение, представляющее интерес (напри­мер, различные показатели смертности через 5 лет), называют эффектом или, если уместно, эффектом лечения.

Нулевую гипотезу выражают как отсутствие эффекта (например 5-летняя смертность от рака мо­лочной железы одинаковая в двух группах, получаю­щих разное лечение); двусторонняя альтернативная гипотеза будет означать, что различие эффектов не равно нулю.

Критериальная проверка гипотезы дает возможность определить, достаточно ли аргументов, чтобы отвергнуть нулевую гипотезу. Можно принять только одно из двух решений:

Важно: В литературе достаточно часто встречается понятие «принять нулевую гипотезу». Хотелось бы внести ясность, что со статистической точки зрения принять нулевую гипотезу невозможно, т.к. нулевая гипотеза представляет собой достаточно строгое утверждение (например, средние значения в сравниваемых группах равны Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но).

Поэтому фразу о принятии нулевой гипотезы следует понимать как то, что мы просто остаемся в рамках гипотезы.

Принятие неправильного решения

Возможно неправильное решение, когда отвергают/не отвергают нулевую гипотезу, потому что есть только выборочная информация.

Верная гипотеза
H0H1
Результат
применения
критерия
H0H0 верно принятаH0 неверно принята
(Ошибка второго рода)
H1H0 неверно отвергнута
(Ошибка первого рода)
H0 верно отвергнута

Ошибка 1-го рода: нулевую гипотезу отвергают, когда она истинна, и делают вывод, что имеется эффект, когда в действительности его нет. Максимальный шанс (вероятность) допустить ошибку 1-го рода обозначается α (альфа). Это уровень значимости критерия; нулевую гипотезу отвергают, если наше значение p ниже уровня значимости, т. е., если p 0,05, то нулевую гипотезу не отвергнут и, следовательно, не допустят ошибки 1-го рода.

Ошибка 2-го рода: не отвергают нулевую гипотезу, когда она ложна, и делают вывод, что нет эффекта, тогда как в действительности он существует. Шанс возникновения ошибки 2-го рода обозначается β (бета); а величина (1-β) называется мощностью критерия.

Следовательно, мощность — это вероятность отклонения нулевой гипотезы, когда она ложна, т.е. это шанс (обычно выраженный в процентах) обнаружить реальный эффект лечения в выборке данного объема как статистически значимый.

В идеале хотелось бы, чтобы мощность критерия составляла 100%; однако это невозможно, так как всегда остается шанс, хотя и незначительный, допустить ошибку 2-го рода.

К счастью, известно, какие факторы влияют на мощность и, таким образом, можно контролировать мощность критерия, рассматривая их.

Мощность и связанные факторы

Планируя исследование, необходимо знать мощность предложенного критерия. Очевидно, можно начинать исследование, если есть «хороший» шанс обнаружить уместный эффект, если таковой существует (под «хорошим» мы подразумеваем, что мощность должна быть по крайней мере 70-80%).

Этически безответственно начинать исследование, у которого, скажем, только 40% вероятности обнаружить реальный эффект лечения; это бесполезная трата времени и денежных средств.

Ряд факторов имеют прямое отношение к мощности критерия.

Объем выборки: мощность критерия увеличивается по мере увеличения объема выборки. Это означает, что у большей выборки больше возможностей, чем у незначительной, обнаружить важный эффект, если он существует.

Когда объем выборки небольшой, у критерия может быть недостаточно мощности, чтобы обнаружить отдельный эффект. Эти методы также можно использовать для оценки мощности критерия для точно установленного объема выборки.

Вариабельность наблюдений: мощность увеличивается по мере того, как вариабельность наблюдений уменьшается.

Интересующий исследователя эффект: мощность критерия больше для более высоких эффектов. Критерий проверки гипотез имеет больше шансов обнаружить значительный реальный эффект, чем незначительный.

Уровень значимости: мощность будет больше, если уровень значимости выше (это эквивалентно увеличению допущения ошибки 1-го рода, α, а допущение ошибки 2-го рода, β, уменьшается).

Таким образом, вероятнее всего, исследователь обнаружит реальный эффект, если на стадии планирования решит, что будет рассматривать значение р как значимое, если оно скорее будет меньше 0,05, чем меньше 0,01.

Обратите внимание, что проверка ДИ для интересующего эффекта указывает на то, была ли мощность адекватной. Большой доверительный интервал следует из небольшой выборки и/или набора данных с существенной вариабельностью и указывает на недостаточную мощность.

Проверка множественных гипотез

Часто нужно выполнить критериальную проверку значимости множественных гипотез на наборе данных с многими переменными или существует более двух видов лечения.

Ошибка 1-го рода драматически увеличивается по мере увеличения числа сравнений, что приводит к ложным выводам относительно гипотез. Следовательно, следует проверить только небольшое число гипотез, выбранных для достижения первоначальной цели исследования и точно установленных априорно.

Можно использовать какую-нибудь форму апостериорного уточнения значения р, принимая во внимание число выполненных проверок гипотез.

Например, при подходе Бонферрони (его часто считают довольно консервативным) умножают каждое значение р на число выполненных проверок; тогда любые решения относительно значимости будут основываться на этом уточненном значении р.

Источник

Что называют мощностью критерия гипотеза но

1. Статистические гипотезы. Основные понятия.

2. Гипотезы о законе распределения.

3. Гипотезы о числовом значении генерального среднего и дисперсии.

1. Статистические гипотезы. Основные понятия.

В тех случаях, когда известен закон, но неизвестны значения его параметров (дисперсия или математическое ожидание) в конкретной ситуации, статистическую гипотезу называют параметрической.

Например, предположение об ожидаемом среднем доходе по акциям или разбросе дохода являются параметрическими гипотезами.

Когда закон распределения генеральной совокупности не известен, но есть основания предположить, каков его конкретный вид, выдвигаемые гипотезы о виде его распределения называются непараметрическими.

Например, можно выдвинуть гипотезу, что число дневных продаж в магазине или доход населения подчинены нормальному закону распределения.

По содержанию статистические гипотезы можно классифицировать:

1. Гипотезы о типе вероятностного закона распределения случайной величины, характеризующего явление или процесс.

2. Гипотезы об однородности двух или более обрабатываемых выборок. Изучаемое свойство исследуется с помощью двух или более генеральных совокупностей. Гипотеза в этом случае может заключаться в следующем: исследуемые выборочные характеристики различаются между собой статистически значимо или нет.

3. Гипотезы о свойствах числовых значений параметров исследуемой генеральной совокупности. Больше ли значения параметров некоторого заданного номинала или меньше и т.д.

4. Гипотезы о вероятностной зависимости двух или более признаков, характеризующих различные свойства рассматриваемого явления или процесса. При этом определяется характер этой зависимости.

Гипотезы бывают простые (содержащие одно предположение) и сложные (содержащие несколько предположений).

Под статистическим критерием понимают однозначно определенное правило, устанавливающее условие, при котором проверяемая гипотеза отвергается либо не отвергается.

Увеличение числа заболевших некоторым заболеванием дает возможность выдвинуть гипотезу о наличии эпидемии. Для сравнения доли заболевших в обычных и экстремальных условиях используются статистические данные, на основании которых делается вывод о том, является ли данное массовое заболевание эпидемией. Предполагается, что существует некоторый критерий- уровень доли заболевших, критический для этого заболевания, который устанавливается по ранее имевшимся случаям.

Различают три вида критериев:

Проверка параметрических гипотез проводится на основе критериев значимости., а непараметрических- критериев согласия.

Задача проверки статистических гипотез сводится к исследованию генеральной совокупности по выборке. Множество возможных значений элементов выборки может быть разделено на два непересекающихся подмножества- критическую область и область принятия гипотезы.

Областью принятия гипотезы или областью допустимых значений Iдоп называют совокупность значений критерия, при которых эту гипотезу принимают.

Критической областью Iкр называют множество значений критерия, при котором гипотезу отвергают.

Наблюдаемые значения критерия (статистика) Kнабл называют такое значение критерия, которое находится по данным выборки.

С помощью уровня значимости определяются границы критической области.

Основной принцип проверки статистических гипотез состоит в следующем: если наблюдаемое значение статистики критерия попадает (не попадает) в критическую область, то гипотеза H0 отвергается (принимается), а гипотеза H1 принимается (отвергается) в качестве одного из возможных решений с формулировкой «гипотеза H0 противоречит (не противоречит) выборочным данным на уровне значимости ».

В зависимости от содержания альтернативной гипотезы осуществляется выбор критической области: левосторонней, правосторонней, двусторонней. Если смысл исследования заключается в доказательстве конкретного изменения наблюдаемого параметра (его уменьшения или увеличения), то говорят об односторонней критической области. Если смысл исследования- выявить различия в изучаемых параметрах, но характер их отклонения от контрольных (или теоретических) не известен, то говорят о двусторонней критической области.

Однако, принятие той или иной гипотезы не дает оснований утверждать, что она верна. Результат проверки статистической гипотезы лишь устанавливают на определенном уровне значимости ее соответствие (несоответствие) результатам эксперимента.

При проверке статистических гипотез возможны следующие ошибки:

2. Отвергнута правильная альтернативная гипотеза H1 и принята неправильная нулевая гипотеза H0 — ошибка второго рода.

Можно доказать, что с уменьшением ошибок первого рода одновременно увеличиваются ошибки второго рода и наоборот. Поэтому, на практике пытаются подбирать значения параметров и опытным путем в целях минимизации суммарного эффекта от возможных ошибок. При принятии управленческих решений для одновременного уменьшения ошибок первого и второго рода самым действенным средством является увеличение объема выборки, что согласуется с законом больших чисел.

На бытовом уровне ошибки второго рода могут иметь более трагические последствия, чем ошибки первого рода.

2. Гипотеза о законе распределения. Критерий согласия Пирсона ( X 2 -критерий).

Критериями согласия называют критерии, в которых гипотеза определяет закон распределения либо полностью, либо с точностью до небольшого числа параметров.

Причины расхождения результатов эксперимента и теоретических характеристик могут быть вызваны малым объемом выборки, неудачным способом группировки наблюдений, ошибками в выборе гипотезы о виде распределения генеральной совокупности и др.

Рассмотрим универсальный критерий согласия Пирсона. Проверка гипотезы о том, что эмпирическая частота мало отличается от соответствующей теоретической частоты, осуществляется с помощью величины X 2 меры расхождения между ними.

Для произвольной выборки, когда распределение непрерывно или число различных вариант велико, все пространство наблюдаемых вариант делят на конечное число непересекающихся областей, в каждой из которых подсчитывают наблюдаемую частоту и теоретическую вероятность.

Для применения критерия согласия Пирсона необходимо:

Источник

Мощность критерия

Ошибки первого рода (англ. type I errors, α errors, false positives ) и ошибки второго рода (англ. type II errors, β errors, false negatives ) в математической статистике — это ключевые понятия задач проверки статистических гипотез. Тем не менее, данные понятия часто используются и в других областях, когда речь идёт о принятии «бинарного» решения (да/нет) на основе некоего критерия (теста, проверки, измерения), который с некоторой вероятностью может давать ложный результат.

Содержание

Определения

Пусть дана выборка Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза ноиз неизвестного совместного распределения Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но, и поставлена бинарная задача проверки статистических гипотез:

Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но

где H0 — нулевая гипотеза, а H1 — альтернативная гипотеза. Предположим, что задан статистический критерий

Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но,

сопоставляющий каждой реализации выборки Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза ноодну из имеющихся гипотез. Тогда возможны следующие четыре ситуации:

Во втором и четвертом случае говорят, что произошла статистическая ошибка, и её называют ошибкой первого и второго рода соответственно.

Верная гипотеза
H0H1
Результат
применения
критерия
H0H0 верно принятаH0 неверно принята
(Ошибка второго рода)
H1H0 неверно отвергнута
(Ошибка первого рода)
H0 верно отвергнута

О смысле ошибок первого и второго рода

Ниже, в разделе Примеры использования, подробно рассматривается применение понятий ошибок первого и второго рода в различных областях.

Вероятности ошибок (уровень значимости и мощность)

Для проверки статистических гипотез используют так называемые критерии согласия. Для них вероятности ошибок первого и второго рода играют значительную роль.

В статистических тестах обычно приходится идти на компромисс между приемлемым уровнем ошибок первого и второго рода. Зачастую для принятия решения используется пороговое значение, которое может варьироваться с целью сделать тест более строгим или, наоборот, более мягким. Этим пороговым значением является уровень значимости, которым задаются при проверке статистических гипотез. Например, в случае металлодетектора повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная тревога), а понижение чувствительности — к увеличению риска ошибки второго рода (пропуск запрещённого предмета).

Примеры использования

Компьютеры

Понятия ошибок первого и второго рода широко используются в области компьютеров и программного обеспечения.

Компьютерная безопасность

Наличие уязвимостей в вычислительных системах приводит тому, что приходится, с одной стороны, решать задачу сохранения целостности компьютерных данных, а с другой стороны — обеспечивать нормальный доступ легальных пользователей к этим данным (см. компьютерная безопасность). Moulton (1983, с.125) отмечает, что в данном контексте возможны следующие нежелательные ситуации:

Фильтрация спама

Ошибка первого рода происходит, когда механизм блокировки/фильтрации спама ошибочно классифицирует легитимное email-сообщение как спам и препятствует его нормальной доставке. В то время как большинство «анти-спам» алгоритмов способны блокировать/фильтровать большой процент нежелательных email-сообщений, гораздо более важной задачей является минимизировать число «ложных тревог» (ошибочных блокировок нужных сообщений).

Ошибка второго рода происходит, когда анти-спам система ошибочно пропускает нежелательное сообщение, классифицируя его как «не спам». Низкий уровень таких ошибок является индикатором эффективности анти-спам алгоритма.

Вредоносное программное обеспечение

Понятие ошибки первого рода также ипользуется, когда антивирусное программное обеспечение ошибочно классифицирует безвредный файл как вирус. Неверное обнаружение может быть вызвано особенностями эвристики, либо неправильной сигнатурой вируса в базе данных. Подобные проблемы могут происходить также и с анти-троянскими и анти-

Поиск в компьютерных базах данных

При поиске в базе данных, к ошибкам первого рода можно отнести документы, которые выдаются поиском, несмотря на их иррелевантность (несоответствие) поисковому запросу. Ошибочные срабатывания характерны для полнотекстового поиска, когда поисковый алгоритм анализирует полные тексты всех хранимых в базе данных документов и пытается найти соответствия одному или нескольким терминам, заданным пользователем в запросе.

Большинство ложных срабатываний обусловлены сложностью естественных языков, многозначностью слов: например, «home» может обозначать как «место проживания человека», так и «корневую страницу веб-сайта». Число подобных ошибок может быть снижено за счёт использования специального словаря. Однако, это решение относительно дорогое, поскольку подобный словарь и разметка документов (индексирование) должны создаваться экспертом.

Оптическое распознавание текстов (OCR)

Разнообразные детектирующие алгоритмы нередко выдают ошибки первого рода. Программное обеспечение оптического распознавания текстов может распознать букву «a» в ситуации, когда на самом деле изображены несколько точек, которые используемый алгоритм расценил как «a».

Досмотр пассажиров и багажа

Таким образом, соотношение числа ложных тревог (идентифицикация благопристойного пассажира как террориста) к числу правильных срабатываний (обнаружение действительно запрещённых предметов) очень велико.

Биометрия

Ошибки первого и второго рода являются большой проблемой в системах биометрического сканирования, использующих распознавание радужной оболочки или сетчатки глаза, черт лица и т. д. Такие сканирующие системы могут ошибочно отождествить кого-то с другим, «известным» системе человеком, информация о котором хранится в базе данных (к примеру, это может быть лицо, имеющее право входа в систему, или подозреваемый преступник и т. п.). Противоположной ошибкой будет неспособность системы распознать легитимного зарегистрированного пользователя, или опознать подозреваемого в преступлении. [1]

Массовая медицинская диагностика (скрининг)

В медицинской практике есть существенное различие между скринингом и тестированием:

К примеру, в большинстве штатов в США обязательно прохождение новорожденными процедуры скрининга на оксифенилкетонурию и гипотиреоз, помимо других врождённых аномалий. Несмотря на высокий уровень ошибок первого рода, эти процедуры скрининга считаются целесообразными, поскольку они существенно увеличивают вероятность обнаружения этих расстройств на самой ранней стадии. [2]

Простые анализы крови, используемые для скрининга потенциальных доноров на ВИЧ и гепатит, имеют существенный уровень ошибок первого рода; однако в арсенале врачей есть гораздо более точные (и, соответственно, дорогие) тесты для проверки, действительно ли человек инфицирован каким-либо из этих вирусов.

Возможно, наиболее широкие дискуссии вызывают ошибки первого рода в процедурах скрининга на рак груди (маммография). В США уровень ошибок первого рода в маммограммах достигает 15 %, это самый высокий показатель в мире. [3] Самый низкий уровень наблюдается в Нидерландах, 1 %. [4]

Медицинское тестирование

Ошибки второго рода являются существенной проблемой в медицинском тестировании. Они дают пациенту и врачу ложное убеждение, что заболевание отсутствует, в то время как в действительности оно есть. Это зачастую приводит к неуместному или неадекватному лечению. Типичным примером является доверие результатам кардиотестирования при выявлении коронарного атеросклероза, хотя известно, что кардиотестирование выявляет только те затруднения кровотока в коронарной артерии, которые вызваны стенозом.

Ошибки второго рода вызывают серьёзные и трудные для понимания проблемы, особенно когда искомое условие является широкораспространённым. Если тест с 10%-ным уровнем ошибок второго рода используется для обследования группы, где вероятность «истинно-положительных» случаев составляет 70 %, то многие отрицательные результаты теста окажутся ложными. (См. Теорему Байеса).

Ошибки первого рода также могут вызывать серьёзные и трудные для понимания проблемы. Это происходит, когда искомое условие является редким. Если уровень ошибок первого рода у теста составляет один случай на десять тысяч, но в тестируемой группе образцов (или людей) вероятность «истинно-положительных» случаев составляет в среднем один случай на миллион, то большинство положительных результатов этого теста будут ложными. [5]

Исследования сверхъестественных явлений

Термин ошибка первого рода был взят на вооружение исследователями в области паранормальных явлений и привидений для описания фотографии или записи или какого-либо другого свидетельства, которое ошибочно трактуется как имеющее паранормальное происхождение — в данном контексте ошибка первого рода — это какое-либо несостоятельное «медиа-свидетельство» (изображение, видеозапись, аудиозапись и т. д.), которое имеет обычное объяснение. [6]

Источник

Основные положения теории проверки статистических гипотез.

На практике часто приходится проверять на основе выборочных данных различные предположения относительно генеральной совокупности. Процедура сопоставления выдвинутых гипотез с выборкой и вынесения решения относительно приемлемости этих гипотез получила название проверки гипотез.

Такая процедура используется всякий раз, когда необходим обоснованный вывод о преимуществах того или иного способа инвестиций, измерений, стрельбы, технологического процесса, об эффективности нового метода обучения, управления, о пользе удобрений, лекарств, об уровне доходности ценных бумаг, и т.д.

Гипотезой в математической статистике называется любое утверждение о виде или свойствах распределения вероятностей, лежащее в основе наблюдаемых явлений.

По своему содержанию статистические гипотезы можно подразделить на несколько основных типов:

1) гипотезы о числовых значениях параметров случайной величины;

2) гипотезы о виде распределения исследуемой случайной величины;

3) гипотезы об общем виде модели, описывающей статистическую зависимость между случайными величинами.

Проверка статистической гипотезы заключается в том, чтобы оценить, можно ли считать случайным расхождение между выдвинутой гипотезой и результатами выборочного наблюдения. Такая оценка всегда носит вероятностный характер.

Если расхождение между эмпирическими и теоретическими значениями не выходит на пределы случайной ошибки, то можно считать, что с заданной вероятностью выдвинутая гипотеза не опровергается.

При этом справедливость самой гипотезы не доказывается, а лишь делается вывод о том, можно ли считать её допустимой или необходимо опровергнуть.

Гипотезы подразделяют на параметрические и непараметрические, простые и сложные.

Гипотеза называется параметрической, если в ней содержится некоторое утверждение о значении параметра распределения известного вида.

В непараметрической гипотезе заключается утверждение обо всём распределении.

Простая гипотеза полностью определяет теоретическую функцию распределения.

Сложная гипотеза определяет область возможных значений исследуемого параметра.

Обычно выделяют некоторую основную (нулевую) гипотезу Н0. Наряду с ней рассматривают конкурирующую (альтернативную) гипотезу Н1, являющуюся логическим отрицанием основной.

Статистический критерий – это правило, по которому нужно принять или опровергнуть выдвинутую гипотезу.

Т.о. статистический критерий представляет собой такое правило, по которому устанавливается, при каких результатах выборочного обследования основная гипотеза не может быть отклонена, а при каких от неё необходимо отказаться.

Суть проверки статистической гипотезы заключается в следующем: используется специально составленная статистика (некоторая функция от выборки), точное или приближенное распределение которой известно. Множество возможных значений статистики делится на две взаимно дополняющих области:

Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но— область принятия гипотезы или область допустимых значений статистики.

При этом возможны 4 случая:

Основная гипотезаПринимаетсяОтвергается
ВернаПравильное решениеОшибка I-го рода
НевернаОшибка II-го родаПравильное решение

Вероятности ошибок I и II рода однозначно определяются выбором критической области.

Будем обозначать вероятность ошибки I-го рода через a. Вероятность ошибки II-го рода обозначим b.

Применяя юридическую терминологию, можно интерпретировать величины a и bследующим образом:

a— вероятность вынесения судом обвинительного приговора, когда на самом деле обвиняемый невиновен;

b— вероятность вынесения судом оправдательного приговора, когда на самом деле обвиняемый виновен.

Обычно уровень значимости aпринимают равным 0,05; 0,01; 0,005; 0,001.

Вероятность 1-b отвергнуть гипотезу, когда она не верна, т.е. не допустить ошибку II-го рода, называются мощностью критерия.

Уменьшая уровень значимости a, мы снижаем вероятность появления ошибки первого рода. Однако, если основная гипотеза не верна, то, уменьшая a, мы увеличиваем область допустимых значений и, соответственно, вероятность появления ошибки второго рода b.

Стремление увеличить мощность критерия 1-b при неизменном объёме выборки приводит к расширению критической области, то есть повышает вероятность ошибки первого рода a.

Одновременно уменьшить вероятности a и b можно, лишь увеличивая объём выборки n.

Если же объём выборки фиксирован, то при равных a выбирают тот критерий, где меньше b. То есть критическая область критерия должна быть такой, чтобы при заданном уровне значимости a мощность критерия 1-b была максимальной.

Задача построения наиболее мощного критерия для простой гипотезы решается с помощью леммы Неймана – Пирсона:

Среди всех критериев заданного уровня значимости a, проверяющих простую гипотезу Н0 против альтернативы Н1, критерий отношения правдоподобия является наиболее мощным.

Рассмотри применение этой леммы.

Так как гипотеза является простой, то можно однозначно определить функцию правдоподобия при основной и альтернативной гипотезах:

Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но; Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но.

Чем правдоподобнее выборка в условиях гипотезы Н1, тем больше L1 по сравнению с L0, следовательно больше отношение L1/L0. В качестве критической области выбирают область больших значений ln[L1/L0].

Границу критической области вычисляют исходя из конкретного вида распределения и заданного уровня значимости. Построенный таким образом (по лемме Неймана – Пирсона) критерий будет наиболее мощным.

Точка, разделяющая критическую область и область принятия нулевой гипотезы, называется критической.

При заданном уровне значимости критическая область (т.е. область отклонения выдвинутой гипотезы) может быть односторонняя (правосторонняя, левосторонняя) или двусторонняя в зависимости от вида альтернативной гипотезы

Что называют мощностью критерия гипотеза но. Смотреть фото Что называют мощностью критерия гипотеза но. Смотреть картинку Что называют мощностью критерия гипотеза но. Картинка про Что называют мощностью критерия гипотеза но. Фото Что называют мощностью критерия гипотеза но

Общий порядок проверки статистических гипотез.

1. Формулируется основная (проверяемая) и альтернативная гипотезы.

2. Выбирается статистический критерий для проверки справедливости основной гипотезы.

3. Определяются критическая область и область допустимых значений, значения статистики критерия в критических точках

4. По результатам статистического исследования подсчитывается фактическое значение статистики критерия.

5. На основе сравнения фактического и критического значений статистики критерия делается вывод о правдоподобности или необходимости отклонения выдвинутой гипотезы.

Схема проверки статистической гипотезы не даёт точного вывода о её верности или неверности, так как принятие гипотезы всегда происходит на некотором субъективно принятом уровне надёжности и основывается на значении статистики, построенной по конечной выборке.

Принятие основной гипотезы не означает, что она является единственно подходящей, просто она не противоречит выборочным данным. Однако таким же свойством могут обладать и другие гипотезы.

Дата добавления: 2018-11-25 ; просмотров: 1140 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *