Что определяет коэффициент стьюдента
Библиотека постов MEDSTATISTIC об анализе медицинских данных
Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
Критерии и методы
t-КРИТЕРИЙ СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ СОВОКУПНОСТЕЙ
– общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Уильям Госсет
1. История разработки t-критерия
Данный критерий был разработан Уильямом Сили Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется t-критерий Стьюдента?
t-критерий Стьюдента используется для определения статистической значимости различий средних величин. Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата). В последнем случае рассчитывается парный t-критерий Стьюдента
3. В каких случаях можно использовать t-критерий Стьюдента?
Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. Также имеет значение равенство дисперсий (распределения) сравниваемых групп (гомоскедастичность). При неравных дисперсиях применяется t-критерий в модификации Уэлча (Welch’s t).
При отсутствии нормального распределения сравниваемых выборок вместо t-критерия Стьюдента используются аналогичные методы непараметрической статистики, среди которых наиболее известными является U-критерий Манна — Уитни.
4. Как рассчитать t-критерий Стьюдента?
Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:
5. Как интерпретировать значение t-критерия Стьюдента?
Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n1 и n2). Находим число степеней свободы f по следующей формуле:
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже).
Сравниваем критическое и рассчитанное значения критерия:
6. Пример расчета t-критерия Стьюдента
Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:
Библиотека постов MEDSTATISTIC об анализе медицинских данных
Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
Критерии и методы
ПАРНЫЙ t-КРИТЕРИЙ СТЬЮДЕНТА
– одна из модификаций метода Стьюдента, используемая для определения статистической значимости различий парных (повторных) измерений.
Уильям Госсет
1. История разработки t-критерия
t-критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется парный t-критерий Стьюдента?
3. В каких случаях можно использовать парный t-критерий Стьюдента?
Основным условием является зависимость выборок, то есть сравниваемые значения должны быть получены при повторных измерениях одного параметра у одних и тех же пациентов.
Как и в случае сравнения независимых выборок, для применения парного t-критерия необходимо, чтобы исходные данные имели нормальное распределение. При несоблюдении этого условия для сравнения выборочных средних должны использоваться методы непараметрической статистики, такие как G-критерий знаков или Т-критерий Вилкоксона.
Парный t-критерий может использоваться только при сравнении двухвыборок. Если необходимо сравнить три и более повторных измерений, следует использовать однофакторный дисперсионный анализ (ANOVA) для повторных измерений.
4. Как рассчитать парный t-критерий Стьюдента?
Парный t-критерий Стьюдента рассчитывается по следующей формуле:
5. Как интерпретировать значение t-критерия Стьюдента?
Интерпретация полученного значения парного t-критерия Стьюдента не отличается от оценки t-критерия для несвязанных совокупностей. Прежде всего, необходимо найти число степеней свободы f по следующей формуле:
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p
3. Найдем среднее квадратическое отклонение разностей от средней по формуле:
4. Рассчитаем парный t-критерий Стьюдента:
Надежность результата многократных измерений. Коэффициент Стьюдента
Доверительной вероятностью или надежностью P серии измерений называется вероятность попадания истинного значения измеряемой величины в данный интервал (выражается в долях единицы или в процентах).
Чем больше доверительный интервал, тем больше доверительная вероятность того, что результат измерения попадет в него. Величина доверительного интервала, рассчитывается методами теории вероятностей и математической статистики и определяется выбором вида функции распределения случайных величин f(∆x).
Для всех функций распределения, базовым является распределение Гаусса, справедливое для большого количества равноточных измерений :
[1.5]
где величина называется среднеквадратичным или стандартным отклонением от среднего значения а, дисперсией распределения.
Распределение Гаусса показывает, что вероятность появления малых случайных погрешностей больше вероятности появления больших погрешностей, при этом случайные погрешности равные по абсолютной величине, но противоположные по знаку встречаются одинаково часто.
При лабораторных измерениях (n
Очевидно, что число опытов имеет смысл выбрать таким, чтобы случайная погрешность среднего сравнялась с погрешностью прибора либо стала меньше ее. Дальнейшее увеличение числа измерений теряет смысл, так как не увеличит точность получаемого результата
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
Что определяет коэффициент стьюдента
Для уменьшения влияния случайных ошибок необходимо произвести измерение данной величины несколько раз. Предположим, что мы измеряем некоторую величину x. В результате проведенных измерений мы получили значений величины :
Так как оценочные значения результата измерений и ошибки Δx не являются точными, запись (3) результата измерений должна сопровождаться указанием его надежности P. Под надежностью или доверительной вероятностью понимают вероятность того, что истинное значение измеряемой величины заключено в интервале, указанном записью (3). Сам этот интервал называется доверительным интервалом.
Например, измеряя длину некоторого отрезка, окончательный результат мы записали в виде
Таким образом, задача заключается в том, чтобы, имея выборку (2), найти оценку результата измерений , его ошибку Δx и надежность P.
Эта задача может быть решена с помощью теории вероятностей и математической статистики.
В большинстве случаев случайные ошибки подчиняются нормальному закону распределения, установленного Гауссом. Нормальный закон распределения ошибок выражается формулой
где Δx отклонение от величины истинного значения;
σ истинная среднеквадратичная ошибка;
σ 2 дисперсия, величина которой характеризует разброс случайных величин.
Поскольку кривая распределена симметрично относительно оси ординат, можно утверждать, что равные по величине, но противоположные по знаку ошибки равновероятны. А это дает возможность в качестве оценки результатов измерений взять среднее значение всех элементов выборки (2)
где n число измерений.
Итак, если в одних и тех же условиях проделано n измерений, то наиболее вероятным значением измеряемой величины будет ее среднее значение (арифметическое). Величина стремится к истинному значению μ измеряемой величины при n → ∞.
Средней квадратичной ошибкой отдельного результата измерения называется величина
Она характеризует ошибку каждого отдельного измерения. При n → ∞ S стремится к постоянному пределу σ
С увеличением σ увеличивается разброс отсчетов, т.е. становится ниже точность измерений.
Среднеквадратичной ошибкой среднего арифметического называется величина
Это фундаментальный закон возрастания точности при росте числа измерений.
Ошибка характеризует точность, с которой получено среднее значение измеренной величины . Результат записывается в виде:
Эта методика расчета ошибок дает хорошие результаты (с надежностью 0.68) только в том случае, когда одна и та же величина измерялась не менее 30 50 раз.
В 1908 году Стьюдент показал, что статистических подход справедлив и при малом числе измерений. Распределение Стьюдента при числе измерений n → ∞ переходит в распределение Гаусса, а при малом числе отличается от него.
Для расчета абсолютной ошибки при малом количестве измерений вводится специальный коэффициент, зависящий от надежности P и числа измерений n, называемый коэффициентом
Стьюдента t.
Опуская теоретические обоснования его введения, заметим, что
где Δx абсолютная ошибка для данной доверительной вероятности;
среднеквадратичная ошибка среднего арифметического.
Для этого удобнее воспользоваться таблицей 3, в которой интервалы заданы в долях величины σ, являющейся мерой точности данного опыта по отношению к случайным ошибкам.
Таблица 2
n | Значения Р | ||||
0.6 | 0.8 | 0.95 | 0.99 | 0.999 | |
2 | 1.376 | 3.078 | 12.706 | 63.657 | 636.61 |
3 | 1.061 | 1.886 | 4.303 | 9.925 | 31.598 |
4 | 0.978 | 1.638 | 3.182 | 5.841 | 12.941 |
5 | 0.941 | 1.533 | 2.776 | 4.604 | 8.610 |
6 | 0.920 | 1.476 | 2.571 | 4.032 | 6.859 |
7 | 0.906 | 1.440 | 2.447 | 3.707 | 5.959 |
8 | 0.896 | 1.415 | 2.365 | 3.499 | 5.405 |
9 | 0.889 | 1.397 | 2.306 | 3.355 | 5.041 |
10 | 0.883 | 1.383 | 2.262 | 3.250 | 4.781 |
11 | 0.879 | 1.372 | 2.228 | 3.169 | 4.587 |
12 | 0.876 | 1.363 | 2.201 | 3.106 | 4.437 |
13 | 0.873 | 1.356 | 2.179 | 3.055 | 4.318 |
14 | 0.870 | 1.350 | 2.160 | 3.012 | 4.221 |
15 | 0.868 | 1.345 | 2.145 | 2.977 | 4.140 |
16 | 0.866 | 1.341 | 2.131 | 2.947 | 4.073 |
17 | 0.865 | 1.337 | 2.120 | 2.921 | 4.015 |
18 | 0.863 | 1.333 | 2.110 | 2.898 | 3.965 |
19 | 0.862 | 1.330 | 2.101 | 2.878 | 3.922 |
20 | 0.861 | 1.328 | 2.093 | 2.861 | 3.883 |
21 | 0.860 | 1.325 | 2.086 | 2.845 | 3.850 |
22 | 0.859 | 1.323 | 2.080 | 2.831 | 3.819 |
23 | 0.858 | 1.321 | 2.074 | 2.819 | 3.792 |
24 | 0.858 | 1.319 | 2.069 | 2.807 | 3.767 |
25 | 0.857 | 1.318 | 2.064 | 2.797 | 3.745 |
26 | 0.856 | 1.316 | 2.060 | 2.787 | 3.725 |
27 | 0.856 | 1.315 | 2.056 | 2.779 | 3.707 |
28 | 0.855 | 1.314 | 2.052 | 2.771 | 3.690 |
29 | 0.855 | 1.313 | 2.048 | 2.763 | 3.674 |
30 | 0.854 | 1.311 | 2.045 | 2.756 | 3.659 |
31 | 0.854 | 1.310 | 2.042 | 2.750 | 3.646 |
40 | 0.851 | 1.303 | 2.021 | 2.704 | 3.551 |
60 | 0.848 | 1.296 | 2.000 | 2.660 | 3.460 |
120 | 0.845 | 1.289 | 1.980 | 2.617 | 3.373 |
∞ | 0.842 | 1.282 | 1.960 | 2.576 | 3.291 |
Таблица 3
Δ = Δx/σ | Значения Р | |||||
0.5 | 0.7 | 0.9 | 0.95 | 0.99 | 0.999 | |
1.0 | 2 | 3 | 5 | 7 | 11 | 17 |
0.5 | 3 | 6 | 13 | 18 | 31 | 50 |
0.4 | 4 | 8 | 19 | 27 | 46 | 74 |
0.3 | 6 | 13 | 32 | 46 | 78 | 127 |
0.2 | 13 | 29 | 70 | 99 | 171 | 277 |
0.1 | 47 | 169 | 273 | 387 | 668 | 1089 |
При обработке результатов прямых измерений предлагается следующий порядок операций:
Рассмотрим на числовом примере применение приведенных выше формул.
Пример. Измерялся микрометром диаметр d стержня (систематическая ошибка измерения равна 0.005 мм ). Результаты измерений заносим во вторую графу таблицы, находим и в третью графу этой таблицы записываем разности , а в четвертую их квадраты (таблица 4).
Таблица 4
Задавшись надежностью P = 0.95, по таблице коэффициентов Стьюдента для шести измерений найдем t = 2.57. Абсолютная ошибка найдется по формуле (10).
Сравним случайную и систематическую ошибки:
следовательно, δ = 0.005 мм можно отбросить.
Общий вопрос при сравнении двух наборов измерений заключается в том, следует ли использовать процедуру параметрического тестирования или непараметрическую. Чаще всего, используя симуляцию, сравнивают несколько параметрических и непараметрических тестов, таких как t-тест, нормальный тест (параметрические критерии), уровня Уилкоксона, оценки Ван-дер-Вальдена и т. д.(непараметрические).
Параметрический метод сравнения выборок (t-Стьюдента)
Вам будет интересно: Распределенные системы: определение, особенности и основные принципы
Ими часто являются те методы, при анализе которых мы видим, что субъект является приблизительно нормальным, поэтому перед тем, как использовать критерий, следует осуществить проверку на нормальность. То есть размещение признаков в таблице распределения Стьюдента (в обеих выборках) не должно существенно отличаться от нормального и обязано соответствовать или приблизительно согласовываться с указанным параметром. Для нормального распределения существует два показателя: среднее и стандартное отклонение.
Применение t критерия стьюдента производится при проверке гипотез. Он позволяет проверить допущение, применимое к испытуемым. Чаще всего этот критерий применяется для того, чтобы проверить, равны ли средние значения в двух выборках, но также может применяться и для одной.
Следует добавить, что преимущество использования параметрического теста вместо непараметрического состоит в том, что первое будет иметь большую статистическую мощность, чем последнее. Другими словами, параметрический тест более способен привести к отказу от нулевой гипотезы.
Критерии t-Стьюдента для одной выборки
Формула эмпирического значения критерия t-Стьюдента:
Критерии t-Стьюдента для независимых выборок
Формулы для эмпирического значения критерия t-Стьюдента:
Формула 1 может применяться для приблизительных расчетов, для близких по количеству выборок, а формула 2 — для четких расчетов, когда выборки заметно отличаются по количеству.
Критерии t-Стьюдента для зависимых выборок
Парные t-тесты обычно состоят из совпадающих пар одинаковых единиц или одной группы единиц, которая была дважды проверена («повторное измерение» t-критерия). Когда мы имеем зависимые выборки или два ряда данных, положительно коррелирующих друг с другом, можем, соответственно, оформить статистические гипотезы H0 и H1 и проверить их с помощью данной нам формулы эмпирического значения критерия t-Стьюдента.
Например, испытуемые подвергаются тестированию до лечения при высоком кровяном давлении и снова тестируются после лечения препаратом для его снижения. Сравнивая те же самые показатели пациентов до и после лечения, мы эффективно используем каждого из них в качестве своего собственного контроля.
Таким образом, правильное отклонение нулевой гипотезы может стать гораздо более вероятным, при этом статистическая сила увеличивается просто потому, что случайная вариация между пациентами теперь устранена. Обратите внимание, однако, что увеличение статистической мощности происходит по оценке: требуется больше тестов, каждый испытуемый должен быть дважды проверен.
Вывод