Что определяют методом динамического ряда
Динамические ряды — краткое руководство по анализу изменений явлений во времени
Даная статья понятными и простыми терминами объяснит, что же такое динамические ряды, для чего они нужны, как производится анализ полученных данных и какие возможности открываются перед теми, кто владеет методикой данного анализа. Любое явление в области здравоохранения нуждается в тщательной оценке, и здесь знания анализа динамических рядов неоценимы. С помощью динамического ряда можно оценить и спрогнозировать проблематику любой нозологической единицы, сформировать дальнейшую тактику лечения и меры профилактики заболеваний.
Динамический ряд — ряд однородных величин, характеризующих изменение явления во времени.
Целью анализа динамических рядов является:
Числовые значения, составляющие динамический ряд, называются уровнями ряда (у).
Типы динамических рядов:
а) простые (уровень ряда выражен абсолютными числами);
б) сложные (уровень ряда выражен обобщающими коэффициентами).
а) моментные (данные собираются на определенный момент времени);
б) интервальные (данные собираются за определенный период времени).
а) с выраженной тенденцией (r =0,7 — 1,0);
б) с неустойчивой тенденцией (r =0,3 — 0,69);
в) с отсутствием тенденции ( r = 0 — 0,29).
Основное требование, предъявляемое к анализируемым динамическим рядам, заключается в сопоставимости их уровней. Для оценки сопоставимости проводят предварительный анализ полученных данных по следующим критериям:
Методика анализа динамических рядов
Методика аналитики предусматривает выполнение последовательных действий:
Способы выравнивания динамических рядов
Чтобы произвести выравнивание динамических рядов потребуются следующие действия:
При этом способе на основании фактических данных подбирается наиболее подходящее для отражения тенденции развития явления математическое уравнение (аппроксимирующая функция), которое принимается за модель развития явления во времени. Т.е. уровни ряда рассматриваются как функция времени, и задача выравнивания сводится к определению вида функции, отысканию ее параметров по эмпирическим данным и расчету по найденной формуле теоретических выравненных уровней. Наиболее часто используются следующие функции:
а) линейная зависимость:
б) экспоненциальная зависимость:
в) показательная зависимость:
г) параболическая зависимость:
у – теоретический уровень;
t – временной интервал.
где у — уровни фактического ряда;
n — количество уровней;
t — порядковый номер временного периода.
При отсчете времени от середины ряда St = 0 и система нормальных уравнений принимает вид:
Отсюда находим параметры уравнения:
Подставляя в уравнение у = а0 + а1t вместо «t» его ранги, находим выравненные (теоретические) значения уровней ряда и строим теоретическую кривую выравненного динамического ряда.
При использовании аналитического способа всегда отмечается отклонение теоретических уровней от фактических уровней ряда, которое может быть обусловлено как случайными колебаниями, так и неправильно подобранным аппроксимирующим уравнением. В связи с этим заключительным этапом выравнивания динамического ряда аналитическим способом является оценка точности аппроксимации с определенным уровнем значимости.
Оценка точности аппроксимации возможна с помощью нахождения
Для получения точной оценки необходимо найти такие величины:
а) коэффициент вариации:
где у- фактический уровень ряда;
yt — теоретический уровень ряда;
k- число параметров уравнения;
n- число уровней ряда.
Аппроксимация считается точной при Cv не более 15%.
б) коэффициент расхождения Тейла:
где у — фактический уровень ряда;
yt — теоретический уровень ряда.
Аппроксимация считается точной при U не более 5%
После аналитического выравнивания динамического ряда и описания тренда возможно экстраполировать полученные данные. Экстраполяция — предположение о сохранении тренда, базирующееся на допущении неизменности влияющих факторов и предшествующей тенденции. Осуществляется путем подставления в найденное уравнение аппроксимации не фактического значения временного интервала, а предполагаемого порядкового номера (ранг) того периода, на который прогнозируется результат.
Вычисление основных показателей динамического ряда
Алгоритм вычислений ведущих параметров динамических рядов:
yi- текущий уровень (сравниваемый);
уi-1— базисный уровень (с каким сравнивают);
t- период времени, в течение которого уровень предполагается неизменным.
1.Абсолютный прирост (убыль) :
3.Темп прироста (относительная скорость), темп убыли :
4.Средний темп прироста (убыли):
где а0; а1 — параметры уравнения;
k = 1 при нечетном ряде;
k = 2 при четном ряде.
5.1% прироста (убыли): используются при сравнении динамических рядов с уровнями, выраженными различными обобщающими коэффициентами.
Таким образом, с помощью данного руководства по определению и расчетам такого понятия, как, динамические ряды, специалисты различных отраслей медицины, ученые могут эффективно и быстро оценить изменение различных величин в течение времени.
Благодарим за интерес, проявленный к нашей статье, оставайтесь с нами!
Ряды динамики
Понятие рядов динамики (временных рядов)
Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).
Ряд динамики (или временной ряд) – это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).
Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают буквой y. Первый член ряда y1 называют начальным или базисным уровнем, а последний yn – конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t.
Ряды динамики, как правило, представляют в виде таблицы или графика, причем по оси абсцисс строится шкала времени t, а по оси ординат – шкала уровней ряда y.
Пример ряда динамики
Таблица. Число жителей России в 2004-2009 гг. в млн.чел, на 1 января
Год | 2004 | 2005 | 2006 | 2007 | 2008 | 2009 |
Число жителей | 144,2 | 143,5 | 142,8 | 142,2 | 142,0 | 141,9 |
График ряда динамики числа жителей России в 2004-2009 гг. в млн.чел, на 1 января
Данные таблицы и графика наглядно иллюстрируют ежегодное снижение числа жителей России в 2004-2009 годах.
Виды рядов динамики
Ряды динамики классифицируются по следующим основным признакам:
В нашем примере про число жителей России ряд динамики: 1) моментный (приведены уровни на 1 января); 2) абсолютных величин (в млн.чел.); 3) равномерный (равные интервалы в 1 год); 4) изолированный.
Показатели изменения уровней ряда динамики
Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений уровней во времени, для рядов динамики рассчитывают показатели изменения уровней ряда динамики:
Все эти показатели могут определяться базисным способом, когда уровень данного периода сравнивается с первым (базисным) периодом, либо цепным способом – когда сравниваются два уровня соседних периодов.
Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда, определяется по формуле
Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше первого (базисного) уровня, и, следовательно, может иметь знак «+» (при увеличении уровней) или «–» (при уменьшении уровней).
Цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда, определяется по формуле
Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше предыдущего уровня, и может иметь знак «+» или «–».
В следующей расчетной таблице в столбце 3 рассчитаны базисные абсолютные изменения, а в столбце 4 – цепные абсолютные изменения.
Год | y | , % | ,% | ||||
2004 | 144,2 | ||||||
2005 | 143,5 | -0,7 | -0,7 | 0,995 | 0,995 | -0,49 | -0,49 |
2006 | 142,8 | -1,4 | -0,7 | 0,990 | 0,995 | -0,97 | -0,49 |
2007 | 142,2 | -2,0 | -0,6 | 0,986 | 0,996 | -1,39 | -0,42 |
2008 | 142,0 | -2,2 | -0,2 | 0,985 | 0,999 | -1,53 | -0,14 |
2009 | 141,9 | -2,3 | -0,1 | 0,984 | 0,999 | -1,60 | -0,07 |
Итого | -2,3 | 0,984 | -1,60 |
Между базисными и цепными абсолютными изменениями существует взаимосвязь: сумма цепных абсолютных изменений равна последнему базисному изменению, то есть
.
Базисное относительное изменение (базисный темп роста или базисный индекс динамики) представляет собой соотношение конкретного и первого уровней ряда, определяясь по формуле
Цепное относительное изменение (цепной темп роста или цепной индекс динамики) представляет собой соотношение конкретного и предыдущего уровней ряда, определяясь по формуле
.
Относительное изменение показывает во сколько раз уровень данного периода больше уровня какого-либо предшествующего периода (при i>1) или какую его часть составляет (при i Следующая лекция.
Динамические ряды и их анализ.
В подразделе выясняются основные понятия о рядах динамики, их показателях и методах выравнивания.
Вопросы для изучения:
—Что такое динамический ряд?
—В чем заключается суть его выравнивания?
—Где используются динамические ряды?
Цель: ознакомить с расчетом показателей динамического ряда и методикой их выравнивания, продемонстрировать значения анализа динамических рядов в медицине.
Отдельные явления или параметры, которые изучаются разными областями медицинской науки и практики, в течение времени часто изменяют свою интенсивность. Эти изменения сказываются на развитии явлений. Поэтому при их изучении необходимо учитывать величину и направление изменений. Особенно большое значение для практического здравоохранения имеет информация об изменениях характерных демографических процессов, заболеваемости населения, деятельности учреждений здравоохранения, и др. Адекватность направленности и реализации практических рекомендаций и мероприятий в значительной мере зависит от правильного оценивания их характера. Поскольку такие изменения часто являются следствием практических оздоровительных мероприятий, анализ их позволяет оценить эффективность проводимой работы.
Для здравоохранения практический интерес имеет и тенденция развития некоторых явлений. Оценивание ее на данный момент часто позволяет предусмотреть изменения в будущем и соответственно наметить и принять необходимые практические меры.
Процесс развития изменений отдельных явлений (в том числе, медико-социальных) по времени в статистике принято называется динамикой, для отображения которой строят соответствующие ряды.
Динамический ряд – это ряд статистических величин, которые воспроизводят изменения явления во времени и расположенны в хронологическом порядке через определенные промежутки времени. |
Уровни ряда – это величины, из которых состоит динамический ряд – размер того или другого явления, достигнутый в течение определенного периода или на определенный момент времени. |
• интервальными — уровни ряда определяют за определенный период времени (число случаев госпитализации в стационар, число летальных случаев на протяжении года, число вызовов скорой помощи на протяжении суток).
На рис. 15 приведены примеры моментного и интервального ряда.
Для разных по характеру интервальных и моментных динамических рядов обнаруживают некоторые особенности уровней. Поскольку уровнями интервального ряда является суммарный размер явления за определенный промежуток времени, то они зависят от длительности данного периода времени и могут быть представлены как итог. В моментных рядах уровни содержат элементы повторного подсчета (например, численность населения Украины по данным переписей), потому подытожить их невозможно.
Величины, которые изучают в динамике (уровни ряда), могут быть представлены в виде:
• относительных (интенсивные показатели, соотношения);
Для анализа динамики не всегда целесообразно использовать абсолютные величины, поскольку их изменение достаточно часто связано с изменением численности среды или основы для формирования. Например, уменьшение числа случаев госпитализации к стационару может быть связано с сокращением коечного фонда за определенный промежуток времени, а не с фактическими показателями здоровья населения. Рассмотрение в динамике экстенсивных показателей (структуры) у большинства случаев является нецелесообразным и может быть проведен только в особенных случаях, при условии четкой интерпретации и обязательного учета изменений в структуре всей совокупности. |
По данным критериям динамические ряды можно разделить на ряды абсолютных, относительных и средних величин (простые и сложные).
В зависимости от расстояния между уровнями динамические ряды можно разделить на равноудаленные (равномерные интервалы между датами) и неравноудалённые (неравномерные промежутки или прерванные периоды).
Характер основной тенденции исследуемых процессов, представленных в виде динамических рядов, делит их на стационарные и нестационарные. Если математически ожидаемые (прогнозируемые) значения признаков и параметры их стабильности (среднее квадратичное отклонение, коэффициент вариации) являются постоянными, не зависят от времени, то такой процесс является стационарным. Данные ряды также называются стационарными. Медико-социальные процессы по времени, конечно, не является стационарными, поскольку каждый из них содержит в себе определенную тенденцию развития.
Важным условием правильного построения динамически го ряда и его последующей характеристики есть возможность сопоставления его отдельных уровней. Сравнивая данные в динамике, необходимо всегда помнить о территориальном и качественном сопоставление результатов. Основными причинами, которые усложняют или делают невозможным составление уровней динамического ряда, является:
• изменение единиц измерения или подсчета (оценивание экономической эффективности работы лечебно-профилактических учреждений в разных денежных эквивалентах за определенные периоды — рубли, купоны, гривны, у.е.);
• неравномерная периодизация динамики (количественная — по годам, качественная — по социально-экономическими периодам, изменениям приоритетности разных типов учреждений в структуре лечебно-профилактической помощи);
• изменение территориальных пределов областей, районов, и др.
При наличии вышеуказанных условий проблему решают в процессе сбора и обработки данных или путём их пересчета.
Методы медицинской статистики позволяют измерять размеры изменений, которые состоялись в течение определенного периода времени, и количественно охарактеризовать направленность их развития. С данной целью используют такие показатели: абсолютный прирост, темп роста, темп прироста.
Абсолютный прирост – это разница между данным уровнем ряда и тем, что принятый за основу (предыдущим, начальным) Темп роста – отношение данного уровня ряда до уровня, принятого за основу, определенное в процентах. Темп прироста – отношение абсолютного прироста за данный период времени до абсолютного уровня предыдущего периода, определенное в процентах. Абсолютное значение 1% прироста – отношения абсолютного прироста к темпу прироста. |
Абсолютный прирост может быть как позитивным, так и негативным. Он отображает, на сколько единиц, в абсолютном выражении изменился уровень, того или иного периода в сравнении с базовым. Один и тот же абсолютный прирост относительно разных исходных уровней может означать разный темп динамики, потому необходимо определить также, во сколько раз уровень одного периода более высок или более низок по отношению к уровню другого периода.
Темп роста позволяет ответить на вопрос: на сколько процентов он увеличился или уменьшился? Если оценивание в динамическом ряду проводится относительно предыдущего уровня, можно говорить о темпах роста, рассчитанных при переменной основе. При расчетах, проведенных относительно последующего уровня, говорим о показателях, рассчитанных на постоянную основу, которые еще называются показателями наглядности.
Абсолютный прирост может быть позитивным или негативным, и соответственно, темп прироста также может быть позитивным или негативным.
В определенных ситуациях, невзирая на снижение темпа прироста, мы можем отмечать одновременное увеличение абсолютного значения 1% прироста, который зависит от начального уровня.
Способы расчета указанных показателей приведены в табл.17.
Таблица 17. Динамика перинатальной смертности (на 1000 рожденных)
Год | Абсолютный уровень | Абсолютный прирост | Темп роста, % | Темп прироста % | |
При сменной основе | При постоянной основе | ||||
n-5 | 14,3 | ———- | ———— | 100,0 | ————- |
n-4 | 13,8 | -0,5 | 96,5 | 96,5 | -3,5 |
n-3 | 12,8 | -1,0 | 92,7 | 89,5 | -7,3 |
n-2 | 12,3 | -0,5 | 96,1 | 86,0 | -3,9 |
n-1 | 12,2 | -0,1 | 99,2 | 85,3 | -0,8 |
n | 12,2 | 0,0 | 100,0 | 85,3 | 0,0 |
Наблюдения, которые проводят в течение длительного времени, не всегда дают возможность обнаружить четкую тенденцию в динамике определенного явления. В подобных ситуациях целесообразным является применение методов выравнивания динамичного ряда, которые разделяются на две основных группы:
2) выравнивание с использованием кривой, проведенной между конкретными уровнями таким образом, чтобы она отображала тенденцию, характерную для ряда, и одновременно освободила его от незначительных колебаний (выравнивание по методу наименьших квадратов).
Приведение ряда к одной основе осуществляется путем вычисления показателей наглядности. Динамика в данном случае выражается достаточно четко.
Метод усреднения по левой и правой половине (графический метод). Ряд распределяется на две части. Для каждой его половины находят среднее арифметическое значение и проводят через полученные точки линию на графике.
Метод увеличения интервалов. Если рассматривать определенные медико-социальные показатели за ряд лет, то в результате влияния разнообразных факторов можно отметить снижение и повышение отдельных уровней ряда. Это мешает выявить основную тенденцию развития определенного явления. Поэтому для наглядного представления динамики используют метод, который базируется на увеличении периодов времени, к которым принадлежат уровни ряда. Например, ежесуточное число вызовов скорой помощи можно заменить соответствующим показателем, определенным за неделю.
Метод скользящей средней. Часто данный метод используют при проведении характеристики сезонных колебаний. Особенность его заключается в том, что проводится замена отдельных уровней ряда средними значениями, рассчитанными из настоящего и соседних уровней. Рассчитывают средний уровень для определенного числа (чаще трех) первых по порядку уровней ряда, потом средний уровень для аналогичного числа уровней, но начиная со второго, дальше с третьего и так далее. Таким образом, методика скользящей средней позволяет обнаружить тенденцию, которая была замаскирована случайными колебаниями показателей
Метод наименьших квадратов. Данная методика базируется на математическом законе — через ряд эмпирических точек можно провести только одну прямую черту, которая отвечает требованию: сумма квадратов отклонений фактических данных от выровненных будет наименьшей. По данному методу определяется линия, которая больше всего подходит для эмпирических данных и дает характеристику направленности исследуемого явления. Ею является парабола соответствующего порядка. Для примера рассмотрим выравнивание по прямой (парабола первого порядка).
Уравнение прямой линии имеет вид:
x – порядковый номер года или другого периода времени;
a1 – начальная скорость ряда.
Расчет по прямой по методу наименьших квадратов упрощается соответствующим подбором способа расчёта времени (х) таким образом, чтобы х = 0. При таких условиях расчет параметров a0 и a1 проводится по формулам:
a0 и a1 – постоянные параметры для подстановки их в уравнение;
n – число членов ряда;
x – обозначение единицы времени.
Методика выравнивания приведена на примере динамики смертности младенцев в Украине за 1992—1998 гг. (таблица. 18).
Таблица 18. Динамика младенческой смертности в Украине
Года | Уровни ряда (у) | Условное время(х) | ХУ | Х | Выровненные данные У х |
n-6 | 14.0 | -3 | -42.0 | 14.77 | |
n-5 | 14.9 | -2 | -29.8 | 14.57 | |
n-4 | 14.5 | -1 | -14.5 | 14.37 | |
n-3 | 14.7 | 14.17 | |||
n-2 | 14.3 | 14.3 | 13.97 | ||
n-1 | 14.0 | 28.0 | 13.77 | ||
n | 12.8 | 38.4 | 13.57 | ||
1. Принимаем средний период времени за начало отсчета
(в 1993 г.). Время приведено в условных единицах от середины отсчета (ряд х),S x = 0.
2. Определяем постоянную величину уравнения (a0):
4. Значение ряда X возводим в квадрат.
5. Определяем вторую постоянную величину уравнения (a1):
6. Определяем выровненные уровни ряда (Yх):
Y1 = 14,17 + (-0,2) х (-3) = 14,77
Y2 = 14,17 + (-0,2) х (-2) = 14,57
Y7 = 14,17 + (-0,2) х 3 = 13,57
Фактические показатели смертности младенцев и выровненный динамический ряд по методу наименьших квадратов представлены на рис. 16.
Анализ динамики медико-социальных явлений, обозначение и характеристика главных тенденций их развития формируют основу для последующего прогнозирования, определения будущих размеров уровня явления. Особенно актуальными вопросы прогнозирования становятся в условиях переходу на новую методологию учета определенных явлений, в период реформирования системы здравоохранения. Прогнозирование предусматривает сохранение основных закономерностей в будущем, таким образом, оно базируется на экстраполяции.
Экстраполяция, которая направлена в будущее или прошлое называется, соответственно, перспективной и ретроспективной. В процессе анализа динамических рядов иногда придется определять некоторые неизвестны уровни внутри данного ряда, который имеет название интерполяция. Она базируется на принципах, аналогичных экстраполяции, однако степень точности прогнозирования ожидаемого результата, конечно, значительно более высокий. |
Теоретической основой распространения тенденции на будущее является инерционность основных социальных, медицинских, экономических процессов. Чем короче является срок экстраполяции, тем надежнее и более точным является прогноз. В зависимости от того, какие принципы и восходящие данные положены в основу прогноза, выделяют такие элементарные методы экстраполяции:
• среднего абсолютного прироста;
• среднего темпа роста;
• выравнивание рядов по определённой аналитической формуле, что является наиболее распространенным методом, методологическая основа которого выше приведена.
Динамика ряда включает три компонента:
• тенденцию (долговременное движение);
• кратковременное систематическое движение;
• несистематическое случайное движение.
Изучая динамические ряды, исследователи с древних времен пытаются разделить эти компоненты и обнаружить главным образом основную закономерность развития явлений в отдельные промежутки времени, то есть обнаружить общую тенденцию в изменении уровней ряда, которое освобождено от влияния отдельных факторов. Именно с этой целью ряды динамики обрабатывают с помощью известных методов.
Вопросы для контроля:
1. Дайте характеристику моментных и интервальных динамических рядов.
2. Почему не всегда корректно строить динамический ряд из абсолютных величин и экстенсивных показателей?
3. В чем заключается возможность сопоставления отдельных уровней динамического ряда?
3.5. Характеристика и анализ статистической совокупности
В подразделе|подразделении| изложено практическое|практичное| значение и виды средних величин, методика их расчета, описанные характеристики| и параметры вариационного ряда.
Вопрос для изучения:
—Для чего используются средние величины?
—Как рассчитывается средняя арифметическая из разных|различных| видов вариационных рядов?
—Какое практическое|практичное| значение среднего квадратичного| отклонения и коэффициента вариации?
Цель: ознакомить с элементами и характеристиками вариационных рядов, научить рассчитывать средние величины| и другие параметры вариационного ряда, проанализировать| практическое|практичное| использование|употребление| средних величин.
Средние величины в прикладных статистических исследованиях используются настолько широко, что статистику иногда называют наукой о средних. Почему же для характеристики определенного явления не всегда можно ограничиться расчетом простои средней арифметической? |
Сбор, регистрация и благоустройство данных, в процессе любого исследования завершается формированием статистической совокупности (Statistical aggregate), которую можно определить как совокупность объектов или явлений одного вида, объединенных по определенному признаку. Например, больные с определенным диагнозом, определенным методом лечения и так далее. При этом для всех явлений, которые изучаются в медицине, характерна изменчивость, вариабельность. Каждый человек имеет количественную оценку определенного набора физиологических и клинических параметров, которые являются индивидуальными. Но в группе людей любой клинический параметр может изменяться и приобретать значения в определенном диапазоне.
Статистическая совокупность (Statistical aggregate) – совокупность объектов или явлений одного вида, объединенных по определенному признаку. |
Прежде чем|перед тем как| давать характеристику вариабельности| совокупности|, что имеет разные|различные| значения признаков в отдельных ее единицах|, необходимо иметь единственную|единую| типичную|типовую| для совокупности величину| (показатель), что позволяет дать ее обобщённую характеристику. Для этого применяются средние величины, которые|какие| рассчитываются только по количественным признакам|, то есть определение средней для атрибутивных признаков невозможно.
Средние величины дают обобщенную количественную характеристику определенного признака в статистической совокупности при определенных условиях места и времени. |
В практике здравоохранения|здравоохранительный| средние величины используются достаточно широко:
• для характеристики организации работы учреждений охраны здоровья (средняя занятость койки, средний срок пребывания в стационаре и др.);
• для характеристики показателей физического развития (длина, масса тела, окружность головы новорожденных|, но|да| др.);
• для анализа клинико-физиологических показателей (частота| пульса, дыхания, уровень артериального давления и | др.);
• для оценивания данных медико-социальных и санитарно-гигиенических исследований (среднее число лабораторных исследований, средние нормы питательного рациона, средний уровень радиационного загрязнения, но|да| др.).
Обязательным условием расчета средних величин для исследуемой совокупности является ее однородность. Если отдельные элементы совокупности имеют слишком большие, или слишком малые количественные значения признаки, которые существенно отличаются от других, такие элементы будут влиять на размер средней величины для данной совокупности и средняя не будет объективно выражать обобщающую характеристику совокупности. Одним из вариантов решения проблемы может быть исключение отдельных вариант из последующего анализа (что требует использования соответствующих методик оценки), или проведения расчета погрупповых средних с определением максимальных и минимальных колебаний. |
Свойством средней величины является ее обобщённая характеристика. Средняя величина рассчитывается путем сопоставления абсолютных или относительных величин. При этом качественно однородная совокупность и достаточное число наблюдений является основными требованиями для расчета средних величин. Смешивание совокупности, которая определяется разными качественными признаками, приводит к расчету нетипичных средних величин, которые не могут быть основой научного анализа. Как избежать качественной неоднородности, решается во время планирования исследования и во время группирования первичного материала на основе качественного анализа исследуемых явлений. Например, нельзя изучать клинические параметры больных вообще, без деления их за нозологическими формами, возрастом и так далее Необходимо число наблюдений определяется за соответствующими методиками в зависимости от характера данных и дизайна исследования. Распространен шаблонный подход отбора не меньше N (ЗО, 50, 100) пациентов является априорным, что недопустимо в клинических исследованиях.
Средняя величина имеет двойственный характер: с одной стороны она характеризует совокупность в целом, а из|с| второго — она является основой|основанием| для оценки отдельных единиц совокупности|, их разнообразия и изменчивости|переменчивости|.
1. По форме расчета можно выделить:
а) среднюю арифметическую величину;
б) среднюю гармоничную величину;
в) среднюю геометрическую величину;
г) среднюю квадратичную, кубическую, и другие величины.
2. За охватыванием|охватом| совокупности выделяются:
а) групповая средняя величина;
б) общая средняя величина.
Рассмотрим подробнее отдельные виды средних величин|.
Средняя арифметическая является самым распространенным видом средних величин. Она отображается|обозначается| как X. Однако, часто средняя арифметическая отражается|обозначается| буквой М (лат. Media|). За характером данных она может быть простою или взвешенной|.
Отдельные элементы (значение) совокупности однородных за качественным составом предметов, явлений, параметров являются вариантами, а всю их совокупность можно представить в виде вариационного ряда, который является основой для определения средних величин. Вариационный ряд – это ряд вариант и соответствующих им частот. |
Вариационный ряд может быть простым, где каждая варианта представлена отдельно, потому частота каждой из них равняется единице. Например, распределение больных по частоте пульса:
68, 69, 75, 70, 65, 68, 70, 75, 74, 72, 72, 68. Данный ряд также неранговый, потому что варианты не систематизированы. Систематизировав варианты в порядке увеличения или уменьшения их числового значения, данный ряд можно превратить в ранговый:
65, 68, 68, 68, 69, 70, 70, 72, 72, 74, 75, 75.
Если варианты сгруппировать за их абсолютным значением|, то можно получить сгруппированный вариационный ряд, где каждая варианта имеет свою частоту. Например:
Вариационные ряды, где значение вариант представлен в виде интервалов, называются интервальными. В виде| интервального ряда часто представляют признаки со значительным количеством вариант. При этом значение каждой варианты поданы в виде интервала (см. ниже).
Распределение мальчиков 7 лет по росту | |
Рост (х) | Число мальчиков (f) |
125,0-126,9 127,0-128,9 129,0-130,9 131,0-132,9 | |
Всего: | n=28 |
В приведенной|наведенной| таблице интервалы являются закрытыми — каждый из них имеет верхний и нижний предел|границу|. В практике попадаются открыты интервалы (возраст|век| 60 лет и старше, рост до 120 см но|да| др.). В процессе анализа ширину открытого интервала|, конечно, принимают ровной|равной| ширине смежного с ним интервала.
Сгруппированный интервальный вариационный ряд можно получить путем объединения вариант в группы. При этом необходимо помнить, что:
а)размер вариационных групп должен зависеть от природы| явления;
б|б|) имеет смысл определять одинаковые интервалы;
в) границы вариационных групп не должны повторяться.
Все вариационные ряды за качественной характеристикой распределяются на дискретные, в которых|каких| варианты могут быть представлены только целыми числами или полученные в результате подсчетов|вычисления| (распределение|деление| за частотою
пульсу|, числом кроватных|постель| дней, посещений) и инкретные (непрерывные|), где варианты могут быть представлены как целыми, так и дробными, числами, или является результатом измерений (приведена|наведенный| таблица). Клинические параметры являются по большей части примером|прикладом| инкретных| вариант.
В процессе проведения исследования вопроса о число| вариационных групп решают|разрешают| учитывая характер материала| и численность совокупности. Характерные особенности по распределению|делению| не окажутся|проявляются|, если при незначительном числе единиц наблюдения взять значительное число групп, или если число групп является недостаточным. Одним из вариантов автоматического группирования|группировки| есть использование|употребление| формулы Стерджеса для определения оптимального числа групп:
n – число групп; N – число единиц наблюдения
Использование|употребление| данной формулы целесообразное при большом|великом| числе единиц наблюдение.
Другим вариантом, более гибким с практической точки зрения, является метод определения амплитуды ряда (разница между максимальным и минимальным значением варианта). Для решения вопроса о числе групп необходимо подать статистическую совокупность в виде рангового ряда, то есть разместить ее единицы в определенном порядке. При численности совокупности менее 100 единиц не целесообразно планировать больше 10 групп.
Этапы составления|сдает| интервального вариационного ряда:
• определение амплитуды ряда;
• определение числа групп;
• определение величины интервала.
Расчет средних величин базируется на значениях вариант. Если вариант представлен в виде интервала за величину в каждом из них принимают центральный вариант, то есть середину|средину| интервала. Для дискретного ряда| центральный вариант определяется как полусумма| одного интервала. Для инкрементного ряда (предыдущий|предварительный| пример|приклад|) ею является полусумма начальных|первоначальных| значений двух соседних интервалов|: (125,0+127,0)/2=126 см.
Средняя арифметическая величина имеет определены математические свойства, которые полнее раскрывают ее сущность: произведение средней на сумму частот равняется сумме произведений каждой варианты на соответствующие им частоты; 2) сумма отклонений отдельных вариант от средней арифметической равняется нулю; 3) если все варианты совокупности увеличить или уменьшить на постоянную величину, то средняя арифметическая соответственно изменится на такую же величину; 4) если все варианты совокупности увеличить или уменьшить в определенное количество раз (А), то средняя арифметическая соответственно изменится в такое же количество раз (А); 5) если все частоты (весы) разделить или умножить на какое-то число, то средняя арифметическая вследствие этого не изменится — если мы увеличиваем или уменьшаем равнозначно частоты всех вариант, мы не изменяем вес каждой отдельной варианты ряда. |
Взвешенная средняя арифметическая определяется как сумма произведений вариант на соответствующие частоты, разделенная на общее число наблюдений. Частоты отражаются|обозначаются| буквою| f (frequency|) и указывают, сколько раз встречается каждая варианта в вариационном ряду.
Если варианты обозначить X, частоты f, общее число наблюдений, — буквой N, арифметическую сумму символом Σ, то формула средней арифметической будет иметь вид:
1) для простого ряда (простая средняя арифметическая):
2)для сгруппированного ряда (взвешенная средняя арифметическая):
=
Средняя арифметическая величина – наиболее часто используемый вид средних величин. Она может быть простой и взвешенной. Отражается как Х (иногда М). |
Наряду со средней арифметической, для статистического анализа применяются, хотя и реже, другие виды средних: средняя гармоничная и средняя геометрическая.
Средняя гармоничная определяется в тех случаях, когда известны данные числителя при отсутствии данных о знаменателе.
Xгарм=
Например, необходимо определить среднее время, тратящее на прием одного больного, когда известно, что 5 врачей вели прием в течение|на протяжении| 8 часов. Каждый из них тратил в среднем на прием одного больного, соответственно 20; 16; 20; 15; 24 минуты. Средняя арифметическая (М=17,75) в данном случае не даст точную оценку результату, поскольку каждый из врачей принял различное|различную| ‘ количество пациентов.
Среднюю гармоничную целесообразно использовать также при оценивании выживания больных, средней длительности жизни, некоторых|некоих| экономических|экономичных| показателей.
Средняя геометрическая определяется для тех параметров, изменения значений которых проходят в геометрической прогрессии (изменение численности населения в период между переписями, результаты титрования вакцин, прирост массы тела новорожденных в течение отдельных месяцев жизни, но др.).
Формула для расчета простой средней геометрической следующая:
Mгеом=
lgMгеом=
Логарифм средней геометрической равняется сумме логарифмов всех членов ряда, разделенных на их число. Логарифм полученного результата есть средняя геометрическая.
Например: имеем 16 наблюдений по уровню столбнякового антитоксина через 20 дней после его введения (АО): 0,05; 0,05; 0,025; 0,015; 0,01; 0,05; 0,075; 0,015; 0,25; 0,10; 0,10; 0,25; 0,25; 0,075; 0,075; Подставив данные в указанную формулу получаем: lgMгеом= Mгеом = 0,056 Средняя арифметическая для данного вариационного ряда будет несколько завышена и составляет М=0,088. |
Иногда в здравоохранении|здравоохранительный| для характеристики показателей используют среднюю реверсивную|. Дана величина| рассчитывается из|с| вариант, которые|какие| имеют среднюю| прогрессивную длительности лечения больных в стационарах, и будет рассчитываться из значений, какие более малые среднего уровня длительности госпитализации для всей исследуемой совокупности. Такая средняя может служить базой для определения оптимального уровня определенного показателя|.
К|до| средним величинам, которые имеют относительный характер относятся медиана и мода.
Что такое медиан мода?
Медиана (Me|) — это срединная, центральная варианта, который делит вариационный ряд на две равных части. Например, когда число наблюдений составляет 29, медианой будет 15-я| за счетом|счет-фактурой|, потому что по оба боки| от нее стоит по 14 наблюдений. В ряду с парным|четным| числом наблюдений центральное положение имеют две величины. Если числовые значения этих две величин разные|различные|, то за медиану берется их полусумма|.
Медианой в статистике называется варианта, который занимает срединное (центральное) положение в вариационном ряду. |
Рассматривая моду нельзя не рассмотреть понятие квартилей|, которые|какие| также применяются для характеристики совокупности. Квартили — это значения, которые делят две половины совокупность (разделенные медианой) еще раз пополам (от слова кварта — четверть). Выделяют верхний квартиль|, который|какой| часто помечают символом 75 % (значит|означает|, что 75 % вариант меньше верхнего квартиль|). Нижний квартиль 25 % (25 % вариант меньше нижнего квартиль|). Таким чином|, три точки — нижний квартиль|, медиана и верхний квартиль — делят выборку на 4 равных части.
Мода – это варианта, который имеет наибольшую частоту. |
Мода (Мо) — величина, которая чаще всего встречается, или чаще всего повторяется. Отвечает на графическом изображении максимальной ординате, то есть наивысшему значению графической кривой. Таким образом, при приближенном нахождении моды в простом (несгруппированному) ряду она определяется как варианта с наибольшим количеством частот (например: 2, 6, 6, 8, 9, 9, 9, 10 — мода = 9). При этом ряд может иметь бимода