Что называется вариационным рядом приведите пример
Тема 1. Составление вариационного ряда
Группы варьирующих величин называют вариациями или классами. Варьированием называется само явление изменчивости организмов, признаков, величин и т.д.
Пример 1. Имеются данные о суточных удоях коров, кг: 12; 8,4; 10,7; 12,3; 7,6; 15,8; 20,4; 16,7; 13,7; 14,1; 18,7; 11,2; 12,3; 14,7; 16,1; 13,2; 8,0; 13,7; 15,1; 9,2; 16,0; 17,4; 13,1; 12,5; 11,5; 13,8; 11,6; 10,2; 14,8; 9,4; 6,1; 8,2; 18,3; 22,9; 11,5; 15,2; 14,0; 9,5; 10,8; 12,0.
Для составления вариационного ряда по данному признаку необходимо:
1. Варианты сгруппировать в классы, для чего находятлимиты, в нашем примере минимальное – 6,1 и максимальное значение – 22,9.
3. Находят классное расстояние по формуле:
а) Число классов зависит от количества особей в выборке, точности исследований и т.д.
Принято: количество особей число классов
201 – и более 12 – 17
б) Полученный указатель классового промежутка для удобства следует округлить, например: 382 до 400; 43,7 до 40; 2,5 до 3; и т.д. При округлении допускается уменьшение или увеличение количества классов. В нашем примере выбрано 6 классов.
4. Установить начало границы первого класса. Оно должно быть целым круглым числом, близким к минимуму, но не больше его и желательно, чтобы делилось без остатка на величину классового промежутка.
Определяются границы классов. Нижней границей первого класса служит минимальная величина выборки, округленная до ближайшего меньшего числа. В нашем примере 6,1 надо округлить до 6, которое и будет служить нижней границей первого класса. Прибавив к ней величину классового промежутка (3 кг) находим нижнюю границу второго класса (9). Также на ходим границы и остальных классов (12,15,18,21), чтобы при разноске варианта не попала на границу между классами, проставляют верхнюю границу каждого класса. Для этого уменьшают нижнюю границу каждого класса на 0,1 или на 1, в зависимости от точности измерения. Уменьшив нижние границы на 0,1 кг получим границы первого класса 6,0 – 8,9; второго – 9,0 – 11,9 и т.д.
5. Определив границы классов, разносят все варианты по классам. Разноску вариантов по классам производят по порядку их записи, ставя в классах сначала точки, а когда их наберется 4, то соединять их с черточками:

Число частот при разноске должно быть равно общему числу вариант при выборке (n).
Двойной ряд чисел, отражающий распределение вариант по классам, называется вариационным рядом.
Составленный вариационный ряд будет иметь следующий вид:
| Разноска | Р |
| 6 – 8,9 | ![]() |
| 9 – 11,9 | ![]() |
| 12 – 14,9 | ![]() |
| 15 – 17,9 | ![]() |
| 18 – 20,9 | ![]() |
| 21 – 23,9 | ![]() |
| n = 40 | n = 40 |
В вариационном ряду существует определенная закономерность. Крайние вариации не многочисленны: с приближением к середине ряда частоты вариаций увеличиваются. Тот класс, в который входит максимальное число частот, называется модальным классом. В приведенном примере модальным будет класс 12 – 14,9, на который пришлось 14 частот.
Для наглядности вариационный ряд может быть изображен в виде графика. Для этого на горизонтальной оси располагают классы, а на вертикальной – частоты классов. Точки пересечения этих линий соединяют кривой.
Задание №1. Построить вариационный ряд и вариационную кривую по живой массе коров холмогорской породы (кг): 745, 432, 500, 488, 384, 445, 432, 520, 421, 469, 460, 535, 486, 556, 441, 473, 534, 505, 432, 434, 417, 406, 450, 491, 420, 445, 426, 490, 442, 439, 429, 421, 470, 391, 482, 390, 426, 488, 411, 475, 440, 539, 488, 433, 546, 493, 472, 441, 463, 468, 483, 442, 524, 447, 430, 485, 440, 488, 439, 445, 504, 550, 495, 536, 426, 388, 407, 425, 390, 418, 465, 391, 365, 383, 427, 448, 452, 455, 387, 374, 360, 545, 467, 519, 456, 441, 434, 488, 443, 493, 457, 425, 429, 445, 442, 393, 405, 422, 400, 456, 441.
Контрольные вопросы:
1. Что называется биометрией?
2. Что называется генеральной совокупностью?
3. Какие выборки называются малыми, большими?
Виды вариационных рядов
ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ
Обычно полученные наблюдаемые данные представляют собой множество расположенных в беспорядке чисел.
. Операция, заключающаяся в том, что результаты наблюдений над случайной величиной располагают в порядке неубывания, называется ранжированием опытных данных.
После проведения операции ранжирования опытные данные нетрудно объединить в группы, т.е. сгруппировать так, что в каждой отдельной группе значения случайной величины будут одинаковы.
Определение.Значения признака, которые при переходе от одного элемента совокупности (группы) к другому изменяются (варьируют), называются вариантами и обычно обозначаются малыми латинскими буквами х, у, z.
Определение. Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой или весом соответствующего варианта и обозначается ni, где i – индекс варианта.
Частота (ni) показывает, сколько раз встречается тот или иной вариант (значение признака) в статистической совокупности.
Определение.Отношение частоты данного варианта к общей сумме частот всех вариантов называется частостью или долей этого варианта.

Частость или относительная частота (wi) показывает, какая часть единиц совокупности имеет тот или иной вариант. Нетрудно заметить, что частость wi является статистической вероятностью появления варианта.
Сумма всех частостей равна 1:
Вариационные ряды бывают дискретными и интервальными.
Определение.Дискретным вариационным рядом распределения называется ранжированная (в порядке возрастания или убывания) совокупность вариантов с соответствующими им частотами (весами) или частостями.
Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного вариационного ряда показан в табл. 1.
| Значения признака (xi) | x1 | x2 | … | xn |
| Частость (wi) | w1 | w2 | . | wk |
Дискретный вариационный ряд графически можно представить с помощью полигона распределения частот или частостей.
Определение.Интервальным вариационным рядом называется упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины.
Интервальные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга на сколь угодно малую величину. Значения признака в них задаются в виде интервалов. Общий вид интервального вариационного ряда показан в табл. 2, где i = 1,2,…,k
| Значения признака (хi) | a1 – a2 | a2 – a3 | … | ai-1 – ai |
| Частость (wi) | w1 | w2 | . | wk |
В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или размахом вариации R.

Чтобы ряд не был громоздким, обычно число интервалов берут от 7 до 11. Для более точного определения величины частичного интервала можно воспользоваться формулой Стерджеса:

Промежуточные интервалы получают, прибавляя к концу предыдущего интервала длину частичного интервала h. Кроме того, в интервальном вариационном ряде могут встречаться интервалы разной длины.
Определение. Если интервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равновеликими, в противном случае – неравновеликими.
Частоты в каждом интервале называют интервальными, а их отношение к общему числу наблюдений – интервальными частостями. При вычислении интервальных частостей округление результатов следует проводить таким образом, чтобы общая сумма частостей была равна 1.
Интервальные вариационные ряды графически можно представить с помощью гистограммы, т.е. столбчатой диаграммы. Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относительной плотности распределения.
Определение.Абсолютная плотность – отношение частоты интервала к его величине:

Определение. Относительная плотность – отношение частости интервала к его величине:

Иногда интервальный вариационный ряд для простоты исследований условно заменяют дискретным. В этом случае серединное значение i- го интервала принимают за вариант Xi, а соответствующую интервальную частоту ni – за частоту этого интервала.
Например, требуется обследовать большой коллектив рабочих одной и той же профессии. Из за трудоемкости всей работы делается выборочное исследование части этого коллектива.
Весь коллектив при этом называется генеральной совокупностью, а выделенная для обследования часть коллектива называется выборочной совокупностью.
Отношение объема выборочной совокупности n, к объему генеральной совокупности N,т.е. 
Любое выборочное наблюдение, как правило, не дает точные характеристики всей генеральной совокупности. Поэтому, каждый результат, вычисленный по данным выборки, имеет некоторую погрешность. Эта погрешность называется ошибкой репрезентативности.
Рассмотрим на примере систематизацию полученных данных.
Пример 1. При регистрации размеров выдаваемой на складе имущества мужской обуви были получены следующие данные о 79 выдачах, которые были сведены в таблицу 1.1. по возрастающему значению признака / размера обуви /.
Интервальный вариационный ряд и его характеристики
п.1. Построение интервального вариационного ряда по данным эксперимента
| Интервалы, \(\left.\left[a_ | \(\left.\left[a_<0>,a_1\right.\right)\) | \(\left.\left[a_<1>,a_2\right.\right)\) | . | \(\left.\left[a_ |
| Частоты, \(f_i\) | \(f_1\) | \(f_2\) | . | \(f_k\) |
Скобка \(\lfloor\ \rfloor\) означает целую часть (округление вниз до целого числа).
Скобка \(\lceil\ \rceil\) означает округление вверх, в данном случае не обязательно до целого числа.
Заметим, что поскольку шаг h находится с округлением вверх, последний узел \(a_k\geq x_
| \(\left.\left[a_ | \(\left.\left[142;150\right.\right)\) | \(\left.\left[150;158\right.\right)\) | \(\left.\left[158;166\right.\right)\) | \(\left.\left[166;174\right.\right)\) | \(\left.\left[174;182\right.\right)\) | \(\left.\left[182;190\right.\right)\) | \(\left[190;198\right]\) |
п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:
| i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| \(\left.\left[a_ | \(\left.\left[142;150\right.\right)\) | \(\left.\left[150;158\right.\right)\) | \(\left.\left[158;166\right.\right)\) | \(\left.\left[166;174\right.\right)\) | \(\left.\left[174;182\right.\right)\) | \(\left.\left[182;190\right.\right)\) | \(\left[190;198\right]\) |
| \(f_i\) | 4 | 7 | 11 | 34 | 33 | 8 | 3 |
Найдем середины интервалов, относительные частоты и накопленные относительные частоты:
| \(x_i\) | 146 | 154 | 162 | 170 | 178 | 186 | 194 |
| \(w_i\) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 |
| \(S_i\) | 0,04 | 0,11 | 0,22 | 0,56 | 0,89 | 0,97 | 1 |
п.3. Выборочная средняя, мода и медиана. Симметрия ряда
Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).
Например:
Для распределения учеников по росту получаем:
| \(x_i\) | 146 | 154 | 162 | 170 | 178 | 186 | 194 | ∑ |
| \(w_i\) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 | 1 |
| \(x_iw_i\) | 5,84 | 10,78 | 17,82 | 57,80 | 58,74 | 14,88 | 5,82 | 171,68 |
$$ X_
Данные для расчета моды: \begin
Данные для расчета медианы: \begin
При этом \(\frac<|M_o-X_
п.4. Выборочная дисперсия и СКО
Например:
Для распределения учеников по росту получаем:
п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.
п.6. Алгоритм исследования интервального вариационного ряда
На входе: все значения признака \(\left\
Шаг 1. Построить интервальный ряд с интервалами \(\left.\right[a_
Шаг 2. Составить расчетную таблицу. Найти \(x_i,w_i,S_i,x_iw_i,x_i^2w_i\)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.
п.7. Примеры
Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.
| \(\left.\left[a_ | \(\left.\left[18;22\right.\right)\) | \(\left.\left[22;26\right.\right)\) | \(\left.\left[26;30\right.\right)\) | \(\left.\left[30;34\right.\right)\) | \(\left.\left[34;38\right.\right)\) |
Считаем частоты для каждого интервала. Получаем интервальный ряд:
| \(\left.\left[a_ | \(\left.\left[18;22\right.\right)\) | \(\left.\left[22;26\right.\right)\) | \(\left.\left[26;30\right.\right)\) | \(\left.\left[30;34\right.\right)\) | \(\left.\left[34;38\right.\right)\) |
| \(f_i\) | 1 | 7 | 12 | 6 | 4 |
2) Составляем расчетную таблицу:
| \(x_i\) | 20 | 24 | 28 | 32 | 36 | ∑ |
| \(f_i\) | 1 | 7 | 12 | 6 | 4 | 30 |
| \(w_i\) | 0,033 | 0,233 | 0,4 | 0,2 | 0,133 | 1 |
| \(S_i\) | 0,033 | 0,267 | 0,667 | 0,867 | 1 | — |
| \(x_iw_i\) | 0,667 | 5,6 | 11,2 | 6,4 | 4,8 | 28,67 |
| \(x_i^2w_i\) | 13,333 | 134,4 | 313,6 | 204,8 | 172,8 | 838,93 |
3. Интервальный вариационный ряд.
Гистограмма относительных частот
На предыдущем уроке по математической статистике (Занятие 1) мы разобрали дискретный вариационный ряд (Занятие 2), и сейчас на очереди интервальный. Его понятие, графическое представление (гистограмма и эмпирическая функция распределения), а также рациональные методы вычислений, как ручные, так и программные. В том числе будут рассмотрены задачи с достаточно большим количеством (100-200) вариант – что делать в таких случаях, как обработать большой массив данных.
Предпосылкой построения интервального вариационного ряда (ИВР) является тот факт, что исследуемая величина принимает слишком много различных значений. Зачастую ИВР появляется в результате измерения непрерывной характеристики изучаемых объектов. Типично – это время, масса, размеры и другие физические характеристики. Подходящие примеры встретились в первой же статье по матстату, вспоминаем Константина, который замерял время на лабораторной работе и Фёдора, который взвешивал помидоры.
Для изучения интервального вариационного ряда затруднительно либо невозможно применить тот же подход, что и для дискретного ряда. Это связано с тем, что ВСЕ варианты многих ИВР различны. И даже если встречаются совпадающие значения, например, 50 грамм и 50 грамм, то связано это с округлением, ибо полученные значения всё равно отличаются хоть какими-то микрограммами.
Поэтому для исследования ИВР используется другой подход, а именно, определяется интервал, в пределах которого варьируются значения, затем данный интервал делится на частичные интервалы, и по каждому интервалу подсчитываются частоты – количество вариант, которые в него попали.
Разберём всю кухню на конкретной задаче, и чтобы как-то разнообразить физику, я приведу пример с экономическим содержанием, кои десятками предлагают студентам экономических отделений. Деньги, строго говоря, дискретны, но если надо, непрерывны :), и по причине слишком большого разброса цен, для них целесообразно строить интервальный ряд:
По результатам исследования цены некоторого товара в различных торговых точках города, получены следующие данные (в некоторых денежных единицах): 
Требуется составить вариационный ряд распределения, построить гистограмму и полигон относительных частот + бонус – эмпирическую функцию распределения.
Такое обывательское исследование проводит каждый из нас, начиная с анализа цены на пакет молока вот это дожил в нескольких магазинах, и заканчивая ценами на недвижимость по гораздо бОльшей выборке. Что называется, не какие-то там унылые сантиметры.
Поэтому представьте свой любимый товар / услугу и наслаждайтесь решением🙂
Очевидно, что перед нами выборочная совокупность объемом 
Начнём с экстремальной ситуации, когда у вас под рукой нет Экселя или другого подходящего программного обеспечения. Только ручка, карандаш, тетрадь и калькулятор.
Тактика действий похожа на исследование дискретного вариационного ряда. Сначала окидываем взглядом предложенные числа и определяем примерный интервал, в который вписываются эти значения. «Навскидку» все значения заключены в пределах от 5 до 11. Далее делим этот интервал на удобные подынтервалы, в данном случае напрашиваются промежутки единичной длины. Записываем их на черновик:
Теперь начинаем вычёркивать числа из исходного списка и записывать их в соответствующие колонки нашей импровизированной таблицы: 
После этого находим самое маленькое число в левой колонке и самое большое значение – в правой. Тут даже ничего искать не пришлось, честное слово, не нарочно получилось:)

Вычислим размах вариации:

Теперь его нужно разбить на частичные интервалы. Сколько интервалов рассмотреть? По умолчанию на этот счёт существует формула Стерджеса:



* есть на любом более или менее приличном калькуляторе
В нашем случае получаем:

Следует отметить, что правило Стерджеса носит рекомендательный, но не обязательный характер. Нередко в условии задачи прямо сказано, на какое количество интервалов нужно проводить разбиение (на 4, 5, 6, 10 и т.д.), и тогда следует придерживаться именно этого указания.
Длины частичных интервалов могут быть различны, но в большинстве случаев использует равноинтервальную группировку:

И коль скоро мы прибавили 0,04, то по 5 частичным интервалам у нас получается «перебор»: 





– убеждаемся в том, что самая большая варианта 
Далее подсчитываем частоты по каждому интервалу. Для этого в черновой «таблице» обводим значения, попавшие в тот или иной интервал, подсчитываем их количество и вычёркиваем: 
Так, значения из 1-го интервала я обвёл овалами (7 штук) и вычеркнул, значения из 2-го интервала – прямоугольниками (11 штук) и вычеркнул и так далее.
Правило: если варианта попадает на «стык» интервалов, то её следует относить в правый интервал. У нас такая варианта встретилась одна: 

В результате получаем интервальный вариационный ряд, при этом обязательно убеждаемся в том, что ничего не потеряно: 

Дело за чертежами. Для ИВР чаще всего требуется построить гистограмму.
Гистограмма относительных частот – это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов, а высота – соответствующим относительным частотам: 
При этом вполне допустимо использовать нестандартную шкалу по оси абсцисс, в данном случае я начал нумерацию с четырёх.
Площадь гистограммы равна единице, и это статистический аналог функции плотности распределения непрерывной случайной величины. Построенный чертёж даёт наглядное и весьма точное представление о распределении цен на ботинки по всей генеральной совокупности. Но это при условии, что выборка представительна.
Вместе с гистограммой нередко требуют построить полигон. Без проблем, полигон относительных частот – это ломаная, соединяющая соседние точки 

Автоматизируем решение в Экселе:

И бонус – эмпирическая функция распределения. Она определяется точно так же, как в дискретном случае:


Но вот построить её для интервального ряда намного проще. Находим накопленные относительные частоты:
И строим кусочно-ломаную линию, с промежуточными точками 



При этом 



Напоминаю, что данная функция не убывает, принимает значения из промежутка 
Эмпирическая функция распределения является аналогом функции распределения НСВ и приближает теоретическую функцию 
Помимо перечисленных графиков, вариационные ряды также можно представить с помощью кумуляты и огивы частот либо относительных частот, но в классическом учебном курсе эта дичь редкая, и поэтому о ней буквально пару абзацев:
Кумулята – это ломаная, соединяющая точки:




* 
В последнем случае кумулята относительных частот 
Огива – это обратная функция по отношению к кумуляте – здесь варианты откладываются по оси ординат, а накопленные частоты либо относительные частоты – по оси абсцисс.
С построением данных линий, думаю, проблем быть не должно, чего не скажешь о другой проблеме. Хорошо, если в вашей задаче всего лишь 20-30-50 вариант, но что делать, если их 100-200 и больше? В моей практике встречались десятки таких задач, и ручной подсчёт здесь уже не торт. Считаю нужным снять небольшое видео:

Ну, теперь вы монстры 8-го уровня 🙂
Но не всё так сурово. В большинстве задач вам предложат готовый вариационный ряд, и на счёт молока, то, конечно, была шутка:
Выборочная проверка партии чая, поступившего в торговую сеть, дала следующие результаты:
Требуется построить гистограмму и полигон относительных частот, эмпирическую функцию распределения
Проверяем свои навыки работы в Экселе! (исходные числа и краткая инструкция прилагается) И на всякий случай краткое решение для сверки в конце урока.
Что ещё важного по теме? Время от времени встречаются ИВР с открытыми крайними интервалами, например:
В таких случаях, что убийственно логично, интервалы «закрывают». Обычно поступают так: сначала смотрим на средние интервалы и выясняем длину частичного интервала: 
Ну вот, пожалуй, и вся практически важная информация по ИВР.
На очереди числовые характеристики вариационных рядов и начнём мы с их центральных характеристик, а именно – Моды, медианы и средней.
Пример 7. Решение: заполним расчётную таблицу
Построим гистограмму и полигон относительных частот:
Построим эмпирическую функцию распределения:
Автор: Емелин Александр
(Переход на главную страницу)

cкидкa 15% на первый зaкaз, прoмoкoд: 5530-hihi5



















