Что называется интервальным вариационным рядом распределения

10.04.202213.04.2022 admin 0 Comments

3. Интервальный вариационный ряд.
Гистограмма относительных частот

На предыдущем уроке по математической статистике (Занятие 1) мы разобрали дискретный вариационный ряд (Занятие 2), и сейчас на очереди интервальный. Его понятие, графическое представление (гистограмма и эмпирическая функция распределения), а также рациональные методы вычислений, как ручные, так и программные. В том числе будут рассмотрены задачи с достаточно большим количеством (100-200) вариант – что делать в таких случаях, как обработать большой массив данных.

Предпосылкой построения интервального вариационного ряда (ИВР) является тот факт, что исследуемая величина принимает слишком много различных значений. Зачастую ИВР появляется в результате измерения непрерывной характеристики изучаемых объектов. Типично – это время, масса, размеры и другие физические характеристики. Подходящие примеры встретились в первой же статье по матстату, вспоминаем Константина, который замерял время на лабораторной работе и Фёдора, который взвешивал помидоры.

Для изучения интервального вариационного ряда затруднительно либо невозможно применить тот же подход, что и для дискретного ряда. Это связано с тем, что ВСЕ варианты многих ИВР различны. И даже если встречаются совпадающие значения, например, 50 грамм и 50 грамм, то связано это с округлением, ибо полученные значения всё равно отличаются хоть какими-то микрограммами.

Поэтому для исследования ИВР используется другой подход, а именно, определяется интервал, в пределах которого варьируются значения, затем данный интервал делится на частичные интервалы, и по каждому интервалу подсчитываются частоты – количество вариант, которые в него попали.

Разберём всю кухню на конкретной задаче, и чтобы как-то разнообразить физику, я приведу пример с экономическим содержанием, кои десятками предлагают студентам экономических отделений. Деньги, строго говоря, дискретны, но если надо, непрерывны :), и по причине слишком большого разброса цен, для них целесообразно строить интервальный ряд:

По результатам исследования цены некоторого товара в различных торговых точках города, получены следующие данные (в некоторых денежных единицах):

Требуется составить вариационный ряд распределения, построить гистограмму и полигон относительных частот + бонус – эмпирическую функцию распределения.

Такое обывательское исследование проводит каждый из нас, начиная с анализа цены на пакет молока ~~вот это дожил~~ в нескольких магазинах, и заканчивая ценами на недвижимость по гораздо бОльшей выборке. Что называется, не какие-то там унылые сантиметры.

Поэтому представьте свой любимый товар / услугу и наслаждайтесь решением🙂

Очевидно, что перед нами выборочная совокупность объемом наблюдений (таблица 10*3), и вопрос номер один: какой ряд составлять – дискретный или интервальный? Смотрим на таблицу: среди предложенных цен есть одинаковые, но их разброс довольно велик, и поэтому здесь целесообразно провести интервальное разбиение. К тому же цены могут быть округлёнными.

Начнём с экстремальной ситуации, когда у вас под рукой нет Экселя или другого подходящего программного обеспечения. Только ручка, карандаш, тетрадь и калькулятор.

Тактика действий похожа на исследование дискретного вариационного ряда. Сначала окидываем взглядом предложенные числа и определяем примерный интервал, в который вписываются эти значения. «Навскидку» все значения заключены в пределах от 5 до 11. Далее делим этот интервал на удобные подынтервалы, в данном случае напрашиваются промежутки единичной длины. Записываем их на черновик:

Теперь начинаем вычёркивать числа из исходного списка и записывать их в соответствующие колонки нашей импровизированной таблицы:

После этого находим самое маленькое число в левой колонке и самое большое значение – в правой. Тут даже ничего искать не пришлось, честное слово, не нарочно получилось:)
ден. ед. – хорошим тоном считается указывать размерность.

Вычислим размах вариации:
ден. ед. – длина общего интервала, в пределах которого варьируется цена.

Теперь его нужно разбить на частичные интервалы. Сколько интервалов рассмотреть? По умолчанию на этот счёт существует формула Стерджеса:

, где – десятичный логарифм* от объёма выборки и – оптимальное количество интервалов, при этом результат округляют до ближайшего левого целого значения.

* есть на любом более или менее приличном калькуляторе

В нашем случае получаем:
интервалов.

Следует отметить, что правило Стерджеса носит рекомендательный, но не обязательный характер. Нередко в условии задачи прямо сказано, на какое количество интервалов нужно проводить разбиение (на 4, 5, 6, 10 и т.д.), и тогда следует придерживаться именно этого указания.

Длины частичных интервалов могут быть различны, но в большинстве случаев использует равноинтервальную группировку:
– длина частичного интервала. В принципе, здесь можно было не округлять и использовать длину 0,96, но удобнее, ясен день, 1.

И коль скоро мы прибавили 0,04, то по 5 частичным интервалам у нас получается «перебор»: . Посему от самой малой варианты отмеряем влево 0,1 влево (половину «перебора») и к значению 5,7 начинаем прибавлять по , получая тем самым частичные интервалы. При этом сразу рассчитываем их середины (например, ) – они требуются почти во всех тематических задачах:

– убеждаемся в том, что самая большая варианта вписалась в последний частичный интервал и отстоит от его правого конца на 0,1.

Далее подсчитываем частоты по каждому интервалу. Для этого в черновой «таблице» обводим значения, попавшие в тот или иной интервал, подсчитываем их количество и вычёркиваем:

Так, значения из 1-го интервала я обвёл овалами (7 штук) и вычеркнул, значения из 2-го интервала – прямоугольниками (11 штук) и вычеркнул и так далее.

Правило: если варианта попадает на «стык» интервалов, то её следует относить в правый интервал. У нас такая варианта встретилась одна: – и её нужно причислить к интервалу .

В результате получаем интервальный вариационный ряд, при этом обязательно убеждаемся в том, что ничего не потеряно: , и, кроме того, рассчитываем относительные частоты по каждому интервалу, которые уместно округлить до двух знаков после запятой:

Дело за чертежами. Для ИВР чаще всего требуется построить гистограмму.

Гистограмма относительных частот – это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов, а высота – соответствующим относительным частотам:

При этом вполне допустимо использовать нестандартную шкалу по оси абсцисс, в данном случае я начал нумерацию с четырёх.

Площадь гистограммы равна единице, и это статистический аналог функции плотности распределения непрерывной случайной величины. Построенный чертёж даёт наглядное и весьма точное представление о распределении цен на ботинки по всей генеральной совокупности. Но это при условии, что выборка представительна.

Вместе с гистограммой нередко требуют построить полигон. Без проблем, полигон относительных частот – это ломаная, соединяющая соседние точки , где – середины интервалов:

Автоматизируем решение в Экселе:

Как составить ИВР и представить его графически? (Ютуб)

И бонус – эмпирическая функция распределения. Она определяется точно так же, как в дискретном случае:

, где – количество вариант СТРОГО МЕНЬШИХ, чем «икс», который «пробегает» все значения от «минус» до «плюс» бесконечности.

Но вот построить её для интервального ряда намного проще. Находим накопленные относительные частоты:

И строим кусочно-ломаную линию, с промежуточными точками , где – правые концы интервалов, а – относительная частота, которая успела накопиться на всех «пройденных» интервалах:

При этом если и если .

Напоминаю, что данная функция не убывает, принимает значения из промежутка и, кроме того, для ИВР она ещё и непрерывна.

Эмпирическая функция распределения является аналогом функции распределения НСВ и приближает теоретическую функцию , которую теоретически, а иногда и практически можно построить по всей генеральной совокупности.

Помимо перечисленных графиков, вариационные ряды также можно представить с помощью кумуляты и огивы частот либо относительных частот, но в классическом учебном курсе эта дичь редкая, и поэтому о ней буквально пару абзацев:

Кумулята – это ломаная, соединяющая точки:

* либо – для дискретного вариационного ряда;
либо – для интервального вариационного ряда.

* – накопленные «обычные» частоты

В последнем случае кумулята относительных частот представляет собой «главный кусок» недавно построенной эмпирической функции распределения.

Огива – это обратная функция по отношению к кумуляте – здесь варианты откладываются по оси ординат, а накопленные частоты либо относительные частоты – по оси абсцисс.

С построением данных линий, думаю, проблем быть не должно, чего не скажешь о другой проблеме. Хорошо, если в вашей задаче всего лишь 20-30-50 вариант, но что делать, если их 100-200 и больше? В моей практике встречались десятки таких задач, и ручной подсчёт здесь уже не торт. Считаю нужным снять небольшое видео:

Как быстро составить ИВР при большом объёме выборки? (Ютуб)

Ну, теперь вы монстры 8-го уровня 🙂

Но не всё так сурово. В большинстве задач вам предложат готовый вариационный ряд, и на счёт молока, то, конечно, была шутка:

Выборочная проверка партии чая, поступившего в торговую сеть, дала следующие результаты:

Требуется построить гистограмму и полигон относительных частот, эмпирическую функцию распределения

Проверяем свои навыки работы в Экселе! (исходные числа и краткая инструкция прилагается) И на всякий случай краткое решение для сверки в конце урока.

Что ещё важного по теме? Время от времени встречаются ИВР с открытыми крайними интервалами, например:

В таких случаях, что убийственно логично, интервалы «закрывают». Обычно поступают так: сначала смотрим на средние интервалы и выясняем длину частичного интервала: км. И для дальнейшего решения можно считать, что крайние интервалы имеют такую же длину: от 140 до 160 и от 200 до 220 км. Тоже логично. Но уже не убийственно:)

Ну вот, пожалуй, и вся практически важная информация по ИВР.

На очереди числовые характеристики вариационных рядов и начнём мы с их центральных характеристик, а именно – Моды, медианы и средней.

Пример 7. Решение: заполним расчётную таблицу

Построим гистограмму и полигон относительных частот:

Построим эмпирическую функцию распределения:

Автор: Емелин Александр

(Переход на главную страницу)

Zaochnik.com – профессиональная помощь студентам

cкидкa 15% на первый зaкaз, прoмoкoд: 5530-hihi5

Tutoronline.ru – онлайн репетиторы по математике и другим предметам

Источник

Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервалы, $\left.\left[a_,a_i\right.\right)$	$\left.\left[a_<0>,a_1\right.\right)$	$\left.\left[a_<1>,a_2\right.\right)$	.	$\left.\left[a_,a_k\right.\right)$
Частоты, $f_i$	$f_1$	$f_2$	.	$f_k$

Скобка $\lfloor\ \rfloor$ означает целую часть (округление вниз до целого числа).

Скобка $\lceil\ \rceil$ означает округление вверх, в данном случае не обязательно до целого числа.

Заметим, что поскольку шаг h находится с округлением вверх, последний узел $a_k\geq x_$.

$\left.\left[a_,a_i\right.\right)$ cм

$\left.\left[142;150\right.\right)$

$\left.\left[150;158\right.\right)$

$\left.\left[158;166\right.\right)$

$\left.\left[166;174\right.\right)$

$\left.\left[174;182\right.\right)$

$\left.\left[182;190\right.\right)$

$\left[190;198\right]$

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i	1	2	3	4	5	6	7
$\left.\left[a_,a_i\right.\right)$ cм	$\left.\left[142;150\right.\right)$	$\left.\left[150;158\right.\right)$	$\left.\left[158;166\right.\right)$	$\left.\left[166;174\right.\right)$	$\left.\left[174;182\right.\right)$	$\left.\left[182;190\right.\right)$	$\left[190;198\right]$
$f_i$	4	7	11	34	33	8	3

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

$x_i$	146	154	162	170	178	186	194
$w_i$	0,04	0,07	0,11	0,34	0,33	0,08	0,03
$S_i$	0,04	0,11	0,22	0,56	0,89	0,97	1

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

$x_i$	146	154	162	170	178	186	194	∑
$w_i$	0,04	0,07	0,11	0,34	0,33	0,08	0,03	1
$x_iw_i$	5,84	10,78	17,82	57,80	58,74	14,88	5,82	171,68

$$ X_=\sum_^k x_iw_i=171,68\approx 171,7\ \text <(см)>$$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: \begin x_o=166,\ f_m=34,\ f_=11,\ f_=33,\ h=8\\ M_o=x_o+\frac><(f_m-f_)+(f_m+f_)>h=\\ =166+\frac<34-11><(34-11)+(34-33)>\cdot 8\approx 173,7\ \text <(см)>\end На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: \begin x_o=166,\ w_m=0,34,\ S_=0,22,\ h=8\\ \\ M_e=x_o+\frac<0,5-S_>h=166+\frac<0,5-0,22><0,34>\cdot 8\approx 172,6\ \text <(см)>\end \begin \\ X_=171,7;\ M_o=173,7;\ M_e=172,6\\ X_\lt M_e\lt M_o \end Ряд асимметричный с левосторонней асимметрией.
При этом $\frac<|M_o-X_|><|M_e-X_|>=\frac<2,0><0,9>\approx 2,2\lt 3$, т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Например:
Для распределения учеников по росту получаем:

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака $\left\,\ j=\overline<1,N>$
Шаг 1. Построить интервальный ряд с интервалами $\left.\right[a_,\ a_i\left.\right)$ и частотами $f_i,\ i=\overline<1,k>$ (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти $x_i,w_i,S_i,x_iw_i,x_i^2w_i$
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

$\left.\left[a_,a_i\right.\right)$ лет

$\left.\left[18;22\right.\right)$

$\left.\left[22;26\right.\right)$

$\left.\left[26;30\right.\right)$

$\left.\left[30;34\right.\right)$

$\left.\left[34;38\right.\right)$

Считаем частоты для каждого интервала. Получаем интервальный ряд:

$\left.\left[a_,a_i\right.\right)$ лет	$\left.\left[18;22\right.\right)$	$\left.\left[22;26\right.\right)$	$\left.\left[26;30\right.\right)$	$\left.\left[30;34\right.\right)$	$\left.\left[34;38\right.\right)$
$f_i$	1	7	12	6	4

2) Составляем расчетную таблицу:

$x_i$	20	24	28	32	36	∑
$f_i$	1	7	12	6	4	30
$w_i$	0,033	0,233	0,4	0,2	0,133	1
$S_i$	0,033	0,267	0,667	0,867	1	—
$x_iw_i$	0,667	5,6	11,2	6,4	4,8	28,67
$x_i^2w_i$	13,333	134,4	313,6	204,8	172,8	838,93

Источник

Интервалы, \(\left.\left[a_,a_i\right.\right)\)	\(\left.\left[a_<0>,a_1\right.\right)\)	\(\left.\left[a_<1>,a_2\right.\right)\)	.	\(\left.\left[a_,a_k\right.\right)\)
Частоты, \(f_i\)	\(f_1\)	\(f_2\)	.	\(f_k\)

i	1	2	3	4	5	6	7
\(\left.\left[a_,a_i\right.\right)\) cм	\(\left.\left[142;150\right.\right)\)	\(\left.\left[150;158\right.\right)\)	\(\left.\left[158;166\right.\right)\)	\(\left.\left[166;174\right.\right)\)	\(\left.\left[174;182\right.\right)\)	\(\left.\left[182;190\right.\right)\)	\(\left[190;198\right]\)
\(f_i\)	4	7	11	34	33	8	3

\(\left.\left[a_,a_i\right.\right)\) лет	\(\left.\left[18;22\right.\right)\)	\(\left.\left[22;26\right.\right)\)	\(\left.\left[26;30\right.\right)\)	\(\left.\left[30;34\right.\right)\)	\(\left.\left[34;38\right.\right)\)
\(f_i\)	1	7	12	6	4

Что и для чего?

Что называется интервальным вариационным рядом распределения

3. Интервальный вариационный ряд.
Гистограмма относительных частот

Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

п.4. Выборочная дисперсия и СКО

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

п.6. Алгоритм исследования интервального вариационного ряда

п.7. Примеры

Добавить комментарий Отменить ответ

3. Интервальный вариационный ряд. Гистограмма относительных частот

Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

п.4. Выборочная дисперсия и СКО

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

п.6. Алгоритм исследования интервального вариационного ряда

п.7. Примеры

Вам также понравится

Что означают сердечки в переписке в ватсапе

К чему снятся ведьмы во сне мужчине

Гугл плей пасс что это

Добавить комментарий Отменить ответ

3. Интервальный вариационный ряд.
Гистограмма относительных частот