Что называется интервальным вариационным рядом распределения

3. Интервальный вариационный ряд.
Гистограмма относительных частот

На предыдущем уроке по математической статистике (Занятие 1) мы разобрали дискретный вариационный ряд (Занятие 2), и сейчас на очереди интервальный. Его понятие, графическое представление (гистограмма и эмпирическая функция распределения), а также рациональные методы вычислений, как ручные, так и программные. В том числе будут рассмотрены задачи с достаточно большим количеством (100-200) вариант – что делать в таких случаях, как обработать большой массив данных.

Предпосылкой построения интервального вариационного ряда (ИВР) является тот факт, что исследуемая величина принимает слишком много различных значений. Зачастую ИВР появляется в результате измерения непрерывной характеристики изучаемых объектов. Типично – это время, масса, размеры и другие физические характеристики. Подходящие примеры встретились в первой же статье по матстату, вспоминаем Константина, который замерял время на лабораторной работе и Фёдора, который взвешивал помидоры.

Для изучения интервального вариационного ряда затруднительно либо невозможно применить тот же подход, что и для дискретного ряда. Это связано с тем, что ВСЕ варианты многих ИВР различны. И даже если встречаются совпадающие значения, например, 50 грамм и 50 грамм, то связано это с округлением, ибо полученные значения всё равно отличаются хоть какими-то микрограммами.

Поэтому для исследования ИВР используется другой подход, а именно, определяется интервал, в пределах которого варьируются значения, затем данный интервал делится на частичные интервалы, и по каждому интервалу подсчитываются частоты – количество вариант, которые в него попали.

Разберём всю кухню на конкретной задаче, и чтобы как-то разнообразить физику, я приведу пример с экономическим содержанием, кои десятками предлагают студентам экономических отделений. Деньги, строго говоря, дискретны, но если надо, непрерывны :), и по причине слишком большого разброса цен, для них целесообразно строить интервальный ряд:

По результатам исследования цены некоторого товара в различных торговых точках города, получены следующие данные (в некоторых денежных единицах):
Что называется интервальным вариационным рядом распределения
Требуется составить вариационный ряд распределения, построить гистограмму и полигон относительных частот + бонус – эмпирическую функцию распределения.

Такое обывательское исследование проводит каждый из нас, начиная с анализа цены на пакет молока вот это дожил в нескольких магазинах, и заканчивая ценами на недвижимость по гораздо бОльшей выборке. Что называется, не какие-то там унылые сантиметры.

Поэтому представьте свой любимый товар / услугу и наслаждайтесь решением🙂

Очевидно, что перед нами выборочная совокупность объемом Что называется интервальным вариационным рядом распределениянаблюдений (таблица 10*3), и вопрос номер один: какой ряд составлять – дискретный или интервальный? Смотрим на таблицу: среди предложенных цен есть одинаковые, но их разброс довольно велик, и поэтому здесь целесообразно провести интервальное разбиение. К тому же цены могут быть округлёнными.

Начнём с экстремальной ситуации, когда у вас под рукой нет Экселя или другого подходящего программного обеспечения. Только ручка, карандаш, тетрадь и калькулятор.

Тактика действий похожа на исследование дискретного вариационного ряда. Сначала окидываем взглядом предложенные числа и определяем примерный интервал, в который вписываются эти значения. «Навскидку» все значения заключены в пределах от 5 до 11. Далее делим этот интервал на удобные подынтервалы, в данном случае напрашиваются промежутки единичной длины. Записываем их на черновик:
Что называется интервальным вариационным рядом распределения

Теперь начинаем вычёркивать числа из исходного списка и записывать их в соответствующие колонки нашей импровизированной таблицы:
Что называется интервальным вариационным рядом распределения
После этого находим самое маленькое число в левой колонке и самое большое значение – в правой. Тут даже ничего искать не пришлось, честное слово, не нарочно получилось:)
Что называется интервальным вариационным рядом распределенияден. ед. – хорошим тоном считается указывать размерность.

Вычислим размах вариации:
Что называется интервальным вариационным рядом распределенияден. ед. – длина общего интервала, в пределах которого варьируется цена.

Теперь его нужно разбить на частичные интервалы. Сколько интервалов рассмотреть? По умолчанию на этот счёт существует формула Стерджеса:

Что называется интервальным вариационным рядом распределения, где Что называется интервальным вариационным рядом распределениядесятичный логарифм* от объёма выборки и Что называется интервальным вариационным рядом распределения– оптимальное количество интервалов, при этом результат округляют до ближайшего левого целого значения.

* есть на любом более или менее приличном калькуляторе

В нашем случае получаем:
Что называется интервальным вариационным рядом распределенияинтервалов.

Следует отметить, что правило Стерджеса носит рекомендательный, но не обязательный характер. Нередко в условии задачи прямо сказано, на какое количество интервалов нужно проводить разбиение (на 4, 5, 6, 10 и т.д.), и тогда следует придерживаться именно этого указания.

Длины частичных интервалов могут быть различны, но в большинстве случаев использует равноинтервальную группировку:
Что называется интервальным вариационным рядом распределения– длина частичного интервала. В принципе, здесь можно было не округлять и использовать длину 0,96, но удобнее, ясен день, 1.

И коль скоро мы прибавили 0,04, то по 5 частичным интервалам у нас получается «перебор»: Что называется интервальным вариационным рядом распределения. Посему от самой малой варианты Что называется интервальным вариационным рядом распределенияотмеряем влево 0,1 влево (половину «перебора») и к значению 5,7 начинаем прибавлять по Что называется интервальным вариационным рядом распределения, получая тем самым частичные интервалы. При этом сразу рассчитываем их середины Что называется интервальным вариационным рядом распределения(например, Что называется интервальным вариационным рядом распределения) – они требуются почти во всех тематических задачах:
Что называется интервальным вариационным рядом распределения
– убеждаемся в том, что самая большая варианта Что называется интервальным вариационным рядом распределениявписалась в последний частичный интервал и отстоит от его правого конца на 0,1.

Далее подсчитываем частоты по каждому интервалу. Для этого в черновой «таблице» обводим значения, попавшие в тот или иной интервал, подсчитываем их количество и вычёркиваем:
Что называется интервальным вариационным рядом распределения
Так, значения из 1-го интервала я обвёл овалами (7 штук) и вычеркнул, значения из 2-го интервала – прямоугольниками (11 штук) и вычеркнул и так далее.

Правило: если варианта попадает на «стык» интервалов, то её следует относить в правый интервал. У нас такая варианта встретилась одна: Что называется интервальным вариационным рядом распределения– и её нужно причислить к интервалу Что называется интервальным вариационным рядом распределения.

В результате получаем интервальный вариационный ряд, при этом обязательно убеждаемся в том, что ничего не потеряно: Что называется интервальным вариационным рядом распределения, и, кроме того, рассчитываем относительные частоты Что называется интервальным вариационным рядом распределенияпо каждому интервалу, которые уместно округлить до двух знаков после запятой:
Что называется интервальным вариационным рядом распределения

Дело за чертежами. Для ИВР чаще всего требуется построить гистограмму.

Гистограмма относительных частот – это фигура, состоящая из прямоугольников, ширина которых равна длинам частичных интервалов, а высота – соответствующим относительным частотам:
Что называется интервальным вариационным рядом распределения
При этом вполне допустимо использовать нестандартную шкалу по оси абсцисс, в данном случае я начал нумерацию с четырёх.

Площадь гистограммы равна единице, и это статистический аналог функции плотности распределения непрерывной случайной величины. Построенный чертёж даёт наглядное и весьма точное представление о распределении цен на ботинки по всей генеральной совокупности. Но это при условии, что выборка представительна.

Вместе с гистограммой нередко требуют построить полигон. Без проблем, полигон относительных частот – это ломаная, соединяющая соседние точки Что называется интервальным вариационным рядом распределения, где Что называется интервальным вариационным рядом распределения– середины интервалов:
Что называется интервальным вариационным рядом распределения

Автоматизируем решение в Экселе:

Что называется интервальным вариационным рядом распределенияКак составить ИВР и представить его графически? (Ютуб)

И бонус – эмпирическая функция распределения. Она определяется точно так же, как в дискретном случае:

Что называется интервальным вариационным рядом распределения, где Что называется интервальным вариационным рядом распределения– количество вариант СТРОГО МЕНЬШИХ, чем «икс», который «пробегает» все значения от «минус» до «плюс» бесконечности.

Но вот построить её для интервального ряда намного проще. Находим накопленные относительные частоты:
Что называется интервальным вариационным рядом распределения

И строим кусочно-ломаную линию, с промежуточными точками Что называется интервальным вариационным рядом распределения, где Что называется интервальным вариационным рядом распределения– правые концы интервалов, а Что называется интервальным вариационным рядом распределения– относительная частота, которая успела накопиться на всех «пройденных» интервалах:
Что называется интервальным вариационным рядом распределения
При этом Что называется интервальным вариационным рядом распределенияесли Что называется интервальным вариационным рядом распределенияи Что называется интервальным вариационным рядом распределенияесли Что называется интервальным вариационным рядом распределения.

Напоминаю, что данная функция не убывает, принимает значения из промежутка Что называется интервальным вариационным рядом распределенияи, кроме того, для ИВР она ещё и непрерывна.

Эмпирическая функция распределения является аналогом функции распределения НСВ и приближает теоретическую функцию Что называется интервальным вариационным рядом распределения, которую теоретически, а иногда и практически можно построить по всей генеральной совокупности.

Помимо перечисленных графиков, вариационные ряды также можно представить с помощью кумуляты и огивы частот либо относительных частот, но в классическом учебном курсе эта дичь редкая, и поэтому о ней буквально пару абзацев:

Кумулята – это ломаная, соединяющая точки:

Что называется интервальным вариационным рядом распределения* либо Что называется интервальным вариационным рядом распределения– для дискретного вариационного ряда;
Что называется интервальным вариационным рядом распределениялибо Что называется интервальным вариационным рядом распределения– для интервального вариационного ряда.

* Что называется интервальным вариационным рядом распределения– накопленные «обычные» частоты

В последнем случае кумулята относительных частот Что называется интервальным вариационным рядом распределенияпредставляет собой «главный кусок» недавно построенной эмпирической функции распределения.

Огива – это обратная функция по отношению к кумуляте – здесь варианты откладываются по оси ординат, а накопленные частоты либо относительные частоты – по оси абсцисс.

С построением данных линий, думаю, проблем быть не должно, чего не скажешь о другой проблеме. Хорошо, если в вашей задаче всего лишь 20-30-50 вариант, но что делать, если их 100-200 и больше? В моей практике встречались десятки таких задач, и ручной подсчёт здесь уже не торт. Считаю нужным снять небольшое видео:

Что называется интервальным вариационным рядом распределенияКак быстро составить ИВР при большом объёме выборки? (Ютуб)

Ну, теперь вы монстры 8-го уровня 🙂

Но не всё так сурово. В большинстве задач вам предложат готовый вариационный ряд, и на счёт молока, то, конечно, была шутка:

Выборочная проверка партии чая, поступившего в торговую сеть, дала следующие результаты:
Что называется интервальным вариационным рядом распределения

Требуется построить гистограмму и полигон относительных частот, эмпирическую функцию распределения

Проверяем свои навыки работы в Экселе! (исходные числа и краткая инструкция прилагается) И на всякий случай краткое решение для сверки в конце урока.

Что ещё важного по теме? Время от времени встречаются ИВР с открытыми крайними интервалами, например:
Что называется интервальным вариационным рядом распределения

В таких случаях, что убийственно логично, интервалы «закрывают». Обычно поступают так: сначала смотрим на средние интервалы и выясняем длину частичного интервала: Что называется интервальным вариационным рядом распределениякм. И для дальнейшего решения можно считать, что крайние интервалы имеют такую же длину: от 140 до 160 и от 200 до 220 км. Тоже логично. Но уже не убийственно:)

Ну вот, пожалуй, и вся практически важная информация по ИВР.

На очереди числовые характеристики вариационных рядов и начнём мы с их центральных характеристик, а именно – Моды, медианы и средней.

Пример 7. Решение: заполним расчётную таблицу
Что называется интервальным вариационным рядом распределения

Построим гистограмму и полигон относительных частот:
Что называется интервальным вариационным рядом распределения

Построим эмпирическую функцию распределения:
Что называется интервальным вариационным рядом распределения

Автор: Емелин Александр

(Переход на главную страницу)

Что называется интервальным вариационным рядом распределения Zaochnik.com – профессиональная помощь студентам

cкидкa 15% на первый зaкaз, прoмoкoд: 5530-hihi5

Что называется интервальным вариационным рядом распределения Tutoronline.ru – онлайн репетиторы по математике и другим предметам

Источник

Интервальный вариационный ряд и его характеристики

п.1. Построение интервального вариационного ряда по данным эксперимента

Интервалы, \(\left.\left[a_,a_i\right.\right)\)\(\left.\left[a_<0>,a_1\right.\right)\)\(\left.\left[a_<1>,a_2\right.\right)\).\(\left.\left[a_,a_k\right.\right)\)
Частоты, \(f_i\)\(f_1\)\(f_2\).\(f_k\)

Скобка \(\lfloor\ \rfloor\) означает целую часть (округление вниз до целого числа).

Скобка \(\lceil\ \rceil\) означает округление вверх, в данном случае не обязательно до целого числа.

Заметим, что поскольку шаг h находится с округлением вверх, последний узел \(a_k\geq x_\).

\(\left.\left[a_,a_i\right.\right)\) cм\(\left.\left[142;150\right.\right)\)\(\left.\left[150;158\right.\right)\)\(\left.\left[158;166\right.\right)\)\(\left.\left[166;174\right.\right)\)\(\left.\left[174;182\right.\right)\)\(\left.\left[182;190\right.\right)\)\(\left[190;198\right]\)

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

i1234567
\(\left.\left[a_,a_i\right.\right)\) cм\(\left.\left[142;150\right.\right)\)\(\left.\left[150;158\right.\right)\)\(\left.\left[158;166\right.\right)\)\(\left.\left[166;174\right.\right)\)\(\left.\left[174;182\right.\right)\)\(\left.\left[182;190\right.\right)\)\(\left[190;198\right]\)
\(f_i\)4711343383

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

\(x_i\)146154162170178186194
\(w_i\)0,040,070,110,340,330,080,03
\(S_i\)0,040,110,220,560,890,971

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

\(x_i\)146154162170178186194
\(w_i\)0,040,070,110,340,330,080,031
\(x_iw_i\)5,8410,7817,8257,8058,7414,885,82171,68

$$ X_=\sum_^k x_iw_i=171,68\approx 171,7\ \text <(см)>$$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: \begin x_o=166,\ f_m=34,\ f_=11,\ f_=33,\ h=8\\ M_o=x_o+\frac><(f_m-f_)+(f_m+f_)>h=\\ =166+\frac<34-11><(34-11)+(34-33)>\cdot 8\approx 173,7\ \text <(см)>\end На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: \begin x_o=166,\ w_m=0,34,\ S_=0,22,\ h=8\\ \\ M_e=x_o+\frac<0,5-S_>h=166+\frac<0,5-0,22><0,34>\cdot 8\approx 172,6\ \text <(см)>\end \begin \\ X_=171,7;\ M_o=173,7;\ M_e=172,6\\ X_\lt M_e\lt M_o \end Ряд асимметричный с левосторонней асимметрией.
При этом \(\frac<|M_o-X_|><|M_e-X_|>=\frac<2,0><0,9>\approx 2,2\lt 3\), т.е. распределение умеренно асимметрично.

п.4. Выборочная дисперсия и СКО

Например:
Для распределения учеников по росту получаем:

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

п.6. Алгоритм исследования интервального вариационного ряда

На входе: все значения признака \(\left\,\ j=\overline<1,N>\)
Шаг 1. Построить интервальный ряд с интервалами \(\left.\right[a_,\ a_i\left.\right)\) и частотами \(f_i,\ i=\overline<1,k>\) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти \(x_i,w_i,S_i,x_iw_i,x_i^2w_i\)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

\(\left.\left[a_,a_i\right.\right)\) лет\(\left.\left[18;22\right.\right)\)\(\left.\left[22;26\right.\right)\)\(\left.\left[26;30\right.\right)\)\(\left.\left[30;34\right.\right)\)\(\left.\left[34;38\right.\right)\)

Считаем частоты для каждого интервала. Получаем интервальный ряд:

\(\left.\left[a_,a_i\right.\right)\) лет\(\left.\left[18;22\right.\right)\)\(\left.\left[22;26\right.\right)\)\(\left.\left[26;30\right.\right)\)\(\left.\left[30;34\right.\right)\)\(\left.\left[34;38\right.\right)\)
\(f_i\)171264

2) Составляем расчетную таблицу:

\(x_i\)2024283236
\(f_i\)17126430
\(w_i\)0,0330,2330,40,20,1331
\(S_i\)0,0330,2670,6670,8671
\(x_iw_i\)0,6675,611,26,44,828,67
\(x_i^2w_i\)13,333134,4313,6204,8172,8838,93

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *