Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле:
где х 0 нижняя граница интервала;
h – величина интервала;
f m частота интервала;
f m-1 частота предшествующего интервала;
f m+1 частота следующего интервала.
Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше.
Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности.
При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:
где х 0 нижняя граница интервала;
h – величина интервала;
f m частота интервала;
f – число членов ряда;
S m-1 – сумма накопленных членов ряда, предшествующих данному.
Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на четыре равные части, а децили – на десять равных частей. Квартилей насчитывается три, а децилей – девять.
Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака.
Контрольная работа: Мода. Медиана. Способы их расчета
Название: Мода. Медиана. Способы их расчета Раздел: Рефераты по экономике Тип: контрольная работа Добавлен 09:00:41 04 сентября 2010 Похожие работы Просмотров: 47810 Комментариев: 22 Оценило: 9 человек Средний балл: 4 Оценка: 4 Скачать
На тему: «Мода. Медиана. Способы их расчета»
Средние величины и связанные с ними показатели вариации играют в статистике очень большую роль, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.
Средняя является очень распространенным обобщающим показателям в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку. Средняя показывает уровень этого признака, отнесенный к единице совокупности.
Изучая общественные явления и стремясь выявить их характерные, типичные черты в конкретных условиях места и времени, статистики широко используют средние величины. С помощью средних можно сравнивать между собой различные совокупности по варьирующим признакам.
Средние, которые применяются в статистике, относятся к классу степенных средних. Из степенных средних наиболее часто применяется средняя арифметическая, реже – средняя гармоническая; средняя гармоническая применяется только при исчислении средних темпов динамики, а средняя квадратическая – только при исчислении показателей вариации.
Средняя арифметическая есть частное от деления суммы вариант на их число. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных ее единиц. Средняя арифметическая – наиболее распространенный вид средних, так как она соответствует природе общественных явлений, где объем варьирующих признаков в совокупности чаще всего образуется именно как сумма значений признака у отдельных единиц совокупности.
По своему определяющему свойству средняя гармоническая должна применяться тогда, когда общий объем признака образуется как сумма обратных значений вариант. Ее применяют тогда, когда в зависимости от имеющего материала веса приходиться не умножать, а делить на варианты или, что то же самое, умножать на обратное их значение. Средняя гармоническая в этих случаях – это величина обратная средней арифметической из обратных значений признака.
К средней гармонической следует прибегать в тех случаях, когда в качестве весов применяются не единицы совокупности – носители признака, а произведения этих единиц на значение признака.
1.Определение моды и медианы в статистике
Средние арифметическая и гармоническая являются обобщающими характеристиками совокупности по тому или иному варьирующему признаку. Вспомогательными описательными характеристиками распределения варьирующего признака являются мода и медиана.
Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.
Медианной в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.
Мода и медиана в отличии от степенных средних являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.
Мода применяется в тех случаях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака. Если надо, например, узнать наиболее распространенный размер заработной платы на предприятии, цену на рынке, по которой было продано наибольшее количество товаров, размер ботинок, пользующийся наибольшим спросом у потребителей, и т.д., в этих случаях прибегают к моде.
Медиана интересна тем, что показывает количественную границу значение варьирующего признака, которую достигла половина членов совокупности. Пусть средняя заработная плата работников банка составила 650000 руб. в месяц. Эта характеристика может быть дополнена, если мы скажем, что половина работников получила заработную плату 700000 руб. и выше, т.е. приведем медиану. Мода и медиана являются типичными характеристиками в тех случаях, когда взяты совокупности однородные и большой численности.
2.Нахождение моды и медианы в дискретном вариационном ряду
Найти моду и медиану в вариационном ряду, где значения признака заданы определенными числами, не представляет большой трудности. Рассмотрим таблицу 1. с распределение семей по числу детей.
Мода и медиана наиболее часто используемые в экономической практике структурные средние.
Мода – это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.
В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.
Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:
где хо – начальная (нижняя) граница модального интервала;
Медианой называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.
В дискретном ряду медиана находится непосредственно по накопленной частоте, соответствующей номеру медианы.
В случае интервального вариационного ряда медиану определяют по формуле:
(8.17 – формула Медианы)
где хо – нижняя граница медианного интервала;
NМе – порядковый номер медианы (Σf/2);
SMe-1 – накопленная частота до медианного интервала;
fМе – частота медианного интервала.
Пример вычисления Моды.
Рассчитаем моду и медиану по данным табл. 8.4.
Таблица 8.4 – Распределение семей города N по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)
Группы семей по размеру дохода, руб.
Число
До 5000
600
600
6
5000-6000
700
1300
(600+700)
13
6000-7000
1700 (fМо-1)
3000 (SMe-1 )
(хо)
2500
(fМе)
5500 (SMe)
55
8000-9000
2200 (fМо+1)
7700
77
9000-10000
1500
9200
92
Свыше 10000
800
10000
100
Итого
10000
–
–
Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):
1) сначала находим порядковый номер медианы: NМе= Σfi/2= 5000.
2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее значение медианы определим по формуле (8.17):
Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.
Если М оо следует сделать вывод о левосторонней асимметрии ряда.
Начиная с XVIII века, в общем направлении статистических исследований начинает активно формироваться математическая статистика.
Математическая статистика – раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений.
В зависимости от предмета исследований математическая статистика делится на:
В зависимости от цели и методов исследований математическая статистика делится на: описательную статистику; теорию оценивания; теорию проверки гипотез.
Описательная статистика
Теория оценивания
Теория проверки гипотез
Цель
Обработка и систематизация эмпирических данных
Оценивание ненаблюдаемых данных и сигналов от объектов наблюдения на основе наблюдаемых данных
Обоснование предположений о виде распределения и свойствах случайной величины
Методы
1. Наглядное представление в форме графиков и таблиц.
2. Количественное описание с помощью статистических показателей.
1. Параметрические методы (наименьших квадратов, максимального правдоподобия и др.).
2. Непараметрические методы.
1. Последовательный анализ.
2. Статистические критерии.
Метод выборочных исследований
Статистика получила признание в различных областях человеческой деятельности благодаря заметной экономии времени и прочих ресурсов. Её основная идея: не нужно измерять всё, измерьте только часть всего и сделайте предположение об остальном.
«Всё» в статистике называется генеральной совокупностью.
«Часть всего», которую мы тщательно исследуем, называется выборкой.
Метод выборочных исследований – способ определения свойств группы объектов ( генеральной совокупности ) на основании статистического исследования её части ( выборки ).
Например, чтобы оценить средние размеры апельсина, который продаётся в магазине в декабре, необязательно денно и нощно мерить все апельсины во всех ящиках (сколько же для этого нужно времени и людей?!). Достаточно сделать выборку – мерить по одному апельсину из каждого ящика в течение месяца (тут уже и один человек справится).
Статистика предоставляет методику и оценки для того, чтобы правильно провести выборку и на основании знаний о среднем размере апельсина в выборке (выборочной средней) судить о средних размерах всех декабрьских апельсин (генеральной средней).
Средняя арифметическая, простая и взвешенная
Статистическое исследование опирается на собранные данные о каком-то признаке (рост, вес, возраст, доход и т.п.).
Варианта – полученное эмпирическое значение признака.
Вариационный ряд – совокупность собранных вариант.
Пусть мы сделали выборку, провели N измерений и получили x_1,x_2,…,x_N вариант.
Чтобы найти выборочную среднюю дискретного вариационного ряда, нужно вычислить среднюю арифметическую простую :
На протяжении четверти школьник получил такие оценки по алгебре: 5,4,3,5,4,4,5,4,3,5,5,4,3,5,4,4. Найдите среднюю оценку за четверть.
Считаем среднюю арифметическую простую:
Нетрудно заметить, что оценки повторяются, и вычисления можно упростить, если вместо сложения одинаковых оценок использовать умножение оценок на их количество.
Чтобы найти выборочную среднюю при повторяющихся вариантах, удобно вычислять среднюю арифметическую взвешенную:
Рассматриваем тот же ряд оценок: 5,4,3,5,4,4,5,4,3,5,5,4,3,5,4,4 и составляем таблицу:
Модой называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.
Медиана – это варианта, расположенная в середине упорядоченного вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.
Мода используется для характеристики наиболее часто встречающегося признака в совокупности (наиболее распространенная должность в организации, наиболее распространенный размер обуви и т.д.) Иными словами мода характеризует типичность явления.
Медиана показывает количественную границу значения варьирующего признака, которую достигла половина членов совокупности. Например, средняя заработная плата наемных работников в целом по экономике Казахстана составляла 49754 тенге, в тоже время половина работающих получали заработную плату не более 43505 тенге, т.е у половины занятых наемным трудом заработная плата была меньше средней не менее чем в полтора раза!
Два ряда распределения могут иметь заметно различающиеся средние величины некоторого признака и в то же время одинаковое медианное значение. Отсюда, медиана, как и мода, также характеризует типичность признака.
Нахождение моды и медианы в дискретном вариационном ряду.
Рассмотрим распределение семей в некотором населенном пункте по количеству детей
Группа семей по числу детей
Число семей
Итого
Модой в этом примере будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей.
Если распределение равномерное, где все варианты встречаются одинаково част, то говорят, что ряд не имеет моды, или, иначе, что все варианты одинаково модальны.
Могут быть случаи, когда две варианты встречаются одинаково часто. Тогда говорят, что распределение бимодально. Для нахождения медианы необходимо сумму частот разделить пополам и к полученному результату прибавить 0,5. В нашем случае это будет 101 варианта (201/2+ 0,5). Данная варианта находится в группе семей с двумя детьми, т.е. медианой будет семья, имеющая двух детей.
Если в ряду имеется четное количество частот (например, 200), то номер медианной варианты будет дробным (для 200 будет 200,5). В этом случае медиана находится между 100 и 101 вариантами, а ее значение будет равно средней из значений этих двух вариант.
Расчет моды в интервальном вариационном ряду. В моде и медиане не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте. Если имеются все значения признака, то не требуется проводить расчеты для определения моды и медианы. Однако в интервальном вариационном ряду для нахождения приближенного значения моды и медианы в пределах определенного интервала прибегают к расчетам.
Ряд распределения рабочих по заработной плате
Группа рабочих по зарплате, тенге
Число рабочих
36000-38000
38000-40000
40000-42000
42000-44000
44000-46000
46000-48000
Итого
Модальным интервалом здесь является интервал, где варианта лежит в пределах от 44-до 46 тыс. тенге, поскольку наибольшее количество рабочих имеют заработную плату именно в этих пределах. Для расчета определенного значения модальной величины признака, заключенного в этом интервале, применяют такую формулу:
Минимальная граница модального интервала (в примере 44000);
Смысл формулы заключается в том, что величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 34000 прибавляем 650, т.е. меньше половины интервала (2000), потому что частота предшествующего интервала (115) больше частоты последующего интервала(45).
Расчет медианы в интервальном вариационном ряду. Для исчисления медианы сначала необходимо определить интервал, в котором она находится (медианный интервал). Это интервал, кумулятивная частота которого будет превышать половину суммы частот. Половина частот в нашем случае равна 250(500/2). Суммируя последовательно частоты в ряду, мы превысим середину суммы частот на четвертом интервале (10+ 50+100+115= 275), т.е. медианным у нас будет интервал 32000-34000 тенге. До этого интервала сумма частот составила 160. Для получения медианы необходимо прибавить еще 90 единиц (250-160).
При определении медианы предполагают, что значение единиц в границах распределяется равномерно. Следовательно, если 115 единиц, находящихся в этом интервале, распределяется равномерно в интервале, равном 2000, то 90 единицам будет соответствовать следующая его величина:
Прибавив полученную величину к минимальной границе медианного интервала, получим искомое значение медианы:
Ме= 32000+1560= 33560 тенге.
Формула для исчисления медианы для интервального вариационного ряда будет иметь вид: Ме= ХМе +IМе *(∑f/2-S Ме-1) / fМе
Где ХМе— начальное значение медианного интервала;
IМе— величина медианного интервала;
(∑f – сумма частот ряда(численность ряда);
S Ме-1 – сумма накопленных частот в интервалах, предшествующих медианному;
fМе— частота медианного интервала.
Рассчитаем медиану для нашего случая:
Ме= 32000+2000- (500/2_ 160)/115= 33560 тенге.
Таким образом, для нашего примера средняя арифметическая равна 33160, мода – 34650, медиана – 33560 тенге. Соотношение этих трех величин указывает направление и степень ассиметрии распределения.
Квартили и децили. Дополнительно к медиане для характеристики структуры вариационного ряда исчисляют квартили, делящие ряд по сумме частот на четыре равные части, и децили, которые делят ряд по сумме частот на 4 равные части, и децили, которые делят ряд по сумме на 10 равных частей.
Второй квартиль равен медиане, а первый и третий исчисляются аналогично расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая ¼ численности частот, а для третьего квартиля – варианта, отсекающая ¾ численности частот. Рассчитаем для нашего примера первый и третий квартили:
Следовательно, заработная плата каждого четвертого рабочего превышает 35110 тенге (или у трех четвертей рабочих она не превышает 35110 тенге).
Основные правила применения средних в статистике.
Общие требования. Средние должны относится к явлениям одного и того же вида и базироваться на массовом обобщении фактов. Только тогда они отражают сущность явления и на их значение не оказывают влияние случайные факторы. Это требование в статистике связывает средние с законом больших чисел.
Второе требование к средним в статистике заключается в качественной однородности совокупности. Из этого следует, что нельзя применять средние к такой совокупности, отдельные части которой подчинены различным закона развития в отношении осредняемого признака. Качественно однородные совокупности выделяются с помощью метода группировки.
Общие и групповые средние. Даже в пределах однородной совокупности количественные различия могут носить не случайный, а систематический характер. Поэтому наряду с общей средней всей совокупности вычисляются групповые средние. Например, динамика урожайности сельскохозяйственной культуры может показывать тенденцию ее снижения. Однако она может быть обусловлена различиями почвенно-климатических и других условий в разных регионах. Группируя районы страны по этим признакам, можно обнаружить, что динамика средней урожайности в отдельных районах либо не изменяется, либо возрастает, а уменьшение общей средней в целом по стране обусловлено ростом удельного веса районов с более низкой урожайностью в общем объеме производства этой сельскохозяйственной культуры. То есть динамика групповых средних более полно отразила закономерность изменения урожайности, а динамика общей средней показывает лишь ее общий результат.
Средние величины и ряды распределения. Метод средних, дополненный рядами распределения, становится значительно богаче для анализа закономерностей. Средние в статистике следует применять на основе и в органическом единстве с методом группировок. Метод группировок позволяет отграничить качественно однородные совокупности для применения средних характеристик, дополнить общую среднюю групповыми средними, дополнить средние характеристики рядами распределения. Часто за общими, сравнительно благополучными средними скрываются показатели плохой работы на отдельных предприятиях, тяжелой ситуации в отдельных социально-демографических группах населения. Не видны и положительные результаты. Поэтому общие средние дополняются групповыми средними, а групповые средние дополняются минимальными и максимальными показателями в группах. То есть должны изучаться и индивидуальные величины. Отсутствие каких-либо качественных ограничений в расчете средних приводит к тому, что они нередко исчисляются в отрыве от сущности явлений. Так, в среднем доходы населения могут расти. В то же время может расти неравенство в их распределении, а число бедных, имеющих доходы ниже прожиточного минимума, не уменьшатся.
Средние в статистике следует применять на основе и в органическом единстве с методом группировок. Метод группировок позволяет отграничить качественно однородные совокупности для использования средних характеристик. Группировки позволяют избежать применения фиктивных средних и сделать более глубокий анализ с помощью групповых средних.