Что называется статистической группировкой и группировочными признаками
Статистические группировки, их виды. Группировочные признаки.
Метод: выделяется группировочный признак (основание группировки), потом группировочный интервал(совокупность варьирующих значений признака в группе, границы). Ширина интервала— разница между min и max значениями.
Правило группировки – различия между единицами, отнесенными к разным группам должны быть больше различий у единиц, отнесенных к одной группе.
Виды группировок:
1. Простая (одномерная): если однородные группы формируются по одному признаку.
· Структурная: изучение состава однородной совокупности по варьирующему признаку, позволяет выделить части объекта и соотношение между ними, или удельный вес каждой части (исп-ся для изучения внутреннего строения стат совокупности и характеристики структурных сдвигов)
· Аналитические: исп-ся для выявления связи между изучаемыми признаками.
2. Сложная (многомерная): группы образуются по 2-м и более признакам:
· Комбинационные: выполняются по нескольким признакам последовательно (от 2 до 4 признаков): каждая группа, выделенная по одному признаку, разбивается на подгруппы по второму, а последние – по третьему признаку и.т.д.
· Многомерные: группы образуются по нескольким признакам одновременно.
Классификация – разновидность типологической группировки, предполагающая группировку по относительно однообразным и устойчивым признакам, например, классификатор форм собственности или видов экономической деятельности. Принятые Классификаторы являются международными и национальными стандартами.
Группировочный признак – основание группировки, на базе значений которого (рых) происходит разбиение совокупности на однородные группы.
Виды группировочного признака:
1) атрибутивные (признак, характеризующий свойство, качество данного явления без количественного выражения)
2) количественные (признак, характеризующий размеры, величину изучаемой совокупности и дающий возможность разделить ее на группы по величине индивидуальных значений группировочного признака)
3) признаки пространства
4) признаки времени.
Правила группировочных признаков:
1. В качестве основания группировки должен выступать типичный существенный признак в соответствии с целями группировки;
2. При выборе признаков необходимо учитывать время и место наблюдения;
3. При изучении сложных общественных явлений рекомендуется производить группировки не по одному, а по нескольким признакам. (Хотя это и не всегда удаётся.)
Если в основе группировки лежат несколько признаков, группировка называется сложная или комплексная группировка.
4. Необходимо обращать внимание на интервалы обследования;
5. Необходимо установить минимальное и максимальное значение признака.
Правила группировок:
1. Базовый признак группировки должен быть чётко определён;
2. Нужно выбрать необходимый минимум группировок, в зависимости от целей исследования;
3. Социально-экономические системы целесообразно описывать через системы сложных группировок.
Задачи группировок:
а) Выделение качественно однородных групп. Обычно разрабатываются к.-то однотипные группировки (например, классификатор товаров и
б) Определение структуры совокупности и структурных сдвигов;
в) Распределение единиц однородной совокупности по величине варьирующего признака.
Статистика. Шпаргалка
Шпаргалка подготовлена в соответствии с программой учебного курса «Экономическая статистика». В пособии кратко изложены ответы на вопросы по данной дисциплине, достаточные для ответа на экзамене или зачете. Пособие поможет в короткие сроки повторить ранее изученный материал, а также эффективно подготовиться к сдаче экзамена или зачета по данному предмету. Издание предназначено студентам экономических специальностей.
Оглавление
Приведённый ознакомительный фрагмент книги Статистика. Шпаргалка предоставлен нашим книжным партнёром — компанией ЛитРес.
8. Статистические группировки
Статистическая группировка — метод исследования массовых общественных явлений путем выделения и ограничения однородных групп, через которые раскрываются существенные черты и особенности состояния и развития всей совокупности.
Группировка является важнейшим этапом статистического исследования, соединяющим сбор первичной информации об объекте исследования и анализ этой информации на основе обобщающих статистических показателей.
Основные задачи, которые решаются с помощью группировок:
1) выделение социально-экономических типов;
2) изучение структуры социально-экономических явлений;
3) выявление связи между явлениями.
При проектировании группировок возникают следующие важнейшие проблемы:
1) определение группировочного признака (основания группировки). Группировочный признак — признак, по которому происходит включение единиц в группы. Его выбор зависит от цели группировки и сущности данного явления;
2) выделение числа групп. Число групп определяется с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц;
3) определение интервалов групп. Интервалы могут быть равными и неравными. Последние, в свою очередь, делятся на равномерно возрастающие и равномерно убывающие.
В зависимости от круга решаемых задач выделяют следующие виды группировок:
1) типологические группировки. Их задача — классификация социально-экономических явлений путем выделения однородных в качественном отношении групп;
2) структурные группировки. Их задача — изучение состава отдельных типических групп при помощи объединения единиц совокупности, близких друг к другу по величине группировочного признака;
3) аналитические группировки. Их задача — выявление связи между социально-экономическими явлениями путем оценки влияния одних признаков на другие. В основе аналитической группировки лежит признак-фактор, влияние которого на результативные признаки изучается.
Группировка, в которой группы образованы по одному признаку, называется простой. Если для характеристики явления недостаточно разбить совокупность на группы по какому-либо однородному признаку, строят сложные группировки.
Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Такие группировки дают возможность изучить структуру совокупности по нескольким признакам одновременно.
Социально-экономический анализ предполагает использование системы простых и комбинационных группировок.
Также часто прибегают к вторичной группировке-перегруппировке уже сгруппированных данных. Вторичная группировка может быть проведена методом простого укрупнения интервала.
Лекция 5 Статистическая сводка и группировка
Статистическая сводка и группировка. В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.
Обобщение и систематизация первичных статистических данных – это самостоятельный этап статистического исследования, основная задача которого получить полную и всестороннюю характеристику как совокупности в целом, так и отдельных ее частей и представить полученную информацию об изучаемой совокупности в наиболее удобной для пользователей форме. В статистической практике данный этап статистического исследования называют этапом сводки и группировки статистических данных.
Статистическая сводка
Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
По глубине и точности обработки материала различают простую сводку и сложную сводку.
Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.
Сложная сводка – это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.
Этапы проведение сводки
Статистическая группировка
Группировка – разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализировать связи между отдельными признаками.
Задачи, решаемые с помощью метода группировок:
Виды группировок. В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.
Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.
Структурная группировка – предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.
Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими.
. В статистике при изучении связей социально-экономических явлений признаки подразделяют на факторные и результативные.
Особенности построения аналитической группировки:
По способу построения группировки бывают простые и комбинационные.
Простая группировка – группы образованы только по одному признаку.
Комбинационная группировка – разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).
Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.
При построении комбинационной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.
Этапы построения статистических группировок
При небольшом объеме совокупности (n
Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса (формула 5.2): (5.2)
где n – число групп; N – число единиц совокупности.
Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.
Применение данной формулы дает хорошие результаты в том случае, если совокупность состоит из большого числа единиц наблюдения (n>50).
Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокупность делится, собственно, на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.
Когда определено число групп, то следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки бывают: равные и неравные; открытые и закрытые.
Ширина равного интервала определяется по (формуле 5.3):
(5.3)
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.
Полученную по формуле (5.3) величину округляют и она будет являться шириной интервала.
Существуют следующие правила определения ширины интервала.
Если величина интервала, рассчитанная по формуле (5.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.
Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлит до целого числа (15).
В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.
Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.
Также неравные интервалы могут быть прогрессивно-возрастающие или прогрессивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:hi+1=hi+а,
а – константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих – знак «-».
q — константа: для прогрессивно-возрастающих – больше «1»; для прогрессивно-убывающих ‑ меньше «1».
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.
Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500–1000, 1000–2000, 2000–3500, т.е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.
Интервалы статистической группировки
Интервалы группировок могут быть закрытыми и открытыми.
Закрытые интервалы – это интервалы, у которых есть и верхняя и нижняя границы.
Открытые интервалы – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.
Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50–100, 100–150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.
Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200–1400, 1400–1600, 1600–1800, 1800–2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. ‑ соответственно второго и третьего и т.д., т.е. верхняя граница i-го интервала равна нижней границе (i+1)-го интервала.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.
Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400–1600, 1600–1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу.
Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.
Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100–150, 151–200, 201–300.
Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.
Специализированные интервалы – применяются дли выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.
Пример. Далее на примере данных приведенных в табл. 5.1. произведем аналитическую группировку совокупности, включающей 30 банков.
Таблица 5.1 ‑ Совокупность 30 банков Российской Федерации
(на 01.01.19 г., цифры условные)
Номер банка | Капитал, млн. руб. | Активы, млн. руб. | |
1 | 2 | 3 | 4 |
1 | 207,7 | 2,48 | 1,14 |
2 | 200,3 | 2,40 | 1,10 |
3 | 190,2 | 2,28 | 1,05 |
4 | 323,2 | 3,88 | 1,88 |
5 | 247,1 | 2,96 | 1,36 |
6 | 177,7 | 2,12 | 0,97 |
7 | 242,5 | 2,90 | 1,33 |
8 | 182,9 | 2,18 | 0,99 |
9 | 315,6 | 3,78 | 1,73 |
10 | 183,2 | 2,20 | 1,01 |
11 | 320,2 | 3,84 | 1,76 |
12 | 207,3 | 2,48 | 1,14 |
13 | 181,0 | 2,17 | 0,99 |
14 | 172,4 | 2,06 | 0,94 |
15 | 234,3 | 2,81 | 1,29 |
16 | 189,5 | 2,27 | 1,04 |
17 | 187,8 | 2,24 | 1,03 |
18 | 166,9 | 1,99 | 0,91 |
19 | 157,7 | 1,88 | 0,86 |
20 | 168,3 | 2,02 | 0,93 |
21 | 224,4 | 2,69 | 1,23 |
22 | 166,5 | 1,99 | 0,91 |
23 | 198,5 | 2,38 | 1,09 |
24 | 240,4 | 2,88 | 1,32 |
25 | 229,3 | 2,75 | 1,26 |
26 | 175,2 | 2,10 | 0,96 |
27 | 156,0 | 1,87 | 0,86 |
28 | 160,1 | 1,92 | 0,88 |
29 | 178,7 | 2,14 | 0,98 |
30 | 171,6 | 2,05 | 0,94 |
По данным табл.5.1 группировочным (факторным) признаком является капитал, результативным – прибыль. Группировку производим по факторному признаку. Зададим количество групп (условно) – 4, а величину интервала определим по формуле (5.3).
Обозначим границы групп:
1-я группа – 156,0-197,8;
2-я группа – 197,8-239,6;
3-я группа – 239,6-281,4;
4-я группа – 281,4-323,2.
После того, как определен группировочный признак – капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе.
Далее показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
Таблица 5.2 ‑ Группировка коммерческих банков по величине капитала