Что означает термин вторичная группировка
Понятие и причины проведения вторичной группировки. Методы вторичной группировки статистических данных.
Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.
Вторичная группировка, или перегруппировка сгруппированных данных, применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок в целях проведения сравнительного анализа.
Вторичная группировка — это операция по образованию новых групп на основе ранее осуществленной группировки.
Понятие, общая схема построения, подлежащее и сказуемое статистической таблицы.
В виде статистических таблиц оформляются результаты сводки и группировки материалов наблюдения.
Статистическая таблица – это особый способ краткой и наглядной записи сведений об изучаемых общественных явлениях. Статистическая таблица позволяет охватить материалы статистической сводки в целом.
По внешнему виду статистическая таблица представляет собой ряд пересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали – графы (столбцы, колонки), которые в совокупности составляют как бы скелет таблицы.
В образовавшиеся внутри таблицы клетки записывается информация. Составленную таблицу принято называть макетом таблицы.
Статистическая таблица имеет свое подлежащее и сказуемое.
Подлежащее таблицы показывает, о каком явлении идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей.
Сказуемым таблицы называются числовые показатели, с помощью которых характеризуется объект, т. е. подлежащее таблицы.
Показатели, образующие подлежащее, располагают в левой части таблицы, а показатели, составляющие сказуемое, помещают справа.
Составленная и оформленная статистическая таблица должна иметь общий, боковые и верхние заголовки.
Одними из ответственных моментов построения статистических таблиц являются разработка сказуемого, определение его содержания, правильное установление связи между группировочными признаками и показателями, их характеризующими.
Сказуемое статистических таблиц бывает простым и сложным. При простой разработке показатели сказуемого располагаются последовательно один за другим. Распределяя показатели на группы по одному или нескольким признакам в определенном сочетании, получают сложное сказуемое.
Вторичные группировки
К вторичной группировке прибегают:
ÿ если результаты первичной группировки не удовлетворили исслед-ля
ÿ при появлении новых задач исследования
Она производится путем сведения статистических данных в новые группы по тому же признаку, что и первичная. При этом исходная статистическая информация не используется.
При проведении вторичной группировки производится либо дробление интервалов на более мелкие, либо их укрупнение. Осуществляя вторичную группировку, исходят из предположения о равном распределении признака внутри интервала.
Пример: Распределение населения РФ по размерам среднедушевого денежного дохода в 1996 г.
Для проведения группировки нам необходимо определить новые группы и построить таблицу.
Комбинированные группировки
Комбинированная группировка предполагает расчленение статистической совокупности по 2 и более признакам, взятым в сочетании. При этом сперва образуются группы по первому признаку, затем внутри выделяются подгруппы.
Комбинированная группировка обладает большими аналитическими возможностями, однако следует учитывать, что проведение группировки по большому числу признаков может привести к недостаточной численности единиц в группах. Поэтому к комбинированной группировке прибегают при достаточно большом объеме совокупности. Выбор группировочных признаков диктуется целью группировки.
Вторичная группировка данных
Группировки, которые выполняются на основе первичного статистического материала (впервые) — первичные. Вторичная группировка — образование новых групп на основе ранее осуществленной группировки. Получение новых групп на основе имеющихся возможно двумя способами: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности). Вторичные группировки используют, когда имеющиеся группировки не удовлетворяют требованиям анализа — несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. К этому методу прибегают также в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.
В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примерах.
Пример 1.Произвести укрупнение интервалов на основе данных таблицы 1:
Группы магазинов по размеру товарооборота за IV квартал, тыс.руб. | Число магазинов | Товарооборот за IV квартал, тыс.руб. |
До 10 | ||
10 — 15 | ||
15 — 20 | ||
20 — 30 | ||
30 — 50 | ||
50 — 60 | ||
60 — 70 | ||
70 — 100 | ||
100 — 200 | ||
Свыше 200 | ||
Итого |
Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.
Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2).
Группы магазинов по размеру товарооборота за IV квартал, тыс.руб. | Число магазинов | Товарооборот за IV квартал, тыс.руб. | Товарооборот в среднем на 1 магазин, тыс.руб. |
До 10 | 6,2 | ||
10 — 20 | 14,8 | ||
20 — 50 | 37,1 | ||
50 — 100 | 64,8 | ||
100 — 200 | 109,0 | ||
Свыше 200 | 312,0 | ||
Итого | 81,6 |
Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.
Пример 2.Имеются следующие данные о распределении колхозов по числу дворов (табл. 3).
Эти данные не позволяют провести сравнение распределения колхозов в 2-х районах по числу дворов, так как в этих районах имеется различное число групп колхозов. Необходимо ряды распределения привести к сопоставимому виду.
За основу сравнения необходимо взять распределение колхозов 1 района. Следовательно, по второму району надо произвести вторичную группировку, чтобы образовать такое же число групп и с теми же интервалами, как и в первом районе. Получим следующие данные (табл. 4).
Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно примем, что это число колхозов должно быть пропорционально удельному весу отобранных дворов в группе.
Определяем удельный вес 50 дворов в пятой группе.
Определяем удельный вес 50 дворов в шестой группе.
Вторичная группировка. Формула Стерджесса
Группировочная таблица и виды группировок
Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию доступно для восприятия.
Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.
Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.
Пример 5.2. Основа группировочной таблицы
Название таблицы (общий заголовок)
Содержание строк | Наименование граф (верхние заголовки) |
А | |
Наименование строк (боковые заголовки) | |
Итоговая строка | Итоговая графа |
Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.
Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т.е. подлежащее. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки.
Пример 5.3. Пример группировочной таблицы
Отношение студентов факультета ГиСЭО к понижению размера стипендии (по результатам исследования в январе 1999 г.)
Группы студентов | Поддерживаю | Не поддерживаю | Безразлично |
Студенты 1-го курса | |||
Студенты 2-го курса | |||
Студенты 3-го курса | |||
Студенты 4-го курса | — | — | |
Студенты 5-го курса | — | — | |
Итого |
Таким образом, группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.
Группировки различают по:
— задачам систематизации данных;
— числу группировочных признаков;
Статистической группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы явлений, исследовать структуру совокупности или проанализировать взаимосвязи и зависимости между признаками. Группировки являются важнейшим инструментом формирования обобщающих статистических показателей. Группировка — важнейший компонент статистической сводки. В следующих главах мы увидим, что группировка играет весьма важную роль в формировании статистического ряда распределения, а правильное ее использование очень существенно для исчисления взвешенных средних.
По числу группировочных признаков (способу построения) различают простые (по одному признаку) и сложные (по нескольким признакам — комбинационные и многомерные) группировки.
Комбинационные группировки строятся путем разбиения каждой группы на подгруппы в соответствии с дополнительными признаками. При построении комбинационных группировок сначала разделяют по атрибутивным признакам, а уже затем разбивают полученные группы на подгруппы по количественному признаку.
Многомерные группировки строятся с помощью специальных алгоритмов, когда ищутся скопления в N-мерном пространстве, где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек. Для решения таких сложных задач построения многомерной группировки успешно применяются методы прикладного искусственного интеллекта — методы распознавания образов. Также используется метод последовательного статистического анализа Вальда.
По задачам систематизации данных различают: типологические, структурные и аналитические.
Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.
Структурные группировки — это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.
Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.
По используемой информации различают первичные и вторичные группировки.
Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.
Вторичные группировки — результат объединения или расщепления первичных группировок, они позволяют преодолевать несопоставимость исходных данных в первичных группировках и тем самым объединять их в одну общую и выполнять сравнение, сопоставление данных, представленных в них после проведения вторичной группировки.
При разработке первичной группировки существенное значение имеет выбор числа групп. Число групп зависит от типа признака, положенного в основу группировки (основания группировки), от объема совокупности, степени вариации признака.
При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможно два подхода: группировка с равными и неравными интервалами.
Для определения этих параметров в первом случае рекомендуется формула Стерджесса:
где N — количество наблюдений.
В этом случае величина интервала:
Основные этапы построения статистических группировок включают:
— выбор группировочного признака;
— определение необходимого числа групп, на которые следует разбить изучаемую совокупность;
— установление границ интервалов группировки;
— установление для каждой группировки показателей или их системы, которыми должны характеризоваться выделенные группы.
Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует, по мере возможности, избегать таких группировок.
Вопросы для самопроверки:
— Что представляет собой группировка данных?
— Какие вы знаете виды группировок?
— В чем особенности каждого вида группировки?
— Какова связь между группировкой, таблицей и сводкой?
— В чем особенность сложных многомерных группировок?
Вторичная группировка.
На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.
Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.
Во вторичной группировке применяются два способа образования новых групп:
Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.
Тема 3.2. Ряды распределения в статистике.
1. Ряды распределения.
2. Ряды распределения и их построение.
Ряды распределения.
Атрибутивными— называются ряды распределения, построенные покачественному признаку. Атрибутивные ряды характеризуют составсовокупности по тем или иным существенным признакам взятые за несколькопериодов.
Вариационными рядами-называются ряды распределения построенные поколичественному признаку.
Любой вариационный ряд состоит из двух элементов, вариантов и частот.
В зависимости от характера вариации признака различают дискретные иинтервальные ряды. В случае дискретной вариации величина количественного признака принимает только целые значения.
Следовательно, дискретные вариации характерны распределения единиц совокупности по дискретному признаку.
В случае непрерывной вариации величина признака у единиц совокупностиможет принимать в определенных пределах любые значения, отличающиесядруг от друга на малую величину. Построение интервального вариационногоряда целесообразно строить при непрерывных вариациях или, когда числовариантов велико.
Ряды распределения и их построение.
После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.
Ряд распределния является одним из видов группировок.
Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:
Тема. Графическое изображение рядов распределения.
1. Графическое изображение рядов распределения.