Описание исходных (вторичных) данных
Страница 1

Задачи эссе предполагают использование данных уровня домохозяйства для построения моделей. Такие данные собираются Госкомстатом России в рамках выборочных обследований, а также в рамках специальных проектов (например, «Российский мониторинг экономики и здоровья», RLMS). Данное исследование будет построено на данных выборочного опроса RLMS. Выборка репрезентирует население России.

Объем выборки 4711 домохозяйств. Данные собирались по формализованной анкете (опроснику). Данные содержат богатую базу для различного моделирования.

База данных, которая будет использоваться для моделирования, содержит много переменных. Наиболее интересующими для нас являются переменные, которые позволяют выявить наличие тех или иных ТДП, такие как наличие ПК, стиральной машины и т.д., а также переменные, которые могут влиять/определять наличие ТДП у домохозяйств. Доходы, количество человек в семье, число источников домохозяйства и проч.

Не все переменные будут представлены в анализе так, как они представлены в исходной базе данных. Дело в том, что некоторые переменные нуждаются в преобразовании, а некоторые – в вычислении заново. Так, например, данные о месте проживания домохозяйства я преобразовала в двоичную переменную город=1/село=0, тогда как исходная переменная содержала 4 градации (в части анализа это показано). Это выгодно, т.к. мне требовалось включить эту переменную в регрессионную модель, а это допускается лишь для количественных, или для двоичных переменных. А число источников доходов я вообще считала по нескольким переменным, где респонденту предлагался целый спектр источников доходов и предлагалось согласиться или не согласиться что очередной источник доходов используется семьей респондента.

Всего в вычислениях задействовано более 30 переменных. Это отражено в синтаксисе (см. приложение).

Пример самой базы данных представлен в следующей таблице:

Пример базы данных

Имя

перем. Номер семьи

iid_h

Ic9.1a

Ic9.1b

indexTDP1

1

10101

1

8

0,51

2

10102

1

20

0,72

3

10103

1

24

0,54

4

10105

2

0

5

10107

1

6

1,11

6

10112

99

0

Это фрагмент данный в том формате, который отображается в SPSS. По горизонтали – семьи, по вертикали – переменные (показатели). Например, переменная iid_h – код семьи в 13-й волне (2004 год), ic9.1a – показатель того, есть ли в домохозяйстве холодильник (код 1) , или нет (код 2), ic9.1b – содержит возраст холодильника, indexTDP1 – это уже рассчитанный мной индекс обеспеченности ТДП. Например, из тех семей, что есть в данном фрагменте, наиболее обеспеченной, вероятно, является семья №5.

Страницы: 1 2


Похожие статьи:

Рекомендации к выработке системы организации и построения социальных ролей в коллективе
Условное принятие социальных ролей - это основа ролевой игры. Несмотря на большие расхождения разных авторов в представлении о структуре ролевой игры, все сходятся на том, что принятие роли остается неизменным ее компонентом. Принятие роли ...

Исследование ролей личностей. Политик
Политик – человек, участвующий в принятии ключевых решений и оказывающий существенное влияние на процесс принятия ключевых решений в политической сфере на федеральном, региональном или муниципальном уровнях. С тем, чтобы выявить, кто в Рос ...

Опыт информатизации и перспективные идеи
В настоящее время все страны мира в той или иной степени осуществляют процесс информатизации. Неправильно выбранная стратегия информатизации или ее недостаточные динамизм и мобильность могут привести к существенным, а подчас драматическим ...