Реферат по предмету "Социология"


Факторы обеспеченности российских домохозяйств товарами длительного пользования

Курсоваяработа
Анализроссийских домохозяйств по структуре потребления
товаров и услуг.
Факторыобеспеченности российских домохозяйств
товарамидлительного пользования.
(на базевторичного анализа данных RLMS)
Москва, 2008

1. Введение
В работе даетсяпример подхода к изучению зависимостей между доходами домохозяйств и различных факторов,влияющих на наличие в домохозяйствах товаров длительного пользования. На основепервичных данных опроса RLMSза 2004 г. построены и разобраны регрессионные модели потребления ТДП от доходаи различных социально-экономических факторов, таких как: число членов семьи,число источников дохода, местность проживания. Для исследования этойзависимости построено несколько вариантов статистических моделей линейнойрегрессии с различными объясняющими  переменными и показана модель, котораябудет наиболее точно отражать эту зависимость. Для построения статистическоймодели использованы многомерные статистические методы, в частности модельмножественной линейной регрессии. В качестве зависимой переменной в моделибудет использоваться взвешенная сумма наличия предметов длительного пользования,а в качестве объясняющих переменных – те показатели, которые я указала выше.
Длявыполнения работы использовались вычислительные, графические возможности ивозможности по преобразованию данных профессионального статистического пакетаSPSS для Windows 14.0.
Изучениетого, чем и как владеют российские домохозяйства, представляет собой актуальнуюзадачу, так как непосредственно характеризует обеспеченность (благосостояние)семей, уровень их бытового комфорта и т.д. По данным российских статистических органов, в2004 году российские домохозяйства тратили на такую статью расходов, как«Предметы домашнего обихода, бытовая техника, уход за домом», от 2,8 до 8,3%всех потребительских расходов (причем этот процент он тем больше, чем большедоходы у домохозяйства). Т.е. первая цифра соответствует 20% населения с наименьшимидоходами, а вторая – 20% населения с наибольшими. То есть, с ростомблагосостояния эта задача становится еще более актуальной.
Встатистическом сборнике владение ТДП представлено в числе единиц на 100 домохозяйств(автомобили – в числе единиц на 1000 человек населения). Это разумно, т.к.позволяет сопоставлять между собой цифры, которые относятся к разным регионамстраны и к различным временным периодам, то есть, характеризовать динамикувладения ТДП.
Вариантыпостановки задачи об обеспеченности ТДП исключительно многообразны. Еслипосмотреть в региональном разрезе (см. сборник «Регионы России»), обеспеченностьсильно варьируется по регионам страны. Так, например, в Москве на 100 домохозяйствв 2004 году приходилось 52 персональных компьютера (и это число заметнопрогрессировало за последние 10 лет). Тогда как в Северной Осетии – только 5.То же самое, скажем, с автомобилями (учет которых ведется в штуках на 1000 чел.населения). В Москве – 224,2 шт, в Брянской области – 77,2 (данные того же 2004года).
Но рассмотрениевсех этих цифр не скажет ничего о том, от каких факторов уровнядомохозяйства зависит владение ТДП. Это и составляет предмет моегоисследования. Я выбрала несколько таких показателей домохозяйства и посмотрела,как они связаны с показателем обеспеченности ТДП. При этом дело не сводилосьпросто к загрузке данных в SPSS, т.к. перед этим они нуждались впреобразованиях.
Сложностьмоей задачи заключается в том, что наличие тех или иных товаров, вообще говоря, не обязательнозависит от материального положения. Например, холодильник, есть почти у всех,но он может быть старый. А телевизор сейчас и вовсе доступен многим (особенно –самые простые и дешевые модели). Поэтому, если я изучаю зависимость обладанияТДП от дохода и прочих переменных, имеет смысл сконструировать индекс ТДП так,чтобы он был связан с текущим положением домохозяйства (а не обозначал«процветание» этого домохозяйства в прошлом, что, собственно, и обозначает старыйхолодильник). Поэтому я попыталась в различных вариантах индекса сопоставитьстоимость разных видов ТДП (то есть, приписать разные веса, например,телевизору и квартире), а также учесть срок давности покупки этих ТДП. Ведьновая квартира – не одно и то же, что старый автомобиль. Затем я посмотрела,как «объясняют» в регрессионной модели выбранные мной независимые переменныетри различные варианта индекса и сделала соответствующие выводы.
Пользуясь синтаксисом,который приведен в приложении, любой желающий может повторить проведенный мнойанализ при наличии данных. Там представлен и расчет показателей, ирегрессионный анализ.

2. Методы анализаданных
Делая выборметода анализа данных, я остановила выбор именно на регрессионном анализе,поскольку он способен объяснить взаимосвязь между многими переменными ипоказать, как один показатель зависит от остальных. Это именно то, чтотребуется в моем случае, поскольку требуется объяснить владение ТДП различнымихарактеристиками домохозяйств. После ознакомления с литературой, описывающийданный метод, мне представляется возможным сделать следующие методическиезамечания, которые касаются моей задачи.
1. Регрессионныйанализ предназначен для моделирования поведения одной количественной переменнойот других. Следовательно, индекс обеспеченности ТДП, который я строю, долженбыть количественным (а не качественным: например, высокая/средняя/низкаяобеспеченность).
2. Регрессионныйанализ предполагает также использование числовых переменных в качественезависимых (объясняющих). Некоторые показатели, которые есть в базе данных(например, доход) уже удовлетворяют этому требованию. Но, например, местностьпроживания, которую я тоже хочу учесть, так как городские домохозяйства обычнообеспечены лучше сельских, является качественной. Поэтому для нее требуетсяспециальное преобразование, которое сделает эту переменную двоичной.
3.Регрессионный анализ является многомерным статистическим методом, то есть,учитывает больше, чем 1 взаимосвязь между признаками. Коэффициентырегрессионной модели должны интерпретироваться по принципу «при прочих равныхусловиях», а не каждый в отдельности. То есть, например (забегая вперед),нельзя говорить, что каждый дополнительный член семьи обеспечивает рост индексаТДП на 0,148. Это утверждение верно лишь при прочих равных условиях, т.е. длясемей с таким же доходом, таким же числом источников дохода и т.д.
4. Заложенныйв SPSS регрессионный анализявляется «линейным», что позволяет определить общие закономерности, но можетбыть недостаточно точным, если суть взаимосвязей между изучаемыми мнойпризнаками нелинейная. Это надо тоже учесть при подготовке выводов. Нонелинейные модели, конечно, достаточно сложны. С другой стороны, если заглянутьв научные журналы, особенно зарубежные, линейный регрессионный анализ используетсясплошь и рядом.
5. Качествомодели регрессионного анализа определяют с помощью показателя R2 (R-квадрат). Он варьируетсяот 0 до 1. «0» означает абсолютно бесполезную модель,  «1» — идеальную. Он жеимеет интерпретацию в процентах объяснения поведения зависимой переменной.Например, R2=0,09означает, что модель объясняет поведение зависимой переменной на 9%. Надо,забегая вперед, сказать, что качество моих моделей оказалось не очень высоким.Но это тоже важный результат. Я проверила и доказала, что индекс ТДП слабозависит от тех переменных, которые я выбрала.
6. Имеетсмысл обращать на значимость коэффициентов регрессии и значимость модели вцелом (это графы Sig. в SPSS). Эти значения, наоборот, должны быть маленькими. Они как быпоказывают, надежность результатов. Потому что, например, на маленькой выборкерезультаты могут быть не очень надежными.
7. Необходимообратить внимание на наличии специальных кодов, которые могут содержаться впеременных. Например, в анкете RLMS если респондент отказывался отвечать на вопрос одоходе, там вбивался код «99999». Важно избавиться от этих кодов перед началоммоделирования, иначе SPSS посчитает 999999 за величину дохода семьи респондентав рублях. Что, конечно, исказит результаты.
8. Передначалом моделирования необходимо изучить простые распределения переменных (т.н.Descriptive Statistics – описательнаястатистика), которая скажет, какие вообще есть значения у этих переменных, какчасто они встречаются, какой там минимум и максимум и проч. Все это позволит проверить,подходят ли данные для анализа.
Что касаетсяметодической литературы по регрессионному анализу, то она в избытке имеется нароссийском рынке. Взять хотя бы книгу Э. Сигела, где регрессионный анализрассматривается в одной из глав достаточно подробно. Этот вид анализа рассматриваетсяв общих чертах и в книгах по общей теории статистики, например. Все это доказывает,что данный вид анализа очень важен и практически полезен.
3. Описание исходных (вторичных)данных
Задачи эссе предполагаютиспользование данных уровня домохозяйства для построения моделей. Такие данныесобираются Госкомстатом России в рамках выборочных обследований, а также врамках специальных проектов (например, «Российский мониторинг экономики издоровья», RLMS). Данное  исследование будетпостроено на данных выборочного опроса RLMS. Выборка репрезентирует население России.
Объем выборки 4711домохозяйств. Данные собирались по формализованной анкете (опроснику). Данныесодержат богатую базу для различного моделирования.
База данных, котораябудет использоваться для моделирования, содержит много переменных. Наиболее интересующимидля нас являются переменные, которые позволяют выявить наличие тех или иных ТДП,такие как наличие ПК, стиральной машины и т.д.,  а также переменные, которыемогут влиять/определять наличие ТДП у домохозяйств. Доходы, количество человекв семье, число источников домохозяйства и проч.
Не все переменные будутпредставлены в анализе так, как они представлены в исходной базе данных. Дело втом, что некоторые переменные нуждаются в преобразовании, а некоторые – ввычислении заново. Так, например, данные о месте проживания домохозяйства япреобразовала в двоичную переменную город=1/село=0, тогда как исходнаяпеременная содержала 4 градации (в части анализа это показано). Это выгодно,т.к. мне требовалось включить эту переменную в регрессионную модель, а этодопускается лишь для количественных, или для двоичных переменных. А числоисточников доходов я вообще считала по нескольким переменным, где респондентупредлагался целый спектр источников доходов и предлагалось согласиться или несогласиться что очередной источник доходов используется семьей респондента.
Всего в вычисленияхзадействовано более 30 переменных. Это отражено в синтаксисе (см. приложение).
Пример самой базы данныхпредставлен в следующей таблице:
Пример базы данных
           Имя 
             перем.
Номер семьи iid_h Ic9.1a Ic9.1b … indexTDP1 … 1 10101 1 8 … 0,51 … 2 10102 1 20 … 0,72 … 3 10103 1 24 … 0,54 … 4 10105 2 … … 5 10107 1 6 … 1,11 … 6 10112 99 … … … … … … … … …
Это фрагмент данный в томформате, который отображается в SPSS.По горизонтали – семьи, по вертикали – переменные (показатели). Например,переменная iid_h – код семьи в 13-й волне (2004 год), ic9.1a – показатель того, есть ли в домохозяйстве холодильник (код1), или нет (код 2), ic9.1b – содержит возраст холодильника, indexTDP1 – это уже рассчитанный мной индексобеспеченности ТДП. Например, из тех семей, что есть в данном фрагменте,наиболее обеспеченной, вероятно, является семья №5.
Значения «99» дляпеременной ic9.1a не являются истинными ее значениями, а обозначают, чтореспондент отказался ответить на данный вопрос. Этот (и другие коды, означающиепропущенные значения), следует перед началом работы объявить пропущенными,чтобы программа исключала их из анализа.

4. Анализ данных иинтерпретация
Для начала япроанализирую распределения тех переменных, которые я планирую использовать врегрессионных моделях. Это доход, число членов семьи, число источников дохода,городская/сельская местность, а также – показатели владения товарами длительногопользования.
Распределение домохозяйствпо доходуЧисло домохозяйств Минимальный доход, руб. Максимальный доход, руб. Средний доход, руб. Медиана дохода, руб. Ст. откл. дохода, руб. 4711 706964 10005 6400 22237
Графа «число домохозяйств»показывает, сколько домохозяйств согласились раскрыть свои доходы. Медианаменьше среднего, это означает, что на среднее значение дохода сильно повлияли семьис большими доходами, резко отличающимися от доходов основной массы опрошенных.
Минимальный имаксимальный (и даже средний) доходы еще далеко не все говорят о распределениипеременной, поэтому лучшее представление о распределение дохода дает понять гистограммараспределения дохода.

/>
 Гистограмма распределения респондентов по доходу
Поскольку имеетсянезначительное число больших доходов, гистограмма не очень удачная получилась.Рассмотрим лучше квартили распределения дохода, которые скажут, с какойвеличины начинаются 25% минимальных доходов, медиану и с какой величиныначинаются 25% самых крупных. Вот они:Квартили распределения дохода I II III 3100 6400 12000
 
Как видно, 50% срединных извсех наблюдаемых доходов находится в пределах от 3100 до 12000 руб.
Далее надо посмотреть,какие ТДП вообще есть в домохозяйствах. Вот их встречаемость:

Встречаемостьналичия ТДП
Вид ТДП
Количество семей
% от общего числа семей Холодильник 4433 94,1 Отдельная морозильная камера 325 6,9 Стиральная машина 3800 80,7 ч/б телевизор 584 12,4 цв. телевизор 4180 88,7 Видеомагнитофон/видеоплеер 2225 47,2 Компьютер 823 17,5 Легковой автомобиль 1322 28,3 Грузовой автомобиль 89 1,9 Мотоцикл, мотороллер, моторная лодка 180 3,8 Трактор/ минитрактор 61 1,3 Дача, другой дом, часть дома, садовый домик 995 21,1 Другая квартира / часть квартиры 271 5,8
Как видно, наиболеераспространенным ТДП из данного перечня является холодильник (он есть почтивкаждом домохозяйстве), а наименее распространенными следует признать тракторы,грузовые автомобили, мотоциклы и мотороллеры. Суммарный процент, естественно,превосходит 100%, поскольку одно и то же домохозяйство может владетьнесколькими ТДП одновременно. Эти цифры, в принципе, соответствуют тем, чтопредоставляет Госкомстат России, говоря об обеспеченности домашних хозяйствтоварами длительного пользования. Но они рассчитывают обеспеченность в количествеединиц на 100 домохозяйств, поэтому представление данных немного другое.Например, в 2004 году на 100 домохозяйств в РФ приходилось: телевизоров – 135шт., видеомагнитофонов/камер: 62 шт., персональных компьютеров: 28 шт.,холодильников/морозильников: 114 шт., стиральных машин: 94 шт.
В модель также будетвключена переменная, которая показывает, в каком типе населенного пунктапроживает домохозяйство, т.к. как правило, в больших развитых городах, уровеньблагосостояния домохозяйств, проживающих там, значительно выше, что в своюочередь влияет на наличие ТПД в этих домохозяйствах.
 
Распределение по типунаселенного пункта, в котором проживает домохозяйство  Частота Процент Областной центр 2017 42,8   Город 1249 26,5   ПГТ 292 6,2 Село 1153 24,5 Всего 4711 100
Переменная типанаселенного пункта где проживает домохозяйство, будет представлена в моделидихотомизированной, с двумя значениями — город (код 1, 69,3% опрошенныхдомохозяйств) и соответственно населенный пункт сельского типа (код 0, 30,7%опрошенных). Это нужно для того, чтобы включить данную качественную переменнуюв количественный анализ, т.е в регрессионную модель. Коэффициент перед даннойпеременной в модели будет показывать, как влияет проживание в городе на наличиеТДП.
Распределение по числучленов домохозяйства таково. Примерно 19% домохозяйств состоят из 1 человека,еще почти 28% — из 2-х человек, еще столько же – из 3-х, еще 16,5% — из 4-х.Все прочие (более крупные) домохозяйства дают, в целом, 10%.
Наконец, в модели будетприсутствовать переменная, характеризующая число источников дохода. Минимальноезначение данной переменной: 0, максимальное – 8. В среднем российское домохозяйствоимеет 2,4 источника дохода из тех, что были представлены в анкете RLMS. Стандартное отклонение: 1,2. Еслиговорить в процентах, то не имеют источников дохода, примерно, 1,5%домохозяйств, 1 источник имеют 24,6%, 2 – 32%, 3 – 24,7%. Это наиболее распространенныепоказатели. Большее число источников имеют, в целом, не более 17% домохозяйств.
Чтобы посмотреть каквлияют рассмотренные переменные на владение товарами длительного пользования,необходим показатель, который бы вобрал в себя эту информацию. В данном эссе япредлагаю 3 варианта вычисления такого показателя на основе сведений, которыеимеются в анкете.
Первый вариант расчетапоказателя самый сложный. Допустим, у нас есть сведения о 13 ТДП (см. выше).Известно, есть тот или иной товар в семье, или нет, а также – известно, скольколет этому товару. Мне кажется, имеет смысл не только подсчитывать суммарныйиндекс как число товаров, которое есть в домохозяйстве, но и попытаться учестьразную стоимость этих товаров и разный срок их службы. В самом деле, автомобиль,выпущенный в середине 1990-х гг и автомобиль, выпущенный в прошлом году – неодно и то же. Чтобы получить итоговый показатель, я суммирую следующие произведенияотдельно по каждому виду ТДП:
«есть (1) или нет (0)товар в домохозяйстве» * «вес товара» *
максимум из «0 и разности (10 – возраст товара)».
С первой частью ясно.Если товар есть, мы ставим вместо этой части 1, если нет – 0. Вес товараопределяем так, что дополнительная квартира имеет вес, равный 1, автомобиль –вес, равный 0,1, компьютер – вес, равный 0,04 и т.д. Веса я сама предложила, исходяиз примерного соотношения стоимостей этих ТДП. Таким образом, иметь, Например,компьютер и автомобиль – не одно и то же, что иметь дополнительную квартиру, вобщем случае. Последняя составляющая нужна для того, чтобы учесть возрасттовара, и приписать больший вес товарам, которые много моложе 10 лет. Если жетовар 10 лет и старше, то разность может быть меньше нуля. И чтобы не делатьиндекс отрицательным, мы выбираем максимум из 0 и возможного отрицательногозначения, то есть, зануляем слагаемое для данного товара. Так мы складываем этирезультаты по всем товарам.
Мне кажется, это довольнотрезвый способ расчета индекса обеспеченности ТДП, полностью учитывающий всюинформацию о них, которая есть в анкете. Максимум этот индекс приобретает в томслучае, если семья обеспечена всеми товарами, но в первую очередь – самымидорогостоящими, и к тому же, если эти товары относительно новые.
Еще 2 варианта расчетапоказателя я предложила, честно говоря, после того, как эксперименты с первымпоказателем обнаружили не очень хорошую объясняющую способность регрессионныхмоделей.
Второй вариантзаключается в том, что веса товаров принимаются за единицу (или неучитываются), но возраст продолжает учитываться. Т.е. мы изымаем вторую частьформулы, представленной выше.
Третий, самый простойспособ расчета этого показателя заключается в том, все веса принимаются заединицу, а возраст товара не учитывается. Т.е. это просто – число товаров изсписка вещей, которыми владеет семья.
Показатели называются indexTDP1, indexTDP2 и indexTDP3, соответственно. Рассмотрим ихраспределения.
Описательная статистика показателей обеспеченности ТДП  N Minimum Maximum Mean Std. Deviation indexTDP1 4711 .00 11.84 .6333 1.01381 indexTDP2 4711 .00 63.00 13.2815 11.65379 indexTDP3 4711 .00 10.00 4.0964 1.64273
Есть семьи, гдерассчитанный показатель наличия ТДП равен нулю, это говорит о том, что у этихдомохозяйств вовсе отсутствуют перечисленные товары, либо они довольно старые(либо они просто не аккуратно ответили на данный вопрос анкеты).
Гистограммы распределенияпоказателей следующие:
/>
/>
/>
Как видно, для первого ивторого показателей присутствует большая группа семей, для которых они равны 0(или около того). Это происходит, скорее всего, потому, что вещи есть, но онидостаточно старые (старше 9 лет), поэтому индексы их учитывают как будто бы ихнет вовсе.
Наконец, для  изучениязависимости между потреблением ТДП от дохода и  других социально-экономическихфакторов строятся несколько регрессионных моделей.
Ниже отдельно для каждогоиз трех показателей приводится отдельная таблица, содержащая 3 или 4 модели.Первая модель всегда содержит только одну независимую переменную, вторая – двеи так далее. Такое представление результатов позволяет показать, как добавлениепоследующей объясняющей переменной отражается на качестве модели. Длядобавления переменных в модель был использован алгоритм Stepwise программы SPSS. Значки Sig. показывают значимость модели в целом и коэффициентов по отдельности.Считается, что если Sig. близок к 0,то модель значима, то есть, имеет смысл.
Рассмотрим модели спервым показателем. Качество моделей (хотя они и значимы) очень низкое. Так какпоказатель R2 близок к 0. То есть, независимыепеременные (доход, число источников дохода и проч.) плохо объясняют измененияпеременной индекса владения ТДП. Максимум – на 7%. В первую очередь программавключила в модель число членов семьи, затем – двоичную переменную город/село,затем – суммарный доход и, наконец, число источников дохода. Интерпретация для4-й модели, например, такая: каждый дополнительный член домохозяйства, припрочих равных условиях, увеличивает индекс потребления ТДП, в среднем, на 0,148единиц. Иными словами, более крупные семьи, обычно, владеют большим наборомТДП. Что естественно. Аналогично, если домохозяйство из городской среды, тонужно увеличить прогноз индекса на 0,269. Каждый доп. рубль суммарного дохода домохозяйстваувеличивает индекс на 0,00000514 единиц. А вот чем больше источников дохода,тем меньше как бы становится индекс. В части выводов причина этого обсуждается.

Регрессионныемодели потребления ТДП (первый вариант)
Модель №
1
2
3
4 Константа
0,223
(Sig.=0,000)
0,013
(Sig.=0,741)
0,016
(Sig.=0,688)
0,077
(Sig.=0,074) Число членов семьи
0,148
(Sig.=0,000)
0,154
(Sig.=0,000)
0,140
(Sig.=0,000)
0,148
(Sig.=0,000) Городская местность проживания –
0,279
(Sig.=0,000)
0,254
(Sig.=0,000)
0,269
(Sig.=0,000) Суммарный доход домохозяйства за последние 30 дней – –
5,10Е-006
(Sig.=0,000)
5,14Е-006
(Sig.=0,000) Число источников дохода за последнее время – – –
–0,039
(Sig.=0,001)
/>
0,043
0,059
0,071
0,073
Значимость модели(Sig.)
0,00
0,00
0,00
0,00
Модель с использованиемвторого варианта индекса (без учета весов ТДП) кажется более удачной. Но издесь объясняющая способность не превышает 16% для 4-х объясняющих переменных.Суть коэффициентов остается той же. Но они теперь чуть-чуть побольше, посколькувторой индекс имеет больший масштаб изменений.
Регрессионныемодели потребления ТДП (второй вариант)
Модель №
1
2
3
4 Константа
5,969
(Sig.=0,000)
2,623
(Sig.=0,000)
2,662
(Sig.=0,000)
3,574
(Sig.=0,000) Число членов семьи
2,629
(Sig.=0,000)
2,725
(Sig.=0,000)
2,533
(Sig.=0,000)
2,639
(Sig.=0,000) Городская местность проживания –
4,443
(Sig.=0,000)
4,087
(Sig.=0,000)
4,314
(Sig.=0,000) Суммарный доход домохозяйства за последние 30 дней – –
7,41Е-005
(Sig.=0,000)
7,46Е-005
(Sig.=0,000) Число источников дохода за последнее время – – –
–0,572
(Sig.=0,000)
/>
0,103
0,133
0,153
0,156
Значимость модели (Sig.)
0,000
0,000
0,000
0,000
Третий вариант индексанаилучшим образом подходит для моделирования (см. табл. ниже). Но и здесь 3-ямодель объясняет лишь 18,7% колеблемости индекса. Число источников дохода здесьвключать было излишне и SPSSне включил.
Регрессионныемодели потребления ТДП (третий вариант)
Модель №
1
2
3 Константа
2,966
(Sig.=0,000)
2,412
(Sig.=0,000)
2,418
(Sig.=0,000) Число членов семьи
0,407
(Sig.=0,000)
0,422
(Sig.=0,000)
0,394
(Sig.=0,000) Городская местность проживания –
0,735
(Sig.=0,000)
0,683
(Sig.=0,000) Суммарный доход домохозяйства за последние 30 дней – –
1,09Е-005
(Sig.=0,000)
/>
0,124
0,1166
0,187
Значимость модели (Sig.)
0,000
0,000
0,000
Итак, поставленная цельбыла достигнута. Регрессионные модели построены. Они не очень хорошо объясняютвсе три варианта индекса, видимо, потому, что все-таки наличи в домохозяйствеТДП объясняется, в основном, не этими переменными, а теми, что я не учла ванализе.
В следующем разделеобсуждаются некоторые выводы, которые можно из всего этого сделать.

5. Выводы
В ходе работы был проведен анализ данных опроса RLMS волны 2004 года. Основной цельюработы было исследование зависимости наличия у домохозяйств товаров длительного пользования от доходов и различных социально-экономических факторов(числа членов домохозяйства, числа источников доходов, местности проживания).
Для учета наличия вдомохозяйстве товаров длительного пользования было построено 3 вариантаиндикатора. Первый вариант, наиболее сложный, учитывал наличие ТДП по 13позициям, веса различных ТДП (например, компьютер имеет значительно меньшийвес, чем автомобиль), а также – количество лет, сколько данный товар уже используетсяв домохозяйстве. Логика данного индикатора такова, что чем больше дорогихтоваров длительного пользования имеется в домохозяйстве и чем эти товары«моложе» (т.е. куплены относительно недавно), тем больше величина индикатора.Второй вариант упрощает логику первого индикатора, исключая из него веса ТДП.Т.е. теперь, например, дополнительная квартира и стиральная машинка имеют одини тот же вес. Но срок давности этих вещей по-прежнему учитывался. Этим я как быпроверяю обоснованность назначения весов товарам длительного пользования.Третий вариант индикатора еще проще. Он является простым пересчетом различныхТДП, без учета их возраста и весов. Это самый простой вариант.
Зависимости всех этих 3индикаторов последовательно изучались в 3 блоках регрессионных моделей. Сначалаизучалось влияние независимый переменных на 1-й индикатор, затем – на 2-й,затем – на 3-й. При этом в каждом блоке строилась не одна, а несколько моделей,т.е. сначала включалась одна независимая переменна, затем к ней добавляласьвторая и т.д. Для этого был использован метод анализа Stepwise пакета SPSS. Этот метод сам решает, нужно ли включить переменнуюв анализ, или нет. В итоге в 1 и 2 блоках были включены все независимыепеременные, а в 3 блоке – все за исключением числа источников дохода. Сдобавлением каждой из независимых переменных в модель, объясняющая способностьмодели возрастала, при этом построенная в итоге модель множественной линейнойрегрессии была значимой (значения Sig. в таблице ANOVA были малы).
К сожалению, ни в одномблоке не удалось добиться высокого показателя качества регрессионной модели R2. Он был далек от единицы во всехслучаях. Хуже всего поддавался моделированию 1-й показатель (самый сложный).Включением в модель всех 4 независимых переменных удалось добиться «объяснения»показателя лишь на R2=0,073 (т.е. на7%). Это, конечно, мало. Второй показатель показал себя лучше. Он объяснялсямаксимум на 15,6%, что, хотя, тоже немного. Третий показатель показал себя чутьлучше второго. Он объяснялся на 18,7%.
 Таким образом, основнойвывод, который мы можем сделать – это тот, что отчасти показатель наличия,давности приобретения и веса ТДП в домохозяйстве объясняются текущимипоказателями дохода, числа источников дохода, а также – числом членов семьи иместностью проживания, но, вообще, зависимость от всех этих переменных –довольно слабая. Во всяком случае, не превышает 20%.
Другой вывод, которыйможно сделать – это тот, что SPSSвключал переменные в модель всегда в одном и том же порядке. Сначала числочленов семьи, затем – город, затем – доход, затем – число источников дохода(кроме блока 3). Наверное, это логично, поскольку разнообразие товаров длительногопользования, конечно, во многом зависит от размера семьи. В большой семьесложно обойтись без основных вещей. Наличие ТДП, конечно, зависит и отместности проживания, поскольку городские жители все же пока лучше, чемсельские обеспечены самым необходимым. Кроме этого, сельские жители редковладеют, скажем, дачами, т.е. у них показатель ТДП часто оказываетсязаниженным. С другой стороны, городские жители, например, реже, чем сельские,владеют тракторами. То, что доход домохозяйства за последние 30 дней находилсядалеко не на 1-м месте, значит, наверное, то, что, хотя мы и пытались учестьсрок давности приобретения ТДП, но все же это товары длительного пользования,а, значит, их наличие лишь в очень небольшой степени объясняется доходом запоследний месяц.
Замечу, что для всехнезависимых переменных коэффициенты были положительными, за исключением числаисточников дохода. Получается, что чем больше у домохозяйства источниковдохода, чем меньше у него индекс ТДП. Конечно, эта переменная влияет на индексслабее остальных, но все же может показаться странным, что большой спектристочников дохода оборачивается малым количеством (или большой давностью ТДП).Я думаю, этот «парадокс» объясняется довольно просто. При подсчете числаисточников доходов мы учитывали и такие источники, как пенсия, субсидии, помощьот государственных и негосударственных организаций, помощь родственников идругих людей (в том числе – не только деньгами, но и вещами). Получается, чтобольшое число источников дохода – не показатель благополучия домохозяйства, а,скорее, наоборот — обозначение того, что семья вынуждена прибегать к помощи состороны. Тогда как состоятельные семьи часто существуют, в основном, назарплату и, может быть, проценты от акций и т.д. Я считаю это довольноинтересным выводом.
Довольно тяжелообъяснить, почему аккуратный учет располагаемых ТДП в домохозяйствевыражающийся индексом №1, оказался хуже, чем остальные индексы, которые не учитывают,ни вес ТДП, ни их возраст. Может быть, это от того, что c увеличением дохода потреблениеразличных товаров длительного пользования изменяется в разной степенинезависимо от их цен. А может быть мы просто подобрали такие веса, которые неточно соответствуют соотношениям цен на товары. Может, сложность заключается ещев том, что у нас как бы смешались ТДП, которые есть почти в каждой семье(холодильник, телевизор) и товары, которые есть лишь у некоторых (автомобиль,компьютер, дополнительная квартира). Возможно, проблема состоит еще и в том,что, если учитывать возраст вещей и не учитывать вещи, которые старше 10 лет(как это было сделано в индексах №1 и 2), то около 20% домохозяйств имеютиндекс ТДП, равный 0, т.е. вовсе не имеют вещей, которые нас интересуют. А длятретьего индекса таких домохозяйств только 1%.
Итак, в результатепроведенных исследований мы выяснили, что зависимость потребления ТДП от доходаи других социально-экономических факторов можно описать с помощью множественнойлинейной регрессии, но далеко не полностью.

6. Литература
1.        Салин В.Н.,Шпаковская Е.П. Социально-экономическая статистика: Учебник. – М.: Юристъ,2001. – 461 с.
2.        Социальнаястатистика: Учебник / Под ред. чл.-кор. РАН И.И. Елисеевой. – 3-е изд., перераби доп. – М. Финансы и статистика, 2002. – 480 с.
3.        Социальноеположение и уровень жизни населения России: Стат. сб. / Госкомстат России. –М., 2001. – 463 с.
4.        SPSS Base 14.0 Руководство пользователя. – SPSS Inc, 2005. – 814 с.
5.        Российскийстатистический ежегодник. 2005: Стат. сб. / Росстат. – М., 2006. – 819 с.
6.        Сигел, Эндрю.Практическая бизнес-статистика.: Пер. с англ. – М.: Издательский дом«Вильямс», 2002. – 1056 с.
7. Приложения
 
Командный синтаксис SPSS-15 для построения моделей. Вприложении приводится перечень команд трансформации и статистического анализа вSPSS, выполнение которых позволяет приналичии исходных данных получить расчетные показатели, а также таблицы срезультатами моделирования. Синтаксис позволяет при необходимости быстро воспроизвестиход процесса моделирования, а также допускает легкую модификацию для построенияаналогичных моделей на других данных, имеющих схожую структуру (либо на этих жеданных, но по подгруппам респондентов). Дополнительно о синтаксисе SPSS можно прочитать на сайте www.spsstools.ru, или в руководстве пользователя по синтаксису (см. выше).
Внимание! Перед запускомсинтаксиса необходимо определить пропущенные значения по всем переменным, чтобыони исключались из анализа и не искажали результатов расчета.
Вычислениепоказателей.
Вычислениечисла членов семьи (это присутствует либо в переменной i1.o, либо в i1.n).
COMPUTE nfam=SUM(i1.o,i1.n).
Вычислениедвоичной переменной «город» (если код 1 или 2, то это – город).
COMPUTE gorod=status
Вычислениечисла источников дохода (если код в этих переменных равен 1, значит респондентсогласился, что у него есть такой источник дохода).
COMPUTE ndohod=SUM(0, if3=1, if6.1=1, if6.2=1,
if9.1a=1,
if9.2a=1,
if9.3a=1,
if9.4a=1,
if9.5a=1,
if9.6a=1,
if9.7a=1,
if9.8a=1,
if9.9a=1,
if9.91a=1,
if9.10a=1,
if10=1,
if11.3=1,
if12.1a=1,
if12.2a=1,
if12.3a=1,
if12.4a=1,
if12.5a=1,
if12.6aa=1,
if12.6ba=1,
if12.7a=1,
if12.8a=1,
if12.9a=1,
if1210ba=1).
Вычислениепервого варианта индекса (наличие предмета (код=1), т.е. 1 мы умножаем на вес ина максимум из 0 или 10-«возраст». Если возраст предмета больше или равен 10годам, мы берем не отрицательное значение, а 0, т.е. не учитываем данный предмет).
COMPUTE indexTDP=SUM( 0, (ic9.1a=1)*0.04*Max(0,10-ic9.1b),
 (ic9.2a=1)*0.04*Max(0,10-ic9.2b),
 (ic9.3a=1)*0.04*Max(0,10-ic9.3b),
 (ic9.4a=1)*0.01*Max(0,10-ic9.4b),
 (ic9.5a=1)*0.03*Max(0,10-ic9.5b),
 (ic9.6a=1)*0.03*Max(0,10-ic9.6b),
 (ic9.6.2a=1)*0.04*Max(0,10-ic9.6.2b),
 (ic9.7a=1)*0.1*Max(0,10-ic9.7b),
 (ic9.7.1a=1)*0.1*Max(0,10-ic9.7.1b),
 (ic9.8a=1)*0.05*Max(0,10-ic9.8b),
 (ic9.9a=1)*0.1*Max(0,10-ic9.9b),
 (ic9.101a=1)*0.2*Max(0,10-ic9.101b),
 (ic9.12a=1)*1*Max(0,10-ic9.12b)).
Вычислениевторого варианта индекса ТДП. Тут мы не учитываем вес предмета.
COMPUTE indexTDP1=SUM( 0, (ic9.1a=1)*Max(0,10-ic9.1b),
 (ic9.2a=1)*Max(0,10-ic9.2b),
 (ic9.3a=1)*Max(0,10-ic9.3b),
 (ic9.4a=1)*Max(0,10-ic9.4b),
 (ic9.5a=1)*Max(0,10-ic9.5b),
 (ic9.6a=1)*Max(0,10-ic9.6b),
 (ic9.6.2a=1)*Max(0,10-ic9.6.2b),
 (ic9.7a=1)*Max(0,10-ic9.7b),
 (ic9.7.1a=1)*Max(0,10-ic9.7.1b),
 (ic9.8a=1)*Max(0,10-ic9.8b),
 (ic9.9a=1)*Max(0,10-ic9.9b),
 (ic9.101a=1)*Max(0,10-ic9.101b),
 (ic9.12a=1)*Max(0,10-ic9.12b)).
Вычислениетретьего варианта индекса ТДП. Здесь мы учитываем только наличие предметов.
COMPUTE indexTDP2=SUM( 0, (ic9.1a=1),
 (ic9.2a=1),
 (ic9.3a=1),
 (ic9.4a=1),
 (ic9.5a=1),
 (ic9.6a=1),
 (ic9.6.2a=1),
 (ic9.7a=1),
 (ic9.7.1a=1),
 (ic9.8a=1),
 (ic9.9a=1),
 (ic9.101a=1),
 (ic9.12a=1)).
Описательнаястатистика рассчитанных и присутствующих в базе данных показателей, которыебудут использованы для моделирования:
FREQUENCIES
VARIABLES=nfam gorod ndohod
/ORDER=ANALYSIS .
GRAPH
/HISTOGRAM=if14 indexTDP1 indexTDP2 indexTDP3.
EXAMINE
VARIABLES=ndohod nfam if14 indexTDP1 indexTDP2 indexTDP3
/PLOT BOXPLOT STEMLEAF
/COMPARE GROUP
/PERCENTILES(5,10,25,50,75,90,95) HAVERAGE
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Построение 3-х блоковрегрессионных моделей, по одному на каждый вариант индекса.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT indexTDP1
/METHOD=STEPWISE nfam gorod ndohod if14.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT indexTDP2
/METHOD=STEPWISE nfam gorod ndohod if14.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT indexTDP3
/METHOD=STEPWISEnfam gorod ndohod if14.


Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.