Не отобразилась форма расчета стоимости? Переходи по ссылке

Не отобразилась форма расчета стоимости? Переходи по ссылке

Курсовая работа на тему «Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации»

Заработная плата выражает интересы наёмных рабочих, работодателей и государства в целом. Государство заинтересовано в том, чтобы обеспечить рост благосостояния общества и социальную гармонию посредством увеличения заработной платы.

Введение

Заработная плата уже долгое время привлекает к себе внимание различных специалистов экономической сферы, таких как А. Смита, У. Петти, К. Маркса, М. И. Туган-Барановского и других.

Работодатели, устанавливая заработную плату, стремятся увеличить прибыль своей компании и эффективность труда, рационально использовать ресурсы производства.

Наёмные рабочие заинтересованы в том, чтобы их труд оценивался по заслугам и заработная плата была бы равносильна вложенным усилиям, а также способна была бы удовлетворить материальные и духовные потребности.

Существующий продолжительное время на рынке труда конфликт между интересами работников и работодателей обострился в последние годы. В то время когда работники требуют увеличение оплаты их труда в связи с растущими ценами в магазинах, работодатель стремится получить максимальную прибыль при минимальных затратах, а в ряде случаях незаконно уменьшая работнику заработную плату. Тем самым образуется «замкнутый круг», из которого очень сложно найти выход.

Цель курсовой работы — выявить и изучить факторы, влияющие на размер заработной платы, выбрать наиболее значимые факторы и определить степень влияния данных факторов на среднемесячную номинальную заработную плату работников за 2014 год.

Полученные результаты нельзя с уверенность применять в сегодняшней практике, в силу того, что в 2014 году в России и в мире был экономический кризис. Поэтому изучение данной зависимости по-прежнему остаётся актуальным.

Анализ темы проводится с помощью эконометрических методов по данным Федеральной службы государственной статистики РФ.

Глава 1. Сбор данных и отбор факторов

Для проведения исследования были отобраны следующие факторы, влияющие на среднемесячную заработную плату работников (y) в 2014 году:- численность населения за 2014 г;- численность экономически активного населения в 2014 г., тыс. человек;- ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г;- объём инвестиций в основной капитал в 2014 г., млн. руб.

Для исследования использовались данные, выражающие вариацию факторов и результирующего признака по регионом Центрального и Северо-Западного федеральных округов. Не были задействованы данные по двум городам (Москва и Санкт-Петербург), а также по Московской области. Это объясняется тем, что наблюдается серьёзное различие в экономическом развитии и заработной платы, которое отражает поле корреляции.

В исследовании использовались данные Федеральной службы государственной статистики, а также данные из единой межведомственной информационно-статистической системы (ЕМИСС) за 2014 год.

Далее будет изучено влияние каждого из приведённых выше факторов на среднемесячную заработную плату работников в отдельности и влияние всех этих факторов.

Глава 2. Исследование влияния отельных факторов

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

2.1. Исследование влияния численности населения на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и численности населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 1).

Таблица 1

Среднемесячная номинальная заработная плата и численность населения по регионам

Для изучения влияния фактора X1 на результирующий признак Y сначала нужно построить поле корреляции.

«Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X1 и Y имеется обратная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см табл. 2).

Таблица 2

Модель парной линейной регрессии

По найденной таблице было записано уравнение выборочной регрессии (y^=37004,448-0,004х) и экономическая интерпретация коэффициентов линейной регрессии: =-0,004 показывает, что при увеличении численности населения на одного человека среднемесячная заработная плата уменьшается на 0,4 копейки.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис.1).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=0,29<Fkp=3,43, значит гетероскедастичность отсутствует. Так как |tr|= 1,82<tkp=2,06, то предположение подтвердилось, в модели присутствует гомоскедастичность.

Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,45 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.

Мною была найдена величина средней ошибки аппроксимации =16,56% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 0,939; F-критическое=4,259.

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 3).

Таблица 3

Показатели значимости коэффициентов

Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:

Значение параметра α с вероятностью 95% будет находиться в интервале [28186,01978; 45822,87636].

Значение параметра β интерпретировать невозможно, поскольку границы разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 3264200,5. А прогнозное значение показателя у^р равно 25449,96.

Стандартная ошибка прогноза функции регрессии получилась равной 8100,11, а ошибка индивидуального значения — 11395,19. Так же вычислен доверительный интервал параметр для условного математического ожидания: [8732,150812; 42167,77998] и доверительный интервал для индивидуального значения [1931,433686; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Коэффициент корреляции rxy =-0,19. Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.

Коэффициент детерминации R2=0,038, говорит о том, что лишь 3,8% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности населения, а остальные 96,2% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

2.2. Исследование влияния численности экономически активного населения на среднемесячную заработную плату работников по регионам.

Представим исходные данные о среднемесячной номинальной заработной плате и численности экономически активного населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 4).

Таблица 4

Среднемесячная номинальная заработная плата и численность экономически активного населения по регионам

Для изучения влияния фактора X2 на результирующий признак Y сначала нужно построить поле корреляциию

«Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X2 и Y имеется обратная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см. табл. 5).

Таблица 5

Модель парной линейной регрессии

По найденной таблице было записано уравнение выборочной регрессии (y^=35642,448-4,354x)и экономическая интерпретация коэффициентов линейной регрессии: =-4,354 показывает, что при увеличении численности экономически активного населения на одного человека, среднемесячная заработная плата. уменьшается на 4,3 рубля.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гомоскедастичность, так как Fg=0,27 < Fkp=3,43. Однако тест Спирмена показал противоположный результат, поскольку tr=2,105 > tкрит=2,063 в модели присутствует гетероскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.

Кроме того, Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=1,56 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо — автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.

Мною была найдена величина средней ошибки аппроксимации =16,69% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 0,362; F-критическое=4,259.

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 6).

Таблица 6

Показатели значимости коэффициентов

Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:

Значение параметра α с вероятностью 95% будет находиться в интервале [26495,85194; 44789,20832].

Значение параметра β интерпретировать невозможно, поскольку границы разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 1715,20. А прогнозное значение показателя у^р равно 28173,80.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Стандартная ошибка прогноза функции регрессии получилась равной 8424,58, а ошибка индивидуального значения — 11693,38. Так же вычислен доверительный интервал параметр для условного математического ожидания: [10786,30456; 45561,29799] и доверительный интервал для индивидуального значения [4039,847983; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =-0,12. Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.

Коэффициент детерминации R2=0,015, говорит о том, что лишь 1,5% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности экономически активного населения, а остальные 98,5% факторами не включёнными в модель

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

2.3. Исследование влияния ВРП (на душу населения) на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и валовом региональном продукте на душу населения за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 7).

Таблица 7

Среднемесячная номинальная заработная плата и ВРП на душу населения

Для изучения влияния фактора X3 на результирующий признак Y сначала нужно построить поле корреляции.

«Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X3 и Y имеется прямолинейная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии ( см. табл. 8).

Таблица 8

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Модель парной линейной регрессии

По найденной таблице было записано уравнение выборочной регрессии (y^=29061,719+12,414x) и экономическая интерпретация коэффициентов линейной регрессии: =12,414 показывает, что при увеличении ВРП на1 млрд. рублей, среднемесячная заработная плата увеличивается на 12,414 рублей.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.

Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=1,78<Fkp=3,43, значит гетероскедастичность отсутствует. Так как |tr|= 0,35<tkp=2,06, то предположение подтвердилось, в модели присутствует гомоскедастичность.

Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=2,05 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо — автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.

Мною была найдена величина средней ошибки аппроксимации =16,11% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР (5%;1;24).

В результате получаем: статистика= 1,543; F-критическое=4,259

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 9).

Таблица 9

Показатели значимости коэффициентов

Значение параметра α с вероятностью 95% будет находиться в интервале [21546,85673; 36576,58047].

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

Значение параметра β интерпретировать невозможно, поскольку границы разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 988,71. А прогнозное значение показателя у^р равно 41335,42.

Стандартная ошибка прогноза функции регрессии получилась равной 6767,08, а ошибка индивидуального значения — 10417,008. Так же вычислен доверительный интервал параметр для условного математического ожидания: [27368,84514; 55302,00355] и доверительный интервал для индивидуального значения [19835,77; 48968,49].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =0,24. Следовательно, по шкале Чеддока наблюдается слабая прямо-линейная зависимость.

Коэффициент детерминации R2=0,06, говорит о том, что 6% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением ВРП, а остальные 74% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

2.4 Исследование влияния объёма инвестиций в основной капитал на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и объёме инвестиций в основной капитал за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 10).

Таблица 10

Среднемесячная номинальная заработная плата и объём инвестиций в основной капитал

Для изучения влияния фактора X4 на результирующий признак Y сначала нужно построить поле корреляции.

«Поле корреляции»

При рассмотрении графика сложно точно предположить, какой вид зависимости существует между переменными. Однако мы можем проанализировать следующие виды зависимостей:

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

Линейная зависимость;

Квадратичная зависимость;

Гиперболическая зависимость;

Степенная зависимость;

Показательная зависимость;

Экспоненциальная зависимость;

Логарифмическая зависимость.

Каждая из рассмотреннчых моделей получилась значимой по критерию Фишера, поскольку Fстат>Fкр. Для того, чтобы выбрать качественную модель, необходимо использовать следующие критерии:

Коэффициент детерминации R^2. С помощью него можно оценить тесноту связи, и чем R^2 ближе к единице, тем лучше регрессия описывает зависимость между зависимой и объясняющими переменными;

Средняя ошибка аппроксимации А. Лучше та модель, у которой наименьшая ошибка аппроксимации. На практике значение этой ошибки в пределах 5-7 % говорит о хорошем соответствии модели выбранным данным;

Стандартная ошибка регрессии Sост. Чем меньше этот показатель, тем лучше построенная модель;

Метод абсолютных отклонений. Лучшая модель та, которая имеет наименьший показатель МАD.

Для выбора лучшей модели рассмотрим таблицу сравнения критериев:

Таблица 11

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

Таблица сравнения критериев

В результате сравнения полученных критериев наилучшей моделью является показательная и/или экспоненциальная. Она лучше аппроксимирует выборочные данные и имеет более точный прогноз. Однако для исследования факторов X3 и Y была выбрана линейная модель из-за ее простоты. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» строим модель парной линейной регрессии (см. табл. 12).

Таблица 12 инвестиция регрессия заработный капитал

Модель парной линейной регрессии

По найденной таблице было записано уравнение выборочной регрессии (y^=25855,921+0,081x) и экономическая интерпретация коэффициентов линейной регрессии:

Коэффициент b=0,081 показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., среднемесячная заработная плата увеличивается на 8,1 коп.

Коэффициент a=25855,921 показывает, что при отсутствии инвестиций в основной капитал (X4=0), среднемесячная заработная плата равна 25855,921 рубл.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 4).

Из вида поля корреляции можно сделать предположение, что гомоскедастичность отсутствует, а присутствует гетероскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гетероскедастичность, так как Fg= 4,1 > Fkp= 3,4. Однако тест Спирмена показал противоположный результат, поскольку tr=1,95<tкрит=2,06 в модели присутствует гомоскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.

Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,39 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.

Мною была найдена величина средней ошибки аппроксимации =15,00% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные. Незначительно превышает 7 %, поэтому можно считать, что построенная модель является удовлетворительной.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 9,784; F-критическое=4,259.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

Так как Fстат.>Fкр., то модель значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициенты а, b и r являются значимыми, т.к tа> tкр; tb>tкр и tr>tкр. (см. табл. 13).

Таблица 13

Показатели значимости коэффициентов

Значение параметра а показывает, что при отсутствии инвестиций в основной капитал с вероятностью 0,95 среднемесячная заработная плата принимает значение в диапазоне [20292,7113; 31419,13052].

Значение параметра β показывает, что при увеличении инвестиций в основной капитал на 1 млн. рубл. с вероятностью 0,95 среднемесячная заработная плата увеличивается на значение в диапазоне [0,027606745; 0,134690429].

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 269765,61. А прогнозное значение показателя у^р равно 47747,01. Стандартная ошибка прогноза функции регрессии получилась равной 4857,05, а ошибка индивидуального значения — 8426,83. Так же вычислен доверительный интервал параметр для условного математического ожидания: [37722,55356; 57771,48587] и доверительный интервал для индивидуального значения [30354,88429; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =0,53. Следовательно по шкале Чеддока между Х и У наблюдается заметная прямо-линейная зависимость.

Коэффициент детерминации R2=0,289, говорит о том, что 28,9% вариации (дисперсии, разброса) среднемесячной заработной платы. объясняется изменением численности населения, а остальные 71,1% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, подходит для описания зависимой переменной. Поэтому данный фактор будет включён в модель множественной регрессии.

Глава 3 Исследование влияния совокупности факторов

3.1 Процедура отбора переменных в множественной линейной регрессии

Для того чтобы построить качественную модель множественной регрессии, необходимо провести пошаговую процедуру включения существенных переменных в анализируемую модель. Для этого вначале построим корреляционную матрицу, найдём коэффициенты корреляции между всеми парами объясняющих переменных и сделаем предположение о наличии или отсутствии мультиколлинеарности (см. табл. 14).

Таблица 14

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

Корреляционная матрица

Можно сделать предположение о наличие мультколлиниарности, поскольку между факторами x1 и x2, x1 и x3, x2 и x3 высокая взаимная зависимость(rxixj>0,7). Значит, не следует включать одновременно факторы в модель.

Для того, чтобы определить, какой из факторов связан с Y в большей степени и в какой последовательности следует включать факторы в модель, необходимо построить скорректированную корреляционную матрицу (см. табл. 15)

Таблица 15

Скорректированная корреляционная матрица

Исходя из полученных данных мы можем сделать вывод, что первым в модель следует включать фактор х4 (объём инвестиций в основной капитал), так как он имеет самый высокий коэффициент корреляции с признаком у, затем фактор х3,х1,х2.

Следующим шагом необходимо проверить целесообразность включения фактора х3 (валовый региональный продукт) в модель ух4, используя частный критерий Фишера.

Так как частный критерий Фишера равен 0,28, а табличное значение 4,28, то включение данного фактора в модель yx4 нецелесообразно.

Аналогично с фактором х1 (численность населения), где Fч=8,15 > Fкр=4,28. Из этого следует, что фактор х1 целесообразно включать в модель ух4.

Последний фактор х2 (численность экономически активного населения) включать в модель целесообразно, т.к. Fч=5,23> Fкр=4,28.

Поскольку факторы х1 и х2 в модель yx4 включать целесообразно, проверим целесообразность включения фактора х1 в модель ух2х4.

Получилось следующее: Fч=19,49>Fкр=4,3, значит включение переменной х1 оправдано.

Таким образом, исключив нецелесообразный фактор х3, можно приступить к построению множественной линейной регрессии х1, х2, x4.

3.2 Построение множественной регрессии

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Для построения множественной регрессии нужно исследовать влияние таких факторов, как:- численность населения за 2014 г;- численность экономически активного населения в 2014 г., тыс. человек;- объём инвестиций в основной капитал в 2014 г., млн. руб.

Объясняемым фактором по-прежнему является Y — среднемесячная заработная плата работников за 2014 год. Исходные данные представлены выборкой объема n=26.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель множественной регрессии (см. табл. 16):

Таблица 16

Модель множественной регрессии

Получим уравнение регрессии: y^=a+b1x1+b2x2 +b4x4, то есть y^= 30395-0,07х1+131,45х2+0,09х4

Дадим экономическую интерпретацию коэффициентов множественной регрессии:

а — показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата составит 30 395 руб.;- показывает, что при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах.- показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах.- показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах.

Проверим значимость уравнения множественной линейной регрессии в целом по критерию Фишера:

Fстатистика

16,56182519

>

Fкрит

3,049125006

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Поскольку Fстат.>Fкрит., значит уравнение регрессии значимо в целом.

Проверим значимость коэффициентов множественной линейной регрессии по критерию Стьюдента при уровне значимости 5% (см. табл. 17):

Таблица 17

Показатели значимости коэффициентов множественной регрессии

Все факторы значимы, из этого следует, что их можно использовать для дальнейшего исследования.

Для статистически значимых коэффициентов были построены доверительные интервалы (см. табл. 18):

Таблица 18

Доверительные интервалы

Дадим их экономическую интерпретацию:

α — показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата изменяется в пределах [24799,3; 35992,1] с вероятностью 95%.

β1 — показывает, что при увеличении численности населения на 1 человека, средняя заработная плата изменяется в пределах [-0,109; -0,039] с вероятностью 95%

β2 — показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата изменяется в пределах [62,435; 200,467] с вероятностью 95%

β4 — показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата изменяется в пределах [0,057; 0,137] с вероятностью 95%

Говоря о качестве построенной регрессии следует отметить, что модель имеет неплохую объясняющую способность, поскольку коэффициент детерминации R^2= 0,69 показывает, что 69% изменения средней заработной платы объясняется изменениями факторов, включенных в модель, а остальные 31% не включенными факторами.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

Так как R² близок к 1, уравнение регрессии неплохо аппроксимирует эмпирические данные.

Средняя ошибка аппроксимации (A=11,10% > 10%) незначительно превышает 10%, поэтому можем считать, что построенная модель является удовлетворительной.

Был вычислен скорректированный коэффициент детерминации: R^2adj=0,65.

В ходе исследования были найдены стандартизованные коэффициенты регрессии b’i и частные средние коэффициенты эластичности Эi. ‘=-4,09;’=3,68;’=0,64.

Поскольку b1’ больше, чем все остальные стандартизированные коэффициенты, можем считать, что фактор x1 (численность населения) больше влияет на y (среднемесячная заработная плата), чем другие факторы (x2,х4)

Средней коэффициент эластичности Эср1=-2,44 показывает, что при увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. Средней коэффициент эластичности Эср2=2,26 показывает, что при увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. Средней коэффициент эластичности Эср4=0,26 показывает, что при увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.

Чтобы определить наличие мультиколлинеарности в данной модели, необходимо построить матрицу выборочных коэффициентов корреляции Q с помощью функции КОРЕЛЛ (см. табл. 19).

Таблица 19

Матрица выборочных коэффициентов корреляции Q

Проанализировав полученную матрицу, можно предположить, что между факторами х1 и х2 существует мультиколлинеарность, так как rx1x2 больше 0,7.

Необходимо проанализировать частные коэффициенты детерминации, которые были получены в результате возведения в квадрат частных коэффициентов корреляции:^2yx1 = 0,47 показывает, что на 47 % изменение средней заработной платы объясняется изменением численности населения, а оставшиеся 53 % — факторами, не включёнными в модель.^2yx2 =0,41 показывает, что на 41 % изменение средней заработной платы объясняется изменением численности экономически активного населения, а оставшиеся 59 % — факторами, не включёнными в модель.^2yx4 =0,53 показывает, что на 53% изменение средней заработной платы объясняется изменением объёма инвестиций в основной капитал, а оставшиеся 47 % — факторами, не включёнными в модель.

В результате проверки значимости частных коэффициентов корреляции было выявлено, что все коэффициенты значимы, так как tr>tкр по модулю.

Чтобы убедиться в наличии мультиколлинеарности вычислим определитель матрицы =1,52374E+29. По этому критерию мультиколлиниарность отсутствует, поскольку определитель матрицы не равен нулю.

Таким образом, при построении множественной модели не удалось полностью избежать мультиколенниарность , поскольку между факторами х1 и х2 она существует, так как rx1x2 больше 0,7. Поэтому, необходимо построить модель, состоящую из двух факторов, х2 и х4. О том, какая модель является лучшей будет сказано в заключение.

Заключение

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

Во время проведения исследования была выявлена и изучена зависимость каждого фактора на результирующий признак как в отдельности, так и в совокупности. Для этого были построены четыре парные линейные регрессии и две модели множественной регрессии.

Проведённое исследование показало, что значимыми можно признать не все построенные модели. Модель, отражающая зависимость среднемесячной номинальной заработной платы от численности населения, а также модель, отражающая зависимость среднемесячной номинальной заработной платы от численности экономически активного населения и модель, отражающая зависимость среднемесячной номинальной заработной платы от валового регионального продукта являются незначимыми. Модель, отражающая зависимость среднемесячной номинальной заработной платы от объёма инвестиций в основной капитал значима.

Для того чтобы построить качественную множественную регрессию, необходимо, во-первых, проверить отсутствие или присутствие мультиколлинеарности в модели, во-вторых проверить целесообразность включения фактора хi в модель, используя частный критерий Фишера. Построив корреляционную матрицу, обнаружилось, что между факторами x1x2, x1x3, x2x3 высокая взаимная зависимость, а значит можно сделать предположение о наличие мультколлиниарности. Это говорит о том, что не следует включать одновременно факторы в модель. Поскольку фактор х4 имеет самый высокий коэффициент корреляции с признаком у, значит его следует включить в модель первым, а затем фактор х3,х1,х2. Как оказалось не все факторы можно включать в модель множественной регрессии. Включение фактора х3 в модель ух4 нецелесообразно, поскольку Fч=0,27<Fкр=4,27. Поэтому фактор х3 был исключён из модели. Сделав проверку включения факторов х1 в модель ух4, а также х2 в модель ух4, а затем х1 в модель ух2х4, оказалось, что включение всех этих факторов целесообразно. Поэтому для исследования была построена модель множественной регрессии y^=a+b1x1+b2x2+b4x4 или y^=30395-0,07х1+131,45х2+0,09х4.

Полученной модели можно дать экономическую интерпретацию: при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах; при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах; при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах. Коэффициент а интерпретировать невозможно, так как тяжело представить регион, где не существует людей, способных и желающих работать и где нет инвестиций в основной капитал.

Анализ данной модели установил, что 69% изменения средней заработной платы в 2014 году объясняется изменением численности населения, численности экономически активного населения и объёма инвестиций в основной капитал. При увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. При увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. При увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.

Данная модель значима в целом по критерию Фишера, с удовлетворительной ошибкой аппроксимации и достаточно большим коэффициентов детерминации, т.е. в целом пригодной для прогнозирования. Однако между факторами х1 и х2 существует мультиколлинеарность в стохастической форме. Определитель матрицы хоть и отличен от нуля, но очень мал. Однако стандартные ошибки коэффициентов регрессии получились небольшими, и коэффициенты получились значимы по t-критерию. Несмотря на то, что свойства несмещённости и эффективности оценок остаются в силе, мультиколлинеарность в любом случае затрудняет разделение влияния объясняющих переменных на поведение зависимой переменной и делает оценки коэффициентов регрессии ненадёжными.

Но следует иметь в виду, что у нескольких факторов, а именно х2 и х4, нельзя точно определить присутствует гомоскедастичность или гетероскедастичность, так как результаты тестов Голдфелда-Квандта и Спирмена противоречат друг другу. Скорее всего, неточность связана с небольшим объёмом выборки. Кроме того, у факторов х1 и х4 автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения. Все этого говорит о том, что в построенной модели возможны ошибки, которые следует принять к сведению при построении прогнозов.

Чтобы уменьшить наличие мультиколлинеарности было решено исключить из модели y^=a+b1x1+b2x2+b4x4 переменную х1.

Была построена множественная регрессия y^=a+b2x2+b4x4 или y^=31806-14,08х2+0,104х4.

Несмотря на отсутствие мультиколлинеарности данная модель, по -моему мнению, получилась хуже.

Сделаем сводную таблицу и сравним модель парной регрессии, которая значима, и модели множественной регрессии по наиболее существенным критериям (см. табл. 20):

Таблица 20

Сравнение моделей

Как мы видим, по большинству критериев лучшая модель — множественная модель с тремя факторами y^=a+b1x1+b2x2+b4x4. Данная модель в большей степени влияет на величину заработной платы, чем остальные. Скорее всего это связано с тем, что сами работники, их количество и инвестиции в основной капитал заставляют работодателей изменять величину заработной платы.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

В заключении хотелось бы отметить, что данный вопрос требует особого внимания и дальнейшего изучения, так как заработная плата играет значительную роль в развитии экономики, государства и жизни каждого человека. Дальнейшее изучение данного вопроса поможет в построении прогнозов и принятии целесообразных решений, а возможно приведёт к более качественной модели.

Список использованных источников

Евсеев Е.А., Буре В.М., Эконометрика: Учебник, Изд-во МБИ, 2007 г.

Тарашнина С. И., Панкратова Я.Б., Выполнение курсовой работы по эконометрике: учебно-методическое пособие, 2007 г.

Курс эконометрика: электронный ресурс URL: http://eos.ibi.spb.ru/course/view.php?id=608

Сайт федеральной статистики: электронный ресурс URL: <http://www.gks.ru/>

Федеральная служба государственной статистики (Росстат): электронный ресурс URL: http://government.ru/department/250/events/

Средняя оценка 0 / 5. Количество оценок: 0

Поставьте оценку первым.

Сожалеем, что вы поставили низкую оценку!

Позвольте нам стать лучше!

Расскажите, как нам стать лучше?

604

Закажите такую же работу

Не отобразилась форма расчета стоимости? Переходи по ссылке

Не отобразилась форма расчета стоимости? Переходи по ссылке