Курсовая работа на тему «Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации»

Заработная плата выражает интересы наёмных рабочих, работодателей и государства в целом. Государство заинтересовано в том, чтобы обеспечить рост благосостояния общества и социальную гармонию посредством увеличения заработной платы.

Скачать пример Заказать работу Скачать пример Заказать работу

Введение

Заработная плата уже долгое время привлекает к себе внимание различных специалистов экономической сферы, таких как А. Смита, У. Петти, К. Маркса, М. И. Туган-Барановского и других.

Работодатели, устанавливая заработную плату, стремятся увеличить прибыль своей компании и эффективность труда, рационально использовать ресурсы производства.

Наёмные рабочие заинтересованы в том, чтобы их труд оценивался по заслугам и заработная плата была бы равносильна вложенным усилиям, а также способна была бы удовлетворить материальные и духовные потребности.

Существующий продолжительное время на рынке труда конфликт между интересами работников и работодателей обострился в последние годы. В то время когда работники требуют увеличение оплаты их труда в связи с растущими ценами в магазинах, работодатель стремится получить максимальную прибыль при минимальных затратах, а в ряде случаях незаконно уменьшая работнику заработную плату. Тем самым образуется «замкнутый круг», из которого очень сложно найти выход.

Цель курсовой работы — выявить и изучить факторы, влияющие на размер заработной платы, выбрать наиболее значимые факторы и определить степень влияния данных факторов на среднемесячную номинальную заработную плату работников за 2014 год.

Полученные результаты нельзя с уверенность применять в сегодняшней практике, в силу того, что в 2014 году в России и в мире был экономический кризис. Поэтому изучение данной зависимости по-прежнему остаётся актуальным.

Анализ темы проводится с помощью эконометрических методов по данным Федеральной службы государственной статистики РФ.

Глава 1. Сбор данных и отбор факторов

Для проведения исследования были отобраны следующие факторы, влияющие на среднемесячную заработную плату работников (y) в 2014 году:- численность населения за 2014 г;- численность экономически активного населения в 2014 г., тыс. человек;- ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г;- объём инвестиций в основной капитал в 2014 г., млн. руб.

Для исследования использовались данные, выражающие вариацию факторов и результирующего признака по регионом Центрального и Северо-Западного федеральных округов. Не были задействованы данные по двум городам (Москва и Санкт-Петербург), а также по Московской области. Это объясняется тем, что наблюдается серьёзное различие в экономическом развитии и заработной платы, которое отражает поле корреляции.

В исследовании использовались данные Федеральной службы государственной статистики, а также данные из единой межведомственной информационно-статистической системы (ЕМИСС) за 2014 год.

Далее будет изучено влияние каждого из приведённых выше факторов на среднемесячную заработную плату работников в отдельности и влияние всех этих факторов.

Глава 2. Исследование влияния отельных факторов

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

2.1. Исследование влияния численности населения на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и численности населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 1).

Таблица 1

Среднемесячная номинальная заработная плата и численность населения по регионам

Регион	Численность населения за 2014 г. (x1)	Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y)
Белгородская область	1 544 108	29821
Брянская область	1 242 599	24668
Владимирская область	1 413 321	27398
Воронежская область	2 328 959	30172
Ивановская область	1 043 130	26508
Калужская область	1 004 544	34752
Костромская область	656 389	25560
Курская область	1 118 915	29183
Липецкая область	1 159 866	30870
Орловская область	769 980	27196
Рязанская область	1 140 844	29678
Смоленская область	967 896	27282
Тамбовская область	1 068 934	27302
Тверская область	1 325 249	30722
Тульская область	1 521 497	31700
Ярославская область	1 271 766	31575
Республика Карелия	634 402	35726
Республика Коми	872 057	49734
Архангельская область	1 191 785	45634
Ненецкий автономный округ	43 025	41980
Вологодская область	1 193 371	35732
Калининградская область	963 128	35577
Ленинградская область	1 763 924	38448
Мурманская область	771 058	57845
Новгородская область	622 430	31221
Псковская область	656 561	25694

Для изучения влияния фактора X1 на результирующий признак Y сначала нужно построить поле корреляции.

«Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X1 и Y имеется обратная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см табл. 2).

Таблица 2

Модель парной линейной регрессии

	b	a
	-0,004	37004,448
mb — стандартная ошибка коэфф., b	0,004	4272,704	mа — стандартная ошибка коэфф., а
R^2 — коэфф., детерминации	0,038	8014,903	Sост. — оценка стандартного отклонения остатков
F статистика	0,940	24,000	Число степеней свободы n-2
Регрессионная сумма квадратов	60367425,19	1541728139	Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=37004,448-0,004х) и экономическая интерпретация коэффициентов линейной регрессии: =-0,004 показывает, что при увеличении численности населения на одного человека среднемесячная заработная плата уменьшается на 0,4 копейки.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис.1).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.

Нужна помощь в написании курсовой?

Подробнее

Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=0,29<Fkp=3,43, значит гетероскедастичность отсутствует. Так как |tr|= 1,82<tkp=2,06, то предположение подтвердилось, в модели присутствует гомоскедастичность.

Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,45 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.

Мною была найдена величина средней ошибки аппроксимации =16,56% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 0,939; F-критическое=4,259.

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 3).

Таблица 3

Показатели значимости коэффициентов

ta	8,660661979	>		2,063898547	коэффициент а значим
tb	-0,969400072	<	tкр	2,063898547	коэффициент b не значим
tr	-0,969400072	<		2,063898547	коэффициент r не значим

Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:

Значение параметра α с вероятностью 95% будет находиться в интервале [28186,01978; 45822,87636].

Значение параметра β интерпретировать невозможно, поскольку границы разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 3264200,5. А прогнозное значение показателя у^р равно 25449,96.

Стандартная ошибка прогноза функции регрессии получилась равной 8100,11, а ошибка индивидуального значения — 11395,19. Так же вычислен доверительный интервал параметр для условного математического ожидания: [8732,150812; 42167,77998] и доверительный интервал для индивидуального значения [1931,433686; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Нужна помощь в написании курсовой?

Цена курсовой

Коэффициент корреляции rxy =-0,19. Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.

Коэффициент детерминации R2=0,038, говорит о том, что лишь 3,8% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности населения, а остальные 96,2% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.

2.2. Исследование влияния численности экономически активного населения на среднемесячную заработную плату работников по регионам.

Представим исходные данные о среднемесячной номинальной заработной плате и численности экономически активного населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 4).

Таблица 4

Среднемесячная номинальная заработная плата и численность экономически активного населения по регионам

Регион	Численность экономически активного населения в 2014 г., тыс. человек, (х2)	Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y)
Белгородская область	812,2	29821
Брянская область	627,1	24668
Владимирская область	746,5	27398
Воронежская область	1153,6	30172
Ивановская область	524,2	26508
Калужская область	541,6	34752
Костромская область	334,7	25560
Курская область	569,3	29183
Липецкая область	594,2	30870
Орловская область	394,8	27196
Рязанская область	544,4	29678
Смоленская область	545,5	27282
Тамбовская область	512,4	27302
Тверская область	712,3	30722
Тульская область	808,1	31700
Ярославская область	687,9	31575
Республика Карелия	328,1	35726
Республика Коми	500,1	49734
Архангельская область	631,1	45634
Ненецкий автономный округ	23,3	41980
Вологодская область	628,2	35732
Калининградская область	527,1	35577
Ленинградская область	962,2	38448
Мурманская область	468,3	57845
Новгородская область	336,4	31221
Псковская область	351,5	25694

Для изучения влияния фактора X2 на результирующий признак Y сначала нужно построить поле корреляциию

«Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X2 и Y имеется обратная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см. табл. 5).

Таблица 5

Модель парной линейной регрессии

	b	a
	-4,354	35642,530
mb — стандартная ошибка коэфф., b	7,235	4431,748	mа — стандартная ошибка коэфф., а
R^2 — коэфф., детерминации	0,015	8109,345	Sост. — оценка стандартного отклонения остатков
F статистика	0,362	24,000	Число степеней свободы n-2
Регрессионная сумма квадратов	23820146,83	1578275417	Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=35642,448-4,354x)и экономическая интерпретация коэффициентов линейной регрессии: =-4,354 показывает, что при увеличении численности экономически активного населения на одного человека, среднемесячная заработная плата. уменьшается на 4,3 рубля.

Нужна помощь в написании курсовой?

Цена курсовой

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).

Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гомоскедастичность, так как Fg=0,27 < Fkp=3,43. Однако тест Спирмена показал противоположный результат, поскольку tr=2,105 > tкрит=2,063 в модели присутствует гетероскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.

Кроме того, Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=1,56 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо — автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.

Мною была найдена величина средней ошибки аппроксимации =16,69% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 0,362; F-критическое=4,259.

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Таблица 6

Показатели значимости коэффициентов

ta	8,042544481	>		2,063898547	коэффициент а значим
tb	-0,601847474	<	tкр	2,063898547	коэффициент b не значим
tr	-0,601847474	<		2,063898547	коэффициент r не значим

Значение параметра α с вероятностью 95% будет находиться в интервале [26495,85194; 44789,20832].

Значение параметра β интерпретировать невозможно, поскольку границы разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 1715,20. А прогнозное значение показателя у^р равно 28173,80.

Нужна помощь в написании курсовой?

Цена курсовой

Стандартная ошибка прогноза функции регрессии получилась равной 8424,58, а ошибка индивидуального значения — 11693,38. Так же вычислен доверительный интервал параметр для условного математического ожидания: [10786,30456; 45561,29799] и доверительный интервал для индивидуального значения [4039,847983; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =-0,12. Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.

Коэффициент детерминации R2=0,015, говорит о том, что лишь 1,5% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности экономически активного населения, а остальные 98,5% факторами не включёнными в модель

2.3. Исследование влияния ВРП (на душу населения) на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и валовом региональном продукте на душу населения за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 7).

Таблица 7

Среднемесячная номинальная заработная плата и ВРП на душу населения

Регион	ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г. (х3)	Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y)
Белгородская область	619,4	29821
Брянская область	243,0	24668
Владимирская область	327,9	27398
Воронежская область	709,1	30172
Ивановская область	26508
Калужская область	324,9	34752
Костромская область	146,3	25560
Курская область	297,4	29183
Липецкая область	395,7	30870
Орловская область	179,7	27196
Рязанская область	297,3	29678
Смоленская область	234,7	27282
Тамбовская область	275,8	27302
Тверская область	307,4	30722
Тульская область	408,5	31700
Ярославская область	388,1	31575
Республика Карелия	185,6	35726
Республика Коми	480,9	49734
Архангельская область	356,4	45634
Ненецкий автономный округ	183,7	41980
Вологодская область	388,4	35732
Калининградская область	306,2	35577
Ленинградская область	714,0	38448
Мурманская область	320,3	57845
Новгородская область	205,9	31221
Псковская область	121,3	25694

Для изучения влияния фактора X3 на результирующий признак Y сначала нужно построить поле корреляции.

«Поле корреляции»

Из вида поля корреляции можно сделать предположение, что между X3 и Y имеется прямолинейная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии ( см. табл. 8).

Таблица 8

Нужна помощь в написании курсовой?

Цена курсовой

Модель парной линейной регрессии

	b	a
	12,414	29061,719
mb — стандартная ошибка коэфф., b	9,992	3641,100	mа — стандартная ошибка коэфф., а
R^2 — коэфф., детерминации	0,060	7919,635	Sост. — оценка стандартного отклонения остатков
F статистика	1,543	24,000	Число степеней свободы n-2
Регрессионная сумма квадратов	96800688,73	1505294875	Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=29061,719+12,414x) и экономическая интерпретация коэффициентов линейной регрессии: =12,414 показывает, что при увеличении ВРП на1 млрд. рублей, среднемесячная заработная плата увеличивается на 12,414 рублей.

Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).

Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=1,78<Fkp=3,43, значит гетероскедастичность отсутствует. Так как |tr|= 0,35<tkp=2,06, то предположение подтвердилось, в модели присутствует гомоскедастичность.

Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=2,05 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо — автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.

Мною была найдена величина средней ошибки аппроксимации =16,11% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР (5%;1;24).

В результате получаем: статистика= 1,543; F-критическое=4,259

Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.

Таблица 9

Показатели значимости коэффициентов

ta	7,981575687	>		2,063898547	коэффициент а значим
tb	1,242321648	<	tкр	2,063898547	коэффициент b не значим
tr	1,242321648	<		2,063898547	коэффициент r не значим

Значение параметра α с вероятностью 95% будет находиться в интервале [21546,85673; 36576,58047].

Нужна помощь в написании курсовой?

Подробнее

Значение параметра β интерпретировать невозможно, поскольку границы разного знака.

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 988,71. А прогнозное значение показателя у^р равно 41335,42.

Стандартная ошибка прогноза функции регрессии получилась равной 6767,08, а ошибка индивидуального значения — 10417,008. Так же вычислен доверительный интервал параметр для условного математического ожидания: [27368,84514; 55302,00355] и доверительный интервал для индивидуального значения [19835,77; 48968,49].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =0,24. Следовательно, по шкале Чеддока наблюдается слабая прямо-линейная зависимость.

Коэффициент детерминации R2=0,06, говорит о том, что 6% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением ВРП, а остальные 74% факторами, не включёнными в модель.

2.4 Исследование влияния объёма инвестиций в основной капитал на среднемесячную заработную плату работников по регионам

Представим исходные данные о среднемесячной номинальной заработной плате и объёме инвестиций в основной капитал за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 10).

Таблица 10

Среднемесячная номинальная заработная плата и объём инвестиций в основной капитал

Регион	Объём инвестиций в основной капитал в 2014 г. Млн руб (х4)	Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y)
Белгородская область	120390,6	29821
Брянская область	66825,4	24668
Владимирская область	75667	27398
Воронежская область	243259,8	30172
Ивановская область	29803,3	26508
Калужская область	99785,7	34752
Костромская область	27512,8	25560
Курская область	71743	29183
Липецкая область	110101,1	30870
Орловская область	44931,1	27196
Рязанская область	58209,9	29678
Смоленская область	56747,1	27282
Тамбовская область	112713,1	27302
Тверская область	74491	30722
Тульская область	95434,7	31700
Ярославская область	76491,8	31575
Республика Карелия	30834,6	35726
Республика Коми	207421,6	49734
Архангельская область	148128,8	45634
Ненецкий автономный округ	84248	41980
Вологодская область	63880,9	35732
Калининградская область	64891,5	35577
Ленинградская область	58501,1	38448
Мурманская область	178777,4	57845
Новгородская область	72254,8	31221
Псковская область	64922,6	25694

Для изучения влияния фактора X4 на результирующий признак Y сначала нужно построить поле корреляции.

«Поле корреляции»

При рассмотрении графика сложно точно предположить, какой вид зависимости существует между переменными. Однако мы можем проанализировать следующие виды зависимостей:

Нужна помощь в написании курсовой?

Подробнее

Линейная зависимость;

Квадратичная зависимость;

Гиперболическая зависимость;

Степенная зависимость;

Показательная зависимость;

Экспоненциальная зависимость;

Логарифмическая зависимость.

Каждая из рассмотреннчых моделей получилась значимой по критерию Фишера, поскольку Fстат>Fкр. Для того, чтобы выбрать качественную модель, необходимо использовать следующие критерии:

Коэффициент детерминации R^2. С помощью него можно оценить тесноту связи, и чем R^2 ближе к единице, тем лучше регрессия описывает зависимость между зависимой и объясняющими переменными;

Средняя ошибка аппроксимации А. Лучше та модель, у которой наименьшая ошибка аппроксимации. На практике значение этой ошибки в пределах 5-7 % говорит о хорошем соответствии модели выбранным данным;

Стандартная ошибка регрессии Sост. Чем меньше этот показатель, тем лучше построенная модель;

Метод абсолютных отклонений. Лучшая модель та, которая имеет наименьший показатель МАD.

Для выбора лучшей модели рассмотрим таблицу сравнения критериев:

Таблица 11

Нужна помощь в написании курсовой?

Заказать курсовую

Таблица сравнения критериев

Тип модели	R^2	A	Sost	MAD
1. Линейная	0,290	15,00%	6886,262	5133,171311
2. Квадратичная	0,314352636	14,86%	6910,837742	5103,553931
3. Гиперболическая	0,177	16,49%	7413,272	5682,178706
4. Степенная	0,262	14,50%	0,188	5112,279771
5. Показательная	0,2709444	14,46%	0,1866305	5057,083385
6. Экспоненциальная	0,2709444	14,46%	0,1866305	5057,083385
7. Логарифмическая	0,2686112	15,46%	6987,3537596	5314,151177

В результате сравнения полученных критериев наилучшей моделью является показательная и/или экспоненциальная. Она лучше аппроксимирует выборочные данные и имеет более точный прогноз. Однако для исследования факторов X3 и Y была выбрана линейная модель из-за ее простоты. Поэтому построим модель парно-линейной регрессии и исследуем её качество.

С помощью функции ЛИНЕЙН из категории «Статистические» строим модель парной линейной регрессии (см. табл. 12).

Таблица 12 инвестиция регрессия заработный капитал

Модель парной линейной регрессии

	b	a
	0,081	25855,921
mb — стандартная ошибка коэфф., b	0,026	2695,486	mа — стандартная ошибка коэфф., а
R^2 — коэфф., детерминации	0,290	6886,262	Sост. — оценка стандартного отклонения остатков
F статистика	9,785	24,000	Число степеней свободы n-2
Регрессионная сумма квадратов	464001142,5	1138094422	Остаточная сумма квадратов

По найденной таблице было записано уравнение выборочной регрессии (y^=25855,921+0,081x) и экономическая интерпретация коэффициентов линейной регрессии:

Коэффициент b=0,081 показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., среднемесячная заработная плата увеличивается на 8,1 коп.

Коэффициент a=25855,921 показывает, что при отсутствии инвестиций в основной капитал (X4=0), среднемесячная заработная плата равна 25855,921 рубл.

Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 4).

Из вида поля корреляции можно сделать предположение, что гомоскедастичность отсутствует, а присутствует гетероскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гетероскедастичность, так как Fg= 4,1 > Fkp= 3,4. Однако тест Спирмена показал противоположный результат, поскольку tr=1,95<tкрит=2,06 в модели присутствует гомоскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.

Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,39 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.

Мною была найдена величина средней ошибки аппроксимации =15,00% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные. Незначительно превышает 7 %, поэтому можно считать, что построенная модель является удовлетворительной.

Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).

В результате получаем: статистика= 9,784; F-критическое=4,259.

Нужна помощь в написании курсовой?

Подробнее

Так как Fстат.>Fкр., то модель значима в целом.

Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициенты а, b и r являются значимыми, т.к tа> tкр; tb>tкр и tr>tкр. (см. табл. 13).

Таблица 13

Показатели значимости коэффициентов

ta	9,592303964	>		2,063898547	коэффициент а значим
tb	3,128066653	>	tкр	2,063898547	коэффициент b значим
tr	3,128066653	>		2,063898547	коэффициент r значим

Значение параметра а показывает, что при отсутствии инвестиций в основной капитал с вероятностью 0,95 среднемесячная заработная плата принимает значение в диапазоне [20292,7113; 31419,13052].

Значение параметра β показывает, что при увеличении инвестиций в основной капитал на 1 млн. рубл. с вероятностью 0,95 среднемесячная заработная плата увеличивается на значение в диапазоне [0,027606745; 0,134690429].

Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 269765,61. А прогнозное значение показателя у^р равно 47747,01. Стандартная ошибка прогноза функции регрессии получилась равной 4857,05, а ошибка индивидуального значения — 8426,83. Так же вычислен доверительный интервал параметр для условного математического ожидания: [37722,55356; 57771,48587] и доверительный интервал для индивидуального значения [30354,88429; 48968,49727].

Оценим тесноту связи с помощью показателей корреляции и детерминации.

Коэффициент корреляции rxy =0,53. Следовательно по шкале Чеддока между Х и У наблюдается заметная прямо-линейная зависимость.

Коэффициент детерминации R2=0,289, говорит о том, что 28,9% вариации (дисперсии, разброса) среднемесячной заработной платы. объясняется изменением численности населения, а остальные 71,1% факторами, не включёнными в модель.

Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, подходит для описания зависимой переменной. Поэтому данный фактор будет включён в модель множественной регрессии.

Глава 3 Исследование влияния совокупности факторов

3.1 Процедура отбора переменных в множественной линейной регрессии

Для того чтобы построить качественную модель множественной регрессии, необходимо провести пошаговую процедуру включения существенных переменных в анализируемую модель. Для этого вначале построим корреляционную матрицу, найдём коэффициенты корреляции между всеми парами объясняющих переменных и сделаем предположение о наличии или отсутствии мультиколлинеарности (см. табл. 14).

Таблица 14

Нужна помощь в написании курсовой?

Заказать курсовую

Корреляционная матрица

	rx1x2	rx1x3	rx1x4
1	0,99178466	0,796576625
0,99178466	1	0,822579317	0,393064873
0,796576625	0,822579317	1	0,594123616
0,380174721	0,393064873	0,594123616	1

Можно сделать предположение о наличие мультколлиниарности, поскольку между факторами x1 и x2, x1 и x3, x2 и x3 высокая взаимная зависимость(rxixj>0,7). Значит, не следует включать одновременно факторы в модель.

Для того, чтобы определить, какой из факторов связан с Y в большей степени и в какой последовательности следует включать факторы в модель, необходимо построить скорректированную корреляционную матрицу (см. табл. 15)

Таблица 15

Скорректированная корреляционная матрица

	y	ryx1	ryx2	ryx3	ryx4
y	1	-0,194114115	-0,121934895	0,245807435	0,538164834
x1	-0,194114115	1	0,99178466	0,796576625	0,380174721
x2	-0,121934895	0,99178466	1	0,822579317	0,393064873
x3	0,245807435	0,796576625	0,822579317	1	0,594123616
x4	0,538164834	0,380174721	0,393064873	0,594123616	1

Исходя из полученных данных мы можем сделать вывод, что первым в модель следует включать фактор х4 (объём инвестиций в основной капитал), так как он имеет самый высокий коэффициент корреляции с признаком у, затем фактор х3,х1,х2.

Следующим шагом необходимо проверить целесообразность включения фактора х3 (валовый региональный продукт) в модель ух4, используя частный критерий Фишера.

Так как частный критерий Фишера равен 0,28, а табличное значение 4,28, то включение данного фактора в модель yx4 нецелесообразно.

Аналогично с фактором х1 (численность населения), где Fч=8,15 > Fкр=4,28. Из этого следует, что фактор х1 целесообразно включать в модель ух4.

Последний фактор х2 (численность экономически активного населения) включать в модель целесообразно, т.к. Fч=5,23> Fкр=4,28.

Поскольку факторы х1 и х2 в модель yx4 включать целесообразно, проверим целесообразность включения фактора х1 в модель ух2х4.

Получилось следующее: Fч=19,49>Fкр=4,3, значит включение переменной х1 оправдано.

Таким образом, исключив нецелесообразный фактор х3, можно приступить к построению множественной линейной регрессии х1, х2, x4.

3.2 Построение множественной регрессии

Нужна помощь в написании курсовой?

Цена курсовой

Для построения множественной регрессии нужно исследовать влияние таких факторов, как:- численность населения за 2014 г;- численность экономически активного населения в 2014 г., тыс. человек;- объём инвестиций в основной капитал в 2014 г., млн. руб.

Объясняемым фактором по-прежнему является Y — среднемесячная заработная плата работников за 2014 год. Исходные данные представлены выборкой объема n=26.

С помощью функции ЛИНЕЙН из категории «Статистические» построим модель множественной регрессии (см. табл. 16):

Таблица 16

Модель множественной регрессии

b4	b2	b1	a
0,097476688	131,4519007	-0,074594338	30395,69181
0,019434042	33,27883906	0,016894172	2698,538067
0,693103801	4727,468281	#Н/Д	#Н/Д
16,56182519	22	#Н/Д	#Н/Д
1110418525	491677039,6	#Н/Д	#Н/Д

Получим уравнение регрессии: y^=a+b1x1+b2x2 +b4x4, то есть y^= 30395-0,07х1+131,45х2+0,09х4

Дадим экономическую интерпретацию коэффициентов множественной регрессии:

а — показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата составит 30 395 руб.;- показывает, что при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах.- показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах.- показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах.

Проверим значимость уравнения множественной линейной регрессии в целом по критерию Фишера:

Fстатистика

16,56182519

Fкрит

3,049125006

Нужна помощь в написании курсовой?

Цена курсовой

Поскольку Fстат.>Fкрит., значит уравнение регрессии значимо в целом.

Проверим значимость коэффициентов множественной линейной регрессии по критерию Стьюдента при уровне значимости 5% (см. табл. 17):

Таблица 17

Показатели значимости коэффициентов множественной регрессии

ta	11,26376247	>			а значим
tb2	-4,415388812	>	tкр	2,073873058	b1 значим
tb3	3,950014616	>			b2 значим
tb4	5,015770066	>			b3 значим

Все факторы значимы, из этого следует, что их можно использовать для дальнейшего исследования.

Для статистически значимых коэффициентов были построены доверительные интервалы (см. табл. 18):

Таблица 18

Доверительные интервалы

α	24799,26641	35992,1172
β1	-0,109630706	-0,03955797
β2	62,43581295	200,4679884
β4	0,057172951	0,137780424

Дадим их экономическую интерпретацию:

α — показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата изменяется в пределах [24799,3; 35992,1] с вероятностью 95%.

β1 — показывает, что при увеличении численности населения на 1 человека, средняя заработная плата изменяется в пределах [-0,109; -0,039] с вероятностью 95%

β2 — показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата изменяется в пределах [62,435; 200,467] с вероятностью 95%

β4 — показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата изменяется в пределах [0,057; 0,137] с вероятностью 95%

Говоря о качестве построенной регрессии следует отметить, что модель имеет неплохую объясняющую способность, поскольку коэффициент детерминации R^2= 0,69 показывает, что 69% изменения средней заработной платы объясняется изменениями факторов, включенных в модель, а остальные 31% не включенными факторами.

Нужна помощь в написании курсовой?

Заказать курсовую

Так как R² близок к 1, уравнение регрессии неплохо аппроксимирует эмпирические данные.

Средняя ошибка аппроксимации (A=11,10% > 10%) незначительно превышает 10%, поэтому можем считать, что построенная модель является удовлетворительной.

Был вычислен скорректированный коэффициент детерминации: R^2adj=0,65.

В ходе исследования были найдены стандартизованные коэффициенты регрессии b’i и частные средние коэффициенты эластичности Эi. ‘=-4,09;’=3,68;’=0,64.

Поскольку b1’ больше, чем все остальные стандартизированные коэффициенты, можем считать, что фактор x1 (численность населения) больше влияет на y (среднемесячная заработная плата), чем другие факторы (x2,х4)

Средней коэффициент эластичности Эср1=-2,44 показывает, что при увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. Средней коэффициент эластичности Эср2=2,26 показывает, что при увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. Средней коэффициент эластичности Эср4=0,26 показывает, что при увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.

Чтобы определить наличие мультиколлинеарности в данной модели, необходимо построить матрицу выборочных коэффициентов корреляции Q с помощью функции КОРЕЛЛ (см. табл. 19).

Таблица 19

Матрица выборочных коэффициентов корреляции Q

		rx1х2	rx1х4
	1	0,99178466	0,380174721
rx1х2	0,99178466	1	0,393064873	rx2х4
	0,380174721	0,393064873	1
	rx1х4	rx2х4

Проанализировав полученную матрицу, можно предположить, что между факторами х1 и х2 существует мультиколлинеарность, так как rx1x2 больше 0,7.

Необходимо проанализировать частные коэффициенты детерминации, которые были получены в результате возведения в квадрат частных коэффициентов корреляции:^2yx1 = 0,47 показывает, что на 47 % изменение средней заработной платы объясняется изменением численности населения, а оставшиеся 53 % — факторами, не включёнными в модель.^2yx2 =0,41 показывает, что на 41 % изменение средней заработной платы объясняется изменением численности экономически активного населения, а оставшиеся 59 % — факторами, не включёнными в модель.^2yx4 =0,53 показывает, что на 53% изменение средней заработной платы объясняется изменением объёма инвестиций в основной капитал, а оставшиеся 47 % — факторами, не включёнными в модель.

В результате проверки значимости частных коэффициентов корреляции было выявлено, что все коэффициенты значимы, так как tr>tкр по модулю.

tryx1/x2x4	-4,415388812
tryx2/x1x4	3,950014616
tryx4/x1x2	5,015770066
tкр(5%, 22)=	2,073873058

Чтобы убедиться в наличии мультиколлинеарности вычислим определитель матрицы =1,52374E+29. По этому критерию мультиколлиниарность отсутствует, поскольку определитель матрицы не равен нулю.

Таким образом, при построении множественной модели не удалось полностью избежать мультиколенниарность , поскольку между факторами х1 и х2 она существует, так как rx1x2 больше 0,7. Поэтому, необходимо построить модель, состоящую из двух факторов, х2 и х4. О том, какая модель является лучшей будет сказано в заключение.

Заключение

Нужна помощь в написании курсовой?

Заказать курсовую

Во время проведения исследования была выявлена и изучена зависимость каждого фактора на результирующий признак как в отдельности, так и в совокупности. Для этого были построены четыре парные линейные регрессии и две модели множественной регрессии.

Проведённое исследование показало, что значимыми можно признать не все построенные модели. Модель, отражающая зависимость среднемесячной номинальной заработной платы от численности населения, а также модель, отражающая зависимость среднемесячной номинальной заработной платы от численности экономически активного населения и модель, отражающая зависимость среднемесячной номинальной заработной платы от валового регионального продукта являются незначимыми. Модель, отражающая зависимость среднемесячной номинальной заработной платы от объёма инвестиций в основной капитал значима.

Для того чтобы построить качественную множественную регрессию, необходимо, во-первых, проверить отсутствие или присутствие мультиколлинеарности в модели, во-вторых проверить целесообразность включения фактора хi в модель, используя частный критерий Фишера. Построив корреляционную матрицу, обнаружилось, что между факторами x1x2, x1x3, x2x3 высокая взаимная зависимость, а значит можно сделать предположение о наличие мультколлиниарности. Это говорит о том, что не следует включать одновременно факторы в модель. Поскольку фактор х4 имеет самый высокий коэффициент корреляции с признаком у, значит его следует включить в модель первым, а затем фактор х3,х1,х2. Как оказалось не все факторы можно включать в модель множественной регрессии. Включение фактора х3 в модель ух4 нецелесообразно, поскольку Fч=0,27<Fкр=4,27. Поэтому фактор х3 был исключён из модели. Сделав проверку включения факторов х1 в модель ух4, а также х2 в модель ух4, а затем х1 в модель ух2х4, оказалось, что включение всех этих факторов целесообразно. Поэтому для исследования была построена модель множественной регрессии y^=a+b1x1+b2x2+b4x4 или y^=30395-0,07х1+131,45х2+0,09х4.

Полученной модели можно дать экономическую интерпретацию: при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах; при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах; при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах. Коэффициент а интерпретировать невозможно, так как тяжело представить регион, где не существует людей, способных и желающих работать и где нет инвестиций в основной капитал.

Анализ данной модели установил, что 69% изменения средней заработной платы в 2014 году объясняется изменением численности населения, численности экономически активного населения и объёма инвестиций в основной капитал. При увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. При увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. При увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.

Данная модель значима в целом по критерию Фишера, с удовлетворительной ошибкой аппроксимации и достаточно большим коэффициентов детерминации, т.е. в целом пригодной для прогнозирования. Однако между факторами х1 и х2 существует мультиколлинеарность в стохастической форме. Определитель матрицы хоть и отличен от нуля, но очень мал. Однако стандартные ошибки коэффициентов регрессии получились небольшими, и коэффициенты получились значимы по t-критерию. Несмотря на то, что свойства несмещённости и эффективности оценок остаются в силе, мультиколлинеарность в любом случае затрудняет разделение влияния объясняющих переменных на поведение зависимой переменной и делает оценки коэффициентов регрессии ненадёжными.

Но следует иметь в виду, что у нескольких факторов, а именно х2 и х4, нельзя точно определить присутствует гомоскедастичность или гетероскедастичность, так как результаты тестов Голдфелда-Квандта и Спирмена противоречат друг другу. Скорее всего, неточность связана с небольшим объёмом выборки. Кроме того, у факторов х1 и х4 автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения. Все этого говорит о том, что в построенной модели возможны ошибки, которые следует принять к сведению при построении прогнозов.

Чтобы уменьшить наличие мультиколлинеарности было решено исключить из модели y^=a+b1x1+b2x2+b4x4 переменную х1.

Была построена множественная регрессия y^=a+b2x2+b4x4 или y^=31806-14,08х2+0,104х4.

Несмотря на отсутствие мультиколлинеарности данная модель, по -моему мнению, получилась хуже.

Сделаем сводную таблицу и сравним модель парной регрессии, которая значима, и модели множественной регрессии по наиболее существенным критериям (см. табл. 20):

Таблица 20

Сравнение моделей

Тип модели	R^2	R^2adj	Sост	MAD	A
Парная y^=a+bx4	0,289621389	0,26002228	6886,261751	5133,171311	15,00%
y^=a+b1x1+b2x2+b4x4	0,693103801	0,651254319	4727,468281	3603,473623	11,10%
y^=a+b2x2+b4x4	0,421142735	0,37080732	6349,887562	4626,062355	13,89%

Как мы видим, по большинству критериев лучшая модель — множественная модель с тремя факторами y^=a+b1x1+b2x2+b4x4. Данная модель в большей степени влияет на величину заработной платы, чем остальные. Скорее всего это связано с тем, что сами работники, их количество и инвестиции в основной капитал заставляют работодателей изменять величину заработной платы.

Нужна помощь в написании курсовой?

Подробнее

В заключении хотелось бы отметить, что данный вопрос требует особого внимания и дальнейшего изучения, так как заработная плата играет значительную роль в развитии экономики, государства и жизни каждого человека. Дальнейшее изучение данного вопроса поможет в построении прогнозов и принятии целесообразных решений, а возможно приведёт к более качественной модели.

Список использованных источников

Евсеев Е.А., Буре В.М., Эконометрика: Учебник, Изд-во МБИ, 2007 г.

Тарашнина С. И., Панкратова Я.Б., Выполнение курсовой работы по эконометрике: учебно-методическое пособие, 2007 г.

Курс эконометрика: электронный ресурс URL: http://eos.ibi.spb.ru/course/view.php?id=608

Сайт федеральной статистики: электронный ресурс URL: <http://www.gks.ru/>

Федеральная служба государственной статистики (Росстат): электронный ресурс URL: http://government.ru/department/250/events/

Предыдущий пример

Следующий пример