Не отобразилась форма расчета стоимости? Переходи по ссылке

Не отобразилась форма расчета стоимости? Переходи по ссылке

Курсовая работа на тему «Статистическая обработка данных»

Целью данной курсовой работы является изучение и, как в следствии, расширение знаний о математической статистике, ознакомление с методами обработки экспериментального материала, с целью получения надежных выводов, ознакомление с методикой применения статистических критериев для проверки гипотез.

Содержание

Введение

1. Постановка задачи. Цель работы. Исходные данные

. Вычисление основных выборочных характеристик по заданной выборке

. Результаты вычисления интервальных оценок для математического ожидания и дисперсии

. Результаты ранжирования выборочных данных и вычисление моды и медианы

. Параметрическая оценка функции плотности распределения

. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона

Заключение

Список использованной литературы

интервальный дисперсия выборочный данные

Введение

Целью данной курсовой работы является изучение и, как в следствии, расширение знаний о математической статистике, ознакомление с методами обработки экспериментального материала, с целью получения надежных выводов, ознакомление с методикой применения статистических критериев для проверки гипотез.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

. Постановка задачи. Цель работы. Исходные данные

1) Задача:

По выборке объёма N провести статистическую обработку результатов эксперимента.

) Цель работы:

Изучить и усвоить основные понятия математической статистики. Овладеть методикой статистического оценивания числовых характеристик случайной величины и нормального закона распределения. Ознакомиться с методикой применения статистических критериев для проверки гипотез.

) Исходные данные.

Проведен эксперимент, в результате которого была получена выборка N = 60, которая соответствует случайной величине, распределённой по нормальному закону. Данная выборка представлена в таблице 1.1

Таблица 1.1

10.2836 10.7148 9.4963 12.8971 10.9190 12.8067
14.0510 7.3201 7.9052 15.2359 10.6512 9.6341
11.0156 12.4240 8.9727 12.1429 13.1025 11.9252
11.8667 8.3636 10.2223 9.1232 12.2658 11.1741
10.8028 10.4434 11.2314  9.6948 11.0725 8.3374
12.4564 9.5759 8.7116 14.2939 9.5319 13.1150
11.8891 17.3345 6.9275 13.3734 13.4795 13.8429
12.1071 11.7579 14.8285 9.5450 12.1039
12.9304 7.3669 12.4592 12.3466 11.8461 11.5607
10.7288 15.9654 16.1488 9.8759 12.9522 12.5015

2. Вычисление основных выборочных характеристик по заданной выборке среднее арифметическое случайной величины Х (N = 60)

) среднее линейное отклонение

) дисперсия случайной величины Х

) несмещенная оценка дисперсии

5) среднеквадратическое отклонение

=

6) несмещенная выборочная оценка для среднеквадратического отклонения

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

7) коэффициент вариации

) коэффициент асимметрии случайной величины Х

9) коэффициент эксцесса случайной величины Х

10) вариационный размах

= Xmax — Xmin = 17,3345- 6,9275= 10,407

На основании полученных вычислений можно сделать следующие выводы:

Выполняется необходимое условие для того, чтобы выборка имела нормальный закон распределения, т.к. для коэффициента вариации V выполняется неравенство:

V =  < 33%

Отсюда следует, что не все выборочные значения случайной величины Х положительны, что мы и видим в исходных данных.

Для нормального распределения коэффициенты асимметрии и эксцесса должны быть равны нулю, т.е. As = E = 0.

По результатам вычисления асимметрия близка к нулю и составляет As = 0,22481644

В нашем случае асимметрия положительна, это значит, что «длинная часть» кривой расположена справа от математического ожидания.

Коэффициент эксцесса так же как и коэффициент асимметрии близок к нулю, так как Е = . Он отрицательный, значит, кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая.

В связи с этим необходимы дополнительные исследования для выяснения степени близости распределения выборки к нормальному распределению.

3.Результаты вычисления интервальных оценок для математического ожидания и дисперсии

Для вычисления интервальной оценки математического ожидания воспользуемся формулой:

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Подробнее

Где а = М[X] — математическое ожидание

N — 1 = V = 59 — число степеней свободы

tv;p — величина, численно равная половине интервала, в который может попасть случайная величина , имеющая определенный закон распределения при заданной доверительной вероятности Р и заданном числе степеней свободы V.

Подставляем в формулу вычисленные ранее значения ,  и N.

Задаемся доверительной вероятностью:

Р1 = 0,95 Р2 = 0,99

Для каждого значения Рi (i=1,2) находим по таблице значения t59;p и вычисляем два варианта интервальных оценок для математического ожидания.

При Р1 = 0,95 t59;0,95 = 2

При Р2 = 0,99 t59;0,95 = 2,66

Для интервальной оценки дисперсии существуют неравенства:

Поставляем в неравенство известные значения  и N, получим неравенство, в котором неизвестны  и .

Задаваясь доверительной вероятностью Рi (или уровнем значимости а) вычисляем значения  и . Используем эти два значения и степень свободы V = N — 1 = 59, по таблице находим  и .

 =  =   =  =

 и  — это границы интервала, в который попадает случайная величина Х, имеющая  (хи-квадрат) распределение вероятности Рi и заданной степени свободы V (V=59).

Для Р1 = 0,95  и

находим по таблице:  =  = 40,4817

 =  = 83,2976

Подставляя в неравенства  и  и, вычисляя, получим интервальную оценку.

При Р2 = 0,99  и

 =  = 91,9517

Поставляя в неравенства  и  , и вычисляя, получим интервальную оценку.

Для интервальной оценки среднеквадратического отклонения имеем:

При Р1 = 0,95

При Р2 = 0,99

4. Результаты ранжирования выборочных данных и вычисление моды и медианы

Используя исходные данные, записываем все заданные значения выборки в виде неубывающей последовательности значений случайной величины Х, которые представлены в таблице 4.1.

Таблица 4.1

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

Ранжированный ряд

6,9275 9,5319 10,6512 11,7579 12,4240 13,3734
7,3201 9,5450 10,7148 11,8461 12,4564 13,4795
7,3669 9,5759 10,7288 11,8667 12,4592 13,8429
7,9052 9,6341 10,8028 11,8891 12,5015 14,0510
8,3374 9,6948 10,9190 11,9252 12,8067 14,2939
8,3636 9,8759 11,0156 12,1039 12,8971 14,8285
8,7116 10,1539 11,0725 12,1071 12,9304 15,2359
8,9727 10,2223 11,1741 12,1429 12,9522 15,9654
9,1232 10,2836 11,2314 12,2658 13,1025 16,1488
9,4963 10,4434 11,5607 13,1150 17,3345

 

Интервал [6,9275; 17,3345], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.

По формуле Стерджеса длина частичного интервала равна:

Для удобства и простоты расчетов выбираем h = 1,5 и вычисляем последовательно границы интервалов.

За начало первого интервала принимаем значение:

Далее вычисляем границы интервалов.

 = 6,1775 + 1,5 = 7,6775

 = 7,6775 + 1,5 = 9,1775

 = 9,1775+ 1,5 = 10,6775

 = 10,1775+ 1,5 = 12,1775

 = 12,1775+ 1,5 = 13,6775

 = 13,6775+ 1,5 = 15,1775

 = 15,1775+ 1,5 = 16,6775

 = 16,6775+ 1,5 = 18,1775

Вычисление границ заканчивается, как только выполняется неравенство Xn > Xmax, то есть X8 = 18,1775> Xmax = 17,3345.

По результатам вычислений составляем таблицу. В первой графе таблицы помещаем частичные интервалы, во второй графе — середины интервалов, в третьей графе записано количество элементов выборки, попавших в каждый интервал — частоты, в четвертой графе записаны относительные частоты и в пятой графе записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности. Данная информация представлена в таблице 4.2.

Таблица 4.2

Значение выборочной функции и плотности

h ni3
[6,1775; 7,6775) 6,9275 3 0,05 0,033 33
[7,6775; 9,1775) 8,4275 6 0,1 0,067 67
[9,1775; 10,6775) 9,9275 12 0,2 0,133 133
[10,6775; 12,1775) 11,4275 17 0,283 0,189 189
[12,1775; 13,6775) 12,9275 14 0,233 0,156 156
[13,6775; 15,1775) 14,4275 4 0,067 0,044 44
[15,1775; 16,6775) 15,9275 3 0,05 0,033 33
[16,6775; 18,1775) 17,4275 1 0,016 0,011

 

По результатам вычислений функции плотности, представленной в таблице 4.2., можно сделать вывод, что мода имеет один локальный максимум в окрестности точки х = 11,4275 и с частотой по n = 17.

Оценку медианы находим, используя вариационный ряд:

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

Так как N = 2k, k = N / 2 = 60 / 2 = 30

Сравнение оценок медианы  и оценки математического ожидания  показывает, что они отличаются на 1,34 %.

. Параметрическая оценка функции плотности распределения

Исходя из гипотезы, что заданная выборка имеет нормальный закон распределения, найдем параметрическую оценку функции плотности, используя формулу для плотности распределения вероятности нормального закона:

Где  и  известны — они вычисляются по выборке.

= 2,1976676 = 11,4634

Значения этой функции вычисляются для середины частичных интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.

Для этого вычисляем значения  для i = 1,2,…, k, затем по таблице значений функций плотности стандартной нормальной величины находим значение .

 =0,0478

 =0,1539

 =0,3123

 =0,3989

 =0,3187

 =0,1604

 =0,0508

 =0,0101

Переходим к вычислению функции:

 0,022

 

 

 

Функция , вычисленная при заданных параметрах  и  в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.

Поэтому для определения теоретической частоты , распределенной по всей ширине интервала, эту функцию необходимо умножить на .

 где h = 1,5

 

 где N = 60

 

Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.2.

  

Из полученных результатов проведенных вычислений следует, что сумма вероятностей в интервале [6,1775; 18,1775) почти равна единице, а сумма всех частот равна 59,61. Данные результаты объясняются тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные.

Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Представленные в таблице 5.2 результаты вычислений показывают, что это условие выполняется не всегда. Поэтому все те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .

Таблица 5.1

0,0330,0670,1330,1890,1560,0440,0330,011
0,0220,070,1420,1820,1450,0730,0230,005

 

Рис. 1. График. Теоретическая и экспериментальная плотности вероятности.

Таблица 5.2

Результаты вычисления экспериментальных и теоретических вероятностей и частот

[xi-1; xi)
[6,1775; 7,6775) 3 6,9275 0,05 0,033 -2,064 0,022 0,033 1,98 2
[7,6775; 9,1775) 6 8,4275 0,1 0,067 -1,38 0,07 0,105 6,3 6
[9,1775; 10,6775) 12 9,9275 0,2 -0,7 0,142 0,213 12,78 13
[10,6775; 12,1775) 17 11,4275 0,283 0,189 -0,016 0,182 0,273 16,38 16
[12,1775; 13,6775) 14 12,9275 0,233 0,156 0,67 0,145 0,2175 13,05 13
[13,6775; 15,1775) 4 14,4275 0,067 0,044 1,35 0,073 0,1095 6,57 7
[15,1775; 16,6775) 3 15,9275 0,05 0,033 2,03 0,023 0,035 2,1 2
[16,6775; 18,1775) 1 17,4275 0,016 0,011 2,71 0,005 0,0075 0,45 1
Σ 0,999 0,9935 59,61

 

. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона

Для проверки гипотезы о нормальном распределении случайной величины Х сравнивают между собой экспериментальные и теоретические частоты по критерию Пирсона:

Статистика  имеет распределение с V = k — r — 1 степенями свободы, где k — число интервалов эмпирического распределения, r — число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:

V=k -3

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Заказать курсовую

В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:

N ≥ 50  ≥ 5 где i = 1,2,3…

Из результатов вычислений, приведенных в таблице 1.5.1, следует, что необходимое условие для применения критерия согласия Пирсона не выполнены, т.к. в некоторых группах < 5. Поэтому те группы вариационного ряда, для которых необходимое условие не выполняется, объединяют с соседними и, соответственно, уменьшают число групп, при этом частоты объединенных групп суммируются. Так объединяют все группы с частотами < 5 до тех пор, пока для каждой новой группы будет выполняться условие  ≥ 5.

При уменьшении числа групп для теоретических частот соответственно уменьшают и число групп для эмпирических частот. После объединения групп в формуле для числа степеней свободы V=k-3 в качестве k принимают новое число групп, полученное после объединения частот.

Результаты объединения интервалов и теоретических частот для таблицы 5.2 приведены соответственно в таблице 6.1.

Результаты вычислений из таблицы 6.1 можно использовать для проверки гипотезы о нормальном распределении с помощью критерия Пирсона.

Задаются уровнем значимости а =0,05 или одним из следующих значений: а1 = 0,01; а2 = 0,1; а3 = 0,005.

Вычисляют наблюдаемые значения критерия, используя экспериментальные и теоретические частоты из таблицы 6.1.

Для выборочного уровня значимости а = 0,05 по таблице распределения находят критические значения  при числе степеней свободы V= k-3, где k — число групп эмпирического распределения.

Сравниваем фактически наблюдаемое  с критическим , найденным по таблице, и принимаем решение:

если  > , то выдвинутая гипотезы о теоретическом законе распределения отвергается при заданном уровне значимости.

Если  < , то выдвинутая гипотеза о теоретическом законе распределения не противоречит выборке наблюдений при заданном уровне значимости, т.е. нет оснований отвергать гипотезу о нормальном распределении, т.к. эмпирические и теоретические частоты различаются незначительно (случайно).

Таблица 6.1

Результаты объединения интервалов и теоретических частот

[6,1775; 9,1775) 0,138 8,28 9 0,5184 0,0626
[9,1775; 10,6775) 0,213 12,78 12 0,6084 0,0476
[10,6775; 12,1775) 0,273 16,38 17 0,3844 0,0235
[12,1775; 13,6775) 0,2175 13,05 14 0,9025 0,0692
[13,6775; 18,1775) 0,152 9,12 8 1,2544 0,1375
Σ 0,9935 59,61 600,3404

 

При выбранном уровне значимости а = 0,05 и числе групп k = 5, число степеней свободы V = 2.

По таблице для а = 0,05 и V = 2 находим  = 5,99147.

В результате получаем:

Для = 0,3404, найденного по результатам вычислений приведенных в таблице 6.1, имеем:

= 0,3404<  = 5,99147

Из этого следует, что нет оснований отвергать гипотезу о нормальном распределении случайной величины Х.

Заключение

Статистические методы (методы, основанные на использовании математической статистики), являются эффективным инструментом сбора и анализа информации о качестве. Применение этих методов, не требует больших затрат и позволяет с заданной степенью точности и достоверностью судить о состоянии исследуемых явлений (объектов, процессов) в системе качества, прогнозировать и регулировать проблемы на всех этапах жизненного цикла продукции и на основе этого вырабатывать оптимальные управленческие решения.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Цена курсовой

Статистические методы контроля производства и качества продукции имеют ряд преимуществ перед другими методами:

— являются профилактическими;

— позволяют во многих случаях обоснованно перейти к выборочному контролю и тем самым снизить трудоемкость контрольных операций;

— создают условия для наглядного изображения динамики изменения качества продукции и настроенности процесса производства, что позволяет своевременно принимать меры к предупреждению брака не только контролерам, но и работникам цеха — рабочим, бригадирам, технологам, наладчикам, мастерам.

 

Список использованной литературы

1) Статистическая обработка результатов выборочного контроля: Метод.рек./Сост.: Ю. Г. Сильвестров: СибГИУ.- Новокузнецк, 2010 -41 с.

) Статистическое управление процессами при помощи контрольных карт: Метод.рек. /Сост.: Ю. Г. Сильвестров: ГОУ ВПО «СибГИУ». — Новокузнецк, 2014 — 17 с.

) ГОСТ Р 50779.42-99. Статистические методы. Контрольные карты Шухарта [Текст]. — : Издательство стандартов, 2007. — 36 с.

Средняя оценка 0 / 5. Количество оценок: 0

Поставьте оценку первым.

Сожалеем, что вы поставили низкую оценку!

Позвольте нам стать лучше!

Расскажите, как нам стать лучше?

683

Закажите такую же работу

Не отобразилась форма расчета стоимости? Переходи по ссылке

Не отобразилась форма расчета стоимости? Переходи по ссылке