«Корреляционно-регрессионный анализ»
Задание: по исходным данным построить уравнение регрессии, описывающее линейную зависимость между Х и Y, проверить его качество, сделать прогноз (прогнозное значение Х равно 110% от среднего Х) и выводы. Выводы, которые должны быть сделаны:
по коэффициенту регрессии
по коэффициенту корреляции
по коэффициенту детерминации
по t-статистике для a и b
по F-критерию
Предположим, что связь между поголовьем коров и продуктивностью линейная. Для подтверждения нашего предположения построим поле корреляции.
Рисунок 4 – Поле корреляции
По графику видно, что точки выстраиваются в некоторую прямую линию.
Для удобства дальнейших вычислений составим таблицу.
Таблица 7 – Расчет параметром регрессии
х
у ху х2
у2
, %
1 2 3 4 5 6 7 8 9 10
1 3372 3048 10277856 11370384 9290304 3579,894599 -531,89 282911,86 17,45
2 2187 2690 5883030 4782969 7236100 3833,726373 -1143,73 1308110,02 42,52
3 1405 3445 4840225 1974025 11868025 4001,233923 -556,23 309396,18 16,15
4 1471 3257 4791047 2163841 10608049 3987,096457 -730,10 533040,84 22,42
5 4865 3827 18618355 23668225 14645929 3260,087985 566,91 321389,23 14,81
6 2000 4573 9146000 4000000 20912329 3873,782526 699,22 488905,08 15,29
7 2849 4073 11603977 8116801 16589329 3691,923306 381,08 145219,45 9,36
8 3163 3582 11329866 10004569 12830724 3624,663241 -42,66 1820,15 1,19
9 1300 5421 7047300 1690000 29387241 4023,725346 1397,27 1952376,46 25,78
10 2284 3511 8019124 5216656 12327121 3812,948582 -301,95 91172,95 8,60
11 2322 3891 9034902 5391684 15139881 3804,808829 86,19 7428,92 2,22
12 2260 2893 6538180 5107600 8369449 3818,089479 -925,09 855790,54 31,98
13 1256 4562 5729872 1577536 20811844 4033,150323 528,85 279681,98 11,59
14 3023 3689 11151847 9138529 13608721 3654,651805 34,35 1179,80 0,93
15 1595 2956 4714820 2544025 8737936 3960,535158 -1004,54 1009090,88 33,98
16 1426 4761 6789186 2033476 22667121 3996,735638 764,26 584100,01 16,05
17 2752 4162 11453824 7573504 17322244 3712,701097 449,30 201869,50 10,80
18 3614 3695 13353730 13060996 13653025 3528,057225 166,94 27869,89 4,52
19 3288 3841 12629208 10810944 14753281 3597,887738 243,11 59103,57 6,33
20 1849 4006 7407094 3418801 16048036 3906,127334 99,87 9974,55 2,49
21 1309 4789 6268801 1713481 22934521 4021,79751 767,20 588599,66 16,02
22 2005 3139 6293695 4020025 9853321 3872,711506 -733,71 538332,57 23,37
23 1808 3006 5434848 3268864 9036036 3914,9097 -908,91 826116,84 30,24
24 2698 2880 7770240 7279204 8294400 3724,268114 -844,27 712788,65 29,31
25 4165 3071 12790715 17347225 9431041 3410,030805 -339,03 114941,89 11,04
26 3212 4319 13872628 10316944 18653761 3614,167244 704,83 496789,21 16,32
27 3134 3574 11200916 9821956 12773476 3630,875158 -56,88 3234,78 1,59
28 2238 4163 9316794 5008644 17330569 3822,801967 340,20 115734,70 8,17
29 1603 5498 8813294 2569609 30228004 3958,821525 1539,18 2369070,38 28,00
30 1211 3393 4108923 1466521 11512449 4042,789504 -649,79 422226,40 19,15
Итого 71664 113715 266230297 196457038 446854267 113715 0 14658266,95 477,66
Среднее значение 2388,8 3790,5 8874343,233 6548567,93 14895142,23 3790,5 – 523509,5 15,9
917,716 726,121 – – – – – – –
842202,493 527251,983 – – – – – – –
Рассчитаем параметры линейного уравнения парной регрессии .
-0,214
=4302,191
Получили уравнение: =4302,191-0,214х
Т.е. с увеличением поголовья коров на 1 голову продуктивность снижается на 0,214 кг
Уравнение линейной регрессии всегда дополняется показателем тесноты связи – линейным коэффициентом корреляции :
=-0,271
Близость коэффициента корреляции к 0 указывает на слабую обратную связь линейную связь между признаками.
Коэффициент детерминации rxy2=0.073 показывает, что уравнением регрессии объясняется 7.3% дисперсии результативного признака, а на долю прочих факторов приходится лишь 92.7%.
Оценим качество уравнения регрессии в целом с помощью -критерия Фишера. Сосчитаем фактическое значение -критерия:
=2.21
Табличное значение (k1=1, k2=28, ): Fтабл=4,2. Так как Fтабл>Fфакт, то признается статистическая незначимость уравнения в целом.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем -критерий Стьюдента и доверительные интервалы каждого из показателей. Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции
= 523509,5339
=0,182
Фактические значения -статистик:
=1,49 =11,7 =1,49
Табличное значение -критерия Стьюдента при и числе степеней свободы v=n-2=28 есть tтабл=2,05. Так как ta> tтабл то признаем статистическую значимость параметр а=3790,5 регрессии, показатель b=-0.214 и показатель тесноты связи незначимы. Рассчитаем доверительные интервалы для параметра а: а[3790.5-2.05368.4; 3790.5+2.05368.4]=[ 3035,3; 4545,7]
Средняя ошибка аппроксимации =15.9% говорит о низком качестве уравнения регрессии.
И, наконец, найдем прогнозное значение результативного фактора при значении признака-фактора, составляющем 110% от среднего уровня
=2627,68=2628
=4302,191-0,2142627.68=3739.3 кг
Значит, если поголовье составит 2628 голов, то продуктивность будет 3739,5 кг/гол.
Найдем доверительный интервал прогноза. Ошибка прогноза
=749,3
,
Доверительный интервал (3739,3-749,3; 3739,3+749,3)=( 2990; 4488,6) – разброс данных большой, прогноз не является статистически надежным.
Cidar 4.8
Практикующий юрист, второе образование - психолог, сфера интересов - управление персоналом, мотивация, арт-терапия, СПСС. Магистратура - управление персоналом с акцентом на стратегический менеджмент в гос и муниципальном управлении.
Готовые работы на продажу
Гарантия на работу 10 дней.
Построение уравнения регрессии. Решение задач
- Решение задач
- Статистика
- Выполнил: user198465
По приведенным в табл 4 1 данным построить уравнение многофакторной линейной регрессии
- Контрольная работа
- Микро-, макроэкономика
- Выполнил: vladmozdok
На странице представлен фрагмент
Уникализируй или напиши новое задание с помощью нейросети
Похожие работы
Определить сопротивление растеканию сложного заземления
Определить сопротивление растеканию сложного заземления, состоящего из вертикальных стержневых заземлителей и горизонтальной полосы. Исходные данные принять по варианту, номер которого совпадает с последней...
3 Заносим числовые данные по задаче в 5 столбец и 6 столбец
3. Заносим числовые данные по задаче в 5 столбец и 6 столбец. Данные столбца 5 – это данные уровня притязаний, а столбца 6 – силы воли Кодируем переменные: для этого переходим с листа «представление...