1. Проранжируем ряд. Для этого сортируем его значения по возрастанию.
Таблица для расчета показателей.
x |x – xср| (x – xср)2
-6.07 7.03 49.44
-4.66 5.62 31.6
-4.23 5.19 26.95
-3.71 4.67 21.82
-3.6 4.56 20.81
-3.13 4.09 16.74
-2.58 3.54 12.54
-1.21 2.17 4.72
-1.12 2.08 4.33
-1.05 2.01 4.05
-0.95 1.91 3.65
-0.46 1.42 2.02
-0.15 1.11 1.24
0.21 0.75 0.57
0.31 0.65 0.42
0.38 0.58 0.34
0.43 0.53 0.28
0.96 0 0
1.71 0.75 0.56
1.79 0.83 0.69
1.83 0.87 0.75
1.88 0.92 0.84
1.98 1.02 1.04
2 1.04 1.08
2.04 1.08 1.16
2.14 1.18 1.39
2.23 1.27 1.61
2.27 1.31 1.71
2.42 1.46 2.13
2.51 1.55 2.4
2.71 1.75 3.06
2.74 1.78 3.16
2.76 1.8 3.23
2.82 1.86 3.45
3.41 2.45 5.99
3.43 2.47 6.09
3.49 2.53 6.39
3.69 2.73 7.44
5.05 4.09 16.71
5.18 4.22 17.79
5.3 4.34 18.82
5.64 4.68 21.89
40.39 95.88 330.94
Простая средняя арифметическая
EQ xto(x) = f(∑x;n)
EQ xto(x) = f(40.39;42) = 0.96
Дисперсия – характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
EQ D = f(∑(xi – xto(x))2;n)
EQ D = f(330.94;42) = 7.88
Несмещенная оценка дисперсии – состоятельная оценка дисперсии (исправленная дисперсия).
EQ S2 = f(∑(xi – xto(x))2;n-1)
EQ S2 = f(330.94;41) = 8.07
Среднее квадратическое отклонение (средняя ошибка выборки).
EQ σ = r(D) = r(7.879) = 2.81
Каждое значение ряда отличается от среднего значения 0.96 в среднем на 2.81
Оценка среднеквадратического отклонения.
EQ s = r(S2 ) = r(8.07) = 2.84
Степень асимметрии.
Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.
Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.
As = M3/s3
где M3 – центральный момент третьего порядка.
s – среднеквадратическое отклонение.
M3 = -579.36/42 = -13.79
EQ As = f(-13.79;2.813) = -0.62
Отрицательный знак свидетельствует о наличии левосторонней асимметрии
Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии:
EQ sAs = r(f(6(n-2);(n+1)(n+3)))
Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.
Расчет центральных моментов проводим в аналитической таблице:
xi (x – xср)3 (x – xср)4
-7.03 -347.68 2444.74
-5.62 -177.66 998.76
-5.19 -139.93 726.49
-4.67 -101.96 476.31
-4.56 -94.92 433.01
-4.09 -68.5 280.29
-3.54 -44.42 157.34
-2.17 -10.24 22.24
-2.08 -9.02 18.78
-2.01 -8.14 16.38
-1.91 -6.99 13.36
-1.42 -2.87 4.08
-1.11 -1.37 1.53
-0.75 -0.42 0.32
-0.65 -0.28 0.18
-0.58 -0.2 0.11
-0.53 -0.15 0.0799
0 0 0
0.75 0.42 0.31
0.83 0.57 0.47
0.87 0.65 0.57
0.92 0.77 0.71
1.02 1.06 1.08
1.04 1.12 1.16
1.08 1.25 1.35
1.18 1.64 1.93
1.27 2.04 2.59
1.31 2.24 2.93
1.46 3.1 4.52
1.55 3.71 5.75
1.75 5.34 9.34
1.78 5.62 10
1.8 5.82 10.46
1.86 6.42 11.93
2.45 14.68 35.93
2.47 15.04 37.12
2.53 16.16 40.86
2.73 20.31 55.41
4.09 68.33 279.37
4.22 75.06 316.64
4.34 81.65 354.24
4.68 102.39 479.03
Итого
-579.36 7257.69
EQ sAs = r(f(6(42-2);(42+1)(42+3))) = 0.35
В анализируемом ряду распределения наблюдается существенная левосторонняя асимметрия (-0.62/0.35 = 1.76<3)
Применяются также структурные показатели (коэффициенты) асимметрии, характеризующие асимметрию только в центральной части распределения, т.е. основной массы единиц, и независящие от крайних значений признака. Рассчитаем структурный коэффициент асимметрии Пирсона:
EQ Asp = f(xto(x) – Mo;σ) = f(0.00167–7.03;2.81) = 2.51
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.
Чаще всего эксцесс оценивается с помощью показателя:
EQ Ex = f(M4;s4) – 3
Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) – отрицательный (Ex < 0), т.к. для нормального распределения M4/s4 = 3.
M4 = 7257.69/42 = 172.8
EQ Ex = f(172.8;2.814) – 3 = 2.7833 – 3 = -0.22
Число 3 вычитается из отношения μ4/ σ4 потому, что для нормального закона распределения μ4/ σ4 = 3. Таким образом, для нормального распределения эксцесс равен нулю. Островершинные кривые обладают положительным эксцессом, кривые более плосковершинные – отрицательным эксцессом.
Ex < 0 – плосковершинное распределение
Чтобы оценить существенность эксцесса рассчитывают статистику Ex/sEx
где sEx – средняя квадратическая ошибка коэффициента эксцесса.
EQ sEx = r(f(24n(n-2)(n-3);(n+1)2(n+3)(n+5)))
Если отношение Ex/sEx > 3, то отклонение от нормального распределения считается существенным.
EQ sEx = r(f(24 * 42(42-2)(42-3);(42+1)2(42+3)(42+5))) = 0.63
Поскольку sEx < 3, то отклонение от нормального распределения считается не существенным.
Мода.
Мода – наиболее часто встречающееся значение признака у единиц данной совокупности.
Мода отсутствует (все значения ряда индивидуальные).
Медиана.
Медиана – значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.
Находим середину ранжированного ряда: h = n/2 = 42/2 = 21. Ранжированный ряд включает четное число единиц, следовательно медиана определяется как средняя из двух центральных значений: (1.83 + 1.88)/2 = 1.855
Доверительный интервал для генерального среднего.
EQ (xto(x) – tkp f(s;r(n)) ; xto(x) + tkp f(s;r(n)))
Определяем значение tkp по таблице распределения Стьюдента
По таблице Стьюдента находим:
Tтабл(n-1;α/2) = Tтабл(41;0.025) = 2.009
EQ ε = tkp f(s;r(n)) = 2.009 f(2.84;r(42)) = 0.88
(0.96 – 0.88;0.96 + 0.88) = (0.0817;1.84)
С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Доверительный интервал для дисперсии.
Вероятность выхода за нижнюю границу равна P(χ2n-1 < hH) = (1-γ)/2 = (1-0.95)/2 = 0.025. Для количества степеней свободы k = 41 по таблице распределения χ2 находим:
χ2(41;0.025) = 65.41016.
Случайная ошибка дисперсии:
EQ tH = f((n-1)S2;hH)
EQ tH = f(41 • 2.842;65.41016) = 5.06
Вероятность выхода за верхнюю границу равна P(χ2n-1 ≥ hB) = 1 – P(χ2n-1 < hH) = 1 – 0.025 = 0.975. Для количества степеней свободы k = 41, по таблице распределения χ2 находим:
χ2(41;0.975) = 28.36615.
Случайная ошибка дисперсии:
EQ tB = f((n-1)S2;hH)
EQ tB = f(41 • 2.842;28.36615) = 11.67
(8.07 – 5.06; 8.07 + 11.67)
Таким образом, интервал (3.01;19.74) покрывает параметр S2 с надежностью γ = 0.95
2. Ширина интервала составит:
EQ h = f(Xmax – Xmin;n)
EQ h = f(5.64 – (-6.07);7) = 1.67
Xmax – максимальное значение группировочного признака в совокупности.
Xmin – минимальное значение группировочного признака.
Определим границы группы.
Номер группы
Нижняя граница
Верхняя граница
1 -6.07 -4.4
2 -4.4 -2.73
3 -2.73 -1.06
4 -1.06 0.61
5 0.61 2.28
6 2.28 3.95
7 3.95 5.64
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
-6.07 -6.07 – -4.4 1
-4.66 -6.07 – -4.4 2
-4.23 -4.4 – -2.73 1
-3.71 -4.4 – -2.73 2
-3.6 -4.4 – -2.73 3
-3.13 -4.4 – -2.73 4
-2.58 -2.73 – -1.06 1
-1.21 -2.73 – -1.06 2
-1.12 -2.73 – -1.06 3
-1.05 -1.06 – 0.61 1
-0.95 -1.06 – 0.61 2
-0.46 -1.06 – 0.61 3
-0.15 -1.06 – 0.61 4
0.21 -1.06 – 0.61 5
0.31 -1.06 – 0.61 6
0.38 -1.06 – 0.61 7
0.43 -1.06 – 0.61 8
0.96 0.61 – 2.28 1
1.71 0.61 – 2.28 2
1.79 0.61 – 2.28 3
1.83 0.61 – 2.28 4
1.88 0.61 – 2.28 5
1.98 0.61 – 2.28 6
2 0.61 – 2.28 7
2.04 0.61 – 2.28 8
2.14 0.61 – 2.28 9
2.23 0.61 – 2.28 10
2.27 0.61 – 2.28 11
2.42 2.28 – 3.95 1
2.51 2.28 – 3.95 2
2.71 2.28 – 3.95 3
2.74 2.28 – 3.95 4
2.76 2.28 – 3.95 5
2.82 2.28 – 3.95 6
3.41 2.28 – 3.95 7
3.43 2.28 – 3.95 8
3.49 2.28 – 3.95 9
3.69 2.28 – 3.95 10
5.05 3.95 – 5.62 1
5.18 3.95 – 5.62 2
5.3 3.95 – 5.62 3
5.64 3.95 – 5.62 4
Результаты группировки оформим в виде таблицы:
Группы
Частота fi
-6.07 – -4.4 2
-4.4 – -2.73 4
-2.73 – -1.06 3
-1.06 – 0.61 8
0.61 – 2.28 11
2.28 – 3.95 10
3.95 – 5.64 4
Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
EQ K = ∑f((ni – n pi)2;n pi), где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа
EQ Фb(f(xi+1-xto(x);s)) – Фb(f(xi – xto(x);s)), где s = 2.68, xср = 0.81
Теоретическая (ожидаемая) частота равна ni = npi, где n = 42
Интервалы группировки
Наблюдаемая частота ni
x1 = (xi – xср)/s x2 = (xi+1 – xср)/s Ф(x1) Ф(x2) Вероятность попадания в i-й интервал, pi = Ф(x2) – Ф(x1) Ожидаемая частота, 42pi Слагаемые статистики Пирсона, Ki
-6.07 – -4.4 2 -2.54 -1.92 -0.49 -0.47 0.0213 0.89 1.37
-4.4 – -2.73 4 -1.92 -1.31 -0.47 -0.4 0.0683 2.87 0.45
-2.73 – -1.06 3 -1.31 -0.69 -0.4 -0.25 0.15 6.3 1.73
-1.06 – 0.61 8 -0.69 -0.0734 -0.25 -0.0319 0.22 9.37 0.2
0.61 – 2.28 11 -0.0734 0.54 -0.0319 0.21 0.24 10.11 0.0784
2.28 – 3.95 10 0.54 1.16 0.21 0.38 0.17 7.06 1.22
3.95 – 5.64 4 1.16 1.78 0.38 0.46 0.0863 3.62 0.0388
42 5.08
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = χ2(7-2-1;0.05) = 9.48773; Kнабл = 5.08
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют нормальное распределение.
Juliet88 4.6
Высшее образование в сфере менеджмента и экономики предприятия, информационное обеспечение предприятия. Также имею второе высшее медицинское образование.
На странице представлен фрагмент
Уникализируй или напиши новое задание с помощью нейросети
Похожие работы
Определить сопротивление растеканию сложного заземления
Определить сопротивление растеканию сложного заземления, состоящего из вертикальных стержневых заземлителей и горизонтальной полосы. Исходные данные принять по варианту, номер которого совпадает с последней...
3 Заносим числовые данные по задаче в 5 столбец и 6 столбец
3. Заносим числовые данные по задаче в 5 столбец и 6 столбец. Данные столбца 5 – это данные уровня притязаний, а столбца 6 – силы воли Кодируем переменные: для этого переходим с листа «представление...