курсовые,контрольные,дипломы,рефераты
Лабораторная работа № 1.
Тема: «Сводка, группировка, статистические таблицы».
Цель: выявление обобщающих закономерностей, характерных для изучаемой совокупности объектов наблюдения как целостной системы.
Цель исследования—определение уровня успеваемости студентов 1-ого курса, а так же факторов на него влияющих.
В качестве исследуемых признаков я рассматриваю:
1. средний балл по итогам экзаменов за 1-ый курс (баллы).
2. посещаемость занятий в университете на 1-ом курсе.
3. самообразование (дополнительное обучение, курсы) (ч/нед).
4. сон (ч/сутки).
5. пол (м, ж).
6. подготовка к семинарским и практическим занятиям (ч/нед).
7. нравятся ли студенту на 1-ом курсе занятия в университете (да, нет).
Из представленных признаков я выделяю признак-результат—средний балл зачётки по итогам 1-ого курса, так как его значение отвечает цели исследования. Остальные шесть признаков являются признаками-факторами, т. к. они оказывают влияние на признак-результат.
Наблюдение единовременное ауд. 722, 522 СПбГИЭУ. Дата проведения: 03.11.2000г. по форме проведения—опрос. Объектом наблюдения являются 2 группы студентов (1093 и 1094) 2-ого курса. единица наблюдения—студент. Исследование основного массива.
Таблицы с исходными данными.
Таблица 1
Средний балл зачётки по итогам экзаменов за 1-ый курс (баллы) | Посещаемость занятий на первом курсе | Самообразование (доп. Курсы) ч/нед | Подготовка к семинарским занятиям (ч/нед) | Сон (ч/сут) | Пол (м, ж) | Нравятся ли занятия в университете (да, нет) |
4,7 | 19,5 | 0 | 5 | 7 | Ж | Да |
4,5 | 22 | 2 | 6 | 9 | Ж | Да |
4,2 | 22 | 0 | 2 | 6 | М | Да |
4,3 | 19,5 | 0 | 7 | 7 | Ж | Да |
4,5 | 17,5 | 0 | 3 | 7 | Ж | Нет |
4,2 | 9,5 | 6 | 12 | 10 | Ж | Да |
4,0 | 12,5 | 0 | 5 | 5 | Ж | Да |
4,7 | 22 | 4 | 7 | 6 | Ж | Да |
4,6 | 17,5 | 3 | 4 | 8 | Ж | Да |
4,7 | 9,5 | 0 | 2 | 7 | Ж | Да |
4,5 | 11,5 | 6 | 3 | 7 | Ж | Да |
4,0 | 11,5 | 2 | 3 | 9 | Ж | Да |
4,2 | 19,5 | 4 | 8 | 8 | Ж | Нет |
4,0 | 20,5 | 6 | 9 | 5 | Ж | Да |
3,2 | 9,5 | 0 | 0 | 10 | М | Нет |
4,0 | 17,5 | 0 | 8 | 8 | М | Нет |
3,2 | 14,5 | 0 | 2 | 8 | М | Нет |
3,5 | 14,5 | 0 | 2 | 8 | М | Нет |
4,8 | 22 | 0 | 10 | 10 | Ж | Нет |
4,6 | 8,5 | 0 | 1 | 8 | М | Да |
4,5 | 22 | 0 | 4 | 7 | Ж | Да |
4,5 | 22 | 6 | 2 | 7 | М | Да |
4,2 | 17,5 | 4 | 4 | 9 | М | Нет |
4,5 | 14,5 | 6 | 4 | 10 | Ж | Да |
4,2 | 11,5 | 2 | 2 | 8 | Ж | Нет |
4,8 | 17,5 | 0 | 4 | 9 | Ж | Нет |
4,0 | 10,5 | 0 | 2 | 7 | Ж | Да |
4,2 | 17,5 | 2 | 6 | 5 | Ж | Да |
3,0 | 9,5 | 0 | 0 | 9 | М | Нет |
4,8 | 19,5 | 2 | 2 | 8 | Ж | Да |
4,8 | 19,5 | 2 | 6 | 9 | Ж | Да |
4,3 | 17,5 | 4 | 2 | 7 | Ж | Да |
3,2 | 6,0 | 0 | 0 | 5 | М | Нет |
4,5 | 22 | 2 | 5 | 9 | Ж | Нет |
4,7 | 22 | 4 | 3 | 6 | Ж | Да |
4,2 | 22 | 3 | 5 | 8 | Ж | Да |
4,6 | 9,5 | 0 | 1 | 8 | Ж | Нет |
3,0 | 14,0 | 0 | 2 | 10 | М | Нет |
3,0 | 6,5 | 0 | 5 | 9 | М | Нет |
4,0 | 22 | 2 | 5 | 9 | Ж | Да |
4,7 | 17,5 | 6 | 0 | 10 | Ж | Нет |
3,5 | 11,5 | 0 | 6 | 7 | М | Нет |
4,7 | 22 | 6 | 2 | 5 | Ж | Да |
4,5 | 22 | 0 | 0 | 8 | Ж | Да |
3,2 | 17,5 | 4 | 8 | 9 | Ж | Да |
4,8 | 22 | 0 | 0 | 5 | М | Да |
3,2 | 9,5 | 0 | 5 | 10 | М | Да |
4,5 | 17,5 | 0 | 3 | 10 | Ж | Да |
3,0 | 14,5 | 5 | 3 | 7 | М | Нет |
4,7 | 11,5 | 5 | 3 | 7 | М | Нет |
Структурные группировки.
1 группировка.
Таблица 2
Средний балл по итогам экзаменов за 1 курс, баллы | Число студентов | % к итогу |
Fi |
[3-3,5] | 9 | 18 | 9 |
[3,5-4] | 3 | 6 | 12 |
[4-4,5] | 15 | 30 | 27 |
[4,5-5] | 23 | 46 | 50 |
Итог: | 50 | 100 |
Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину интервала определяем по формуле:
h = R / n = (X max – X min) / n = (5-3) / 4 = 0,5
гистограмма: кумулята:
считаем по несгруппированным данным для большей точности:
Х = (4,7 + 4,5 + 4,2 + 4,2 +4,5 + 4,2 + 4,0 + 4,7 + 4,6 + 4,7 + 3,5 + 4,0 + 3,2 + 4,0 + 3,2 + 3,5 + + 4,8 + 4,6 + 4,5 + 4,5 + 4,2 + 4,5 + 4,2 + 4,8 + 4,0 + 4,2 + 3,0 + 3,2 + 4,8 + 4,8 + 4,3 + 4,5 + 4,7 + 4,2 + 4,6 + 3,0 + 3,0 + 4,0 + 4,7 + 3,5 + 4,7 + 4,5 + 3,2 + 4,5 + 4,8 + 3,2 + 3,0 + 4,5 + 4,7) / 50 = 4,27 (балла)
Ме = x0 + D Ме (N/2 – F(x0) / NMe
Me = 4+ 0,5 (25 –12) / 15 = 4,4 (балла)
Мо = х0 + D Мо (NМо – NМо-1) / (NМо – NМо-1) + (NМо – NМо+1)
Mo = 4,5 + 0,5 (25-15) / ((23-15) + (23-0)) = 4,6 (балла)
D = å (xi – x)2 / n считаем по несгруппированным данным.
D = 0,3 (кв. балла)
bx = ÖD
bx = Ö0,3 = 0,55 (балла)
V = bx / x × 100%
V = (0,55 / 4,27) × 100% = 128%
R = xmax – xmin
R = 5 – 3 = 2 (балла)
Вывод: средний балл зачётки по итогам экзаменов за 1-ый курс для данной совокупности составляет 4,27 балла. Т. к. коэффициент вариации является величиной незначительной (128%), можно предполагать, что такой средний балл является типичным для данной совокупности. Наиболее распространённым является балл зачётки 4,6 балла. Средний балл у 50% студентов не больше 4,4 балла.
Группировка 2
Таблица 3
Посещаемость, ч/нед | Число студентов, чел | % к итогу | Fi |
[6-10] | 9 | 18 | 9 |
[10-14] | 8 | 16 | 17 |
[14-18] | 15 | 30 | 32 |
[18-22] | 18 | 36 | 50 |
Итог: | 50 | 100 |
Разбиение на интервалы аналогично группировке 1.
Для несгруппированных данных, значит более точный результат.
Х = å xi / n
X = 16, 13 (ч/нед)
Ме = x0 + D Ме (N/2 – F(x0) / NMe
Ме = 14 + 4 (25 – 17) / 15 = 17,3 (ч/нед)
D = å (xi – x)2 / n
D = 19,4 ((ч/нед)2)
bx = ÖD = 4,4 (ч/нед)
V = bx / x × 100% = (4,4 / 16,13) × 100% = 27,2%
R = xmax – xmin
R = 22 – 16 = 16 (балла)
Вывод: средняя посещаемость в группах составляет 16,13 ч/нед (70% от часов в неделю назначенных расписанием). Коэффициент вариации является величиной незначительной (28,6%), следовательно. Такая средняя посещаемость типична для студентов данной совокупности. Большинство студентов посещало 17,3 ч/нед. Посещаемость занятий у 50% студентов меньше 19 ч/нед, у 50% больше 19 ч/нед.
Группировка 3
Таблица 4
Самообразование, курсы (ч/нед) | Число студентов | % к итогу | Fi |
0 | 25 | 50 | 25 |
2 | 8 | 16 | 33 |
3 | 2 | 4 | 35 |
4 | 6 | 12 | 41 |
5 | 2 | 4 | 43 |
6 | 7 | 14 | 50 |
Итог: | 50 | 100 |
Полегон частот: кумулята
Х = å xi ji / å ji = (0 × 25 + 2 × 8 + 3 × 2 + 4 × 6 + 5 × 2 + 6 × 7) / 50 = 1,96 (ч/нед)
NMe = (n+1) / 2 = 51 / 2 = 25,5
Me = x NMe ; Me = 2 (ч/нед) ; Мо = 0 (ч/нед)
D = å (xi – x)2 ji / å jI = ((0 – 1,96)2 × 25 + (2 – 1,96)2 × 8 + (3 – 1,96)2 × 2 + (4 – 1,96)2 × 6 + (5 – 1,96)2 × 2 + (6 – 1,96)2 × 7) / 50 = 5,1 (ч/нед)2
bx = 2,26 (ч/нед)
V = (2,26 / 1,96) × 100% = 115%
R = 6 – 0 = 6 (ч/нед)
Вывод: среднее количество часов, затраченное студентами на самообразование 1,96 ч/нед. Т. к. коэффициент вариации является величиной значительной (115%), то среднее количество является не типичным для данной совокупности. Наиболее распространённым является количество часов самообразования равное 0 ч/нед. Ровно половина из 50 опрошенных студентов не занимались на первом курсе дополнительным самообразованием.
Группировка 4
Таблица 5
Подготовка к семинарам, ч/нед | Число студентов | % к итогу | Fi |
[0-3] | 21 | 42 | 21 |
[3-6] | 18 | 36 | 39 |
[6-9] | 8 | 16 | 47 |
[9-12] | 3 | 6 | 50 |
Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину интервала определяем по формуле: h = R / n. h = 3.
Х = å xi / n
Х = 4,08 (ч/нед)
Ме = 3 + 3 (25 – 21) / 18 = 3,6 (ч/нед)
Мо = 0 + 3 (21 – 0) / ((21 – 0) + (21 – 8)) = 1,85 (ч/нед)
D = å (xi – x)2 / n
D = 7,2 ((ч/нед)2)
bx = 2,7 (ч/нед)
V = (2,7 / 4,08) × 100% = 65,6%
R = 12 – 0 = 12 (ч/нед)
Вывод: среднее время, затраченное на подготовку к семинарским занятиям у студентов на 1 курсе 4,08 ч/нед. Т. к. коэффициент вариации является величиной значительной, то среднее время подготовки является величиной не типичной для данной совокупности студентов. Наиболее распространённым количеством часов на подготовку равно 1,85 ч/нед. Число студентов, занимающихся больше 3,6 ч/нед равно числу студентов, занимающихся подготовкой к занятиям больше 3,6 ч/нед.
Группировка 5
Таблица 6
Сон, ч/сутки | Число студентов | % к итогу | Fi |
5 | 6 | 12 | 6 |
6 | 3 | 6 | 9 |
7 | 13 | 26 | 22 |
8 | 11 | 22 | 33 |
9 | 8 | 16 | 41 |
10 | 9 | 18 | 50 |
Итог: | 50 | 100 |
X = (5 6 + 6 3 + 7 13 + 8 11 + 9 8 + 10 9) / 50 = 7,78 (ч/сут)
NMe = (n+1) / 2 Me = 8 (ч/сут)
Мо = 7 (ч/сут)
D = å (xi – x)2 ji / å jI
D = 2,4 ((ч/сут)2)
bx = 1,55 (ч/сут)
V = (1,55 / 7,78) × 100% = 19,9%
R = 10 – 5 = 5 (ч/сут)
Вывод: среднее значение часов сна 7,78 ч/сутки. Т. к. коэффициент вариации является величиной незначительной (19,9%), то такое среднее значение часов сна является типичным для данной совокупности. Наиболее распространённым является количество часов сна 7 ч/сутки. Количество студентов, которые спят больше 8 ч/сутки равно количеству студентов, спящих меньше 8 ч/сут.
Группировка 6
Таблица 7
пол | Число студентов, чел | % к итогу | Fi |
Ж | 33 | 66 | 30 |
М | 17 | 34 | 50 |
Итог: | 50 | 100 |
Вывод: из таблицы видно, что большинство опрошенных студентов женского пола.
Группировка 7
Таблица 8
Нравятся ли занятия на 1 курсе | Число студентов, чел | % к итогу | Fi |
Да | 30 | 60 | 30 |
Нет | 20 | 40 | 50 |
Итог: | 50 | 100 |
Вывод: из таблицы видно, что большинству студентов данной совокупности нравились занятия на 1 курсе в академии.
Комбинационные группировки.
Таблица 9
сон | Средний балл зачётки | Всего | |||||||||
3 | 3,2 | 3,5 | 4 | 4,2 | 4,3 | 4,5 | 4,6 | 4,7 | 4,8 | ||
5 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 1 | 1 | 1 | 6 |
6 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 2 | 0 | 3 |
7 | 1 | 0 | 2 | 1 | 1 | 2 | 2 | 0 | 3 | 1 | 13 |
8 | 0 | 1 | 1 | 1 | 3 | 0 | 2 | 0 | 0 | 1 | 11 |
9 | 1 | 1 | 0 | 2 | 1 | 0 | 2 | 0 | 0 | 1 | 8 |
10 | 2 | 2 | 0 | 0 | 1 | 0 | 2 | 0 | 1 | 1 | 9 |
Итог: | 4 | 5 | 3 | 6 | 7 | 2 | 8 | 3 | 7 | 5 | 50 |
Вывод: из таблицы видно, что наиболее крупные элементы расположены близко к побочной диагонали. Следовательно, зависимость между признаками близка к обратной.
Таблица 10
Посещаемость | Средний балл зачётки | Всего | |||||||||
3 | 3,2 | 3,5 | 4 | 4,2 | 4,3 | 4,5 | 4,6 | 4,7 | 4,8 | ||
[6-10] | 2 | 3 | 0 | 0 | 1 | 0 | 0 | 2 | 1 | 0 | 9 |
[10-14] | 0 | 0 | 2 | 3 | 1 | 0 | 0 | 0 | 1 | 0 | 7 |
[14-18] | 2 | 2 | 1 | 1 | 2 | 1 | 3 | 1 | 1 | 1 | 15 |
[18-22] | 0 | 0 | 0 | 2 | 3 | 1 | 5 | 0 | 4 | 4 | 19 |
Итог: | 4 | 5 | 3 | 6 | 7 | 2 | 8 | 3 | 7 | 5 | 50 |
Вывод: из таблицы видно, что наибольшие элементы расположены близко к главной диагонали. Следовательно, зависимость между признаками близка к прямой.
Аналитические группировки.
Группировка 1
Таблица 11
Введём обозначения:
1. неудовлетворительная подготовка к занятиям [0-3]
2. удовлетворительная [3-6]
3. хорошая [6-9]
4. отличная [9-12]
Подготовка к занятиям | Число студентов, чел | Средний балл зачётки за 1 курс |
Неудовлетворительная | 21 | 3,7 |
Удовлетворительная | 18 | 4,3 |
Хорошая | 8 | 4,4 |
Отличная | 3 | 4,5 |
Всего: | 50 |
Вывод: из таблицы видно, что зависимость между фактором и признаком существует.
Группировка 2
Таблица 12
Введём обозначения:
1. 1/3 всех занятий [6-12] ч/нед
2. половина [12-18] ч/нед
3. все занятия [18-22] ч/нед
Посещаемость занятий | Число студентов, чел | Средний балл зачётки за 1 курс |
1/3 всех занятий | 13 | 3,3 |
половина | 19 | 4,0 |
все занятия | 18 | 4,5 |
Всего: | 50 |
Вывод: из таблицы видно, что зависимости между признаком-фактором и признаком-результатом явной нет.
Группировка 3
Таблица 13
Самообразование | Число студентов, чел | Средний балл зачётки за 1 курс |
Посещали доп. курсы | 25 | 4,2 |
Не посещали доп. курсы | 25 | 4,0 |
Вывод: не наблюдается явной зависимости между признаком-фактором и признаком результатом.
Лабораторная работа № 2
Тема: Корреляционный анализ, множественная линейная регрессия.
Цель: выбор оптимальной модели многофакторной регрессии на основе анализа различных моделей и расчитан для них коэффициентов множественной детерминации и среднеквадратических ошибок уравнения многофакторной регрессии.
Корреляционная матрица
Таблица 1
0 | 1 | 2 | 3 | 4 | |
0 | 1 | 0,572 | 0,115 | 0,486 | 0,200 |
1 | 0,572 | 1 | 0,218 | 0,471 | -0,112 |
2 | 0,115 | 0,218 | 1 | 0,452 | -0,048 |
3 | 0,438 | 0,471 | 0,452 | 1 | -0,073 |
4 | -0,2 | -0,112 | -0,048 | -0,073 | 1 |
Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий, х2 – самообразование (доп. курсы), х3 – подготовка к семинарским занятиям, х4 – сон.
Введём обозначения признаков-факторов: 1 – посещаемость занятий на 1 курсе (ч/нед); 2 – самообразование (ч/нед); 3 – подготовка к семинарским и практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки по итогам экзаменов за 1 курс.
Расчётная таблица для моделей многофакторной регрессии.
Таблица 2
Модель многофакторной регрессии |
R2 |
E2 |
1-2-3-4 | 0,39 | 0,45 |
1-2-3 | 0,37 | 0,46 |
2-3-4 | 0,23 | 0,51 |
1-3-4 | 0,38 | 0,45 |
1-2 | 0,33 | 0,47 |
1-3 | 0,36 | 0,46 |
1-4 | 0,35 | 0,47 |
2-3 | 0,20 | 0,52 |
2-4 | 0,05 | 0,56 |
3-4 | 0,22 | 0,51 |
По трём критериям выбираем оптимальную модель.
1. число факторов минимально (2)
2. max R, R = 0,36
3. min E, E = 0,46
Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-факторы «посещаемость занятий на 1 курсе» и «подготовка к семинарским занятиям» влияют значительнее других факторов на признак-результат.
Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по сравнению с ошибками, рассчитанными для других моделей многофакторной регрессии.
Составляю для этой модели уравнение регрессии в естественных масштабах.
Х0/1,3 = a + b1x1 + b3x3
Корреляционная матрица.
Таблица 3
0 | 1 | 3 | |
0 | 1,00 | 0,57 | 0,48 |
1 | 0,57 | 1,00 | 0,47 |
3 | 0,43 | 0,47 | 1,00 |
t0/1,3 = b1t1 + b3t3
0,57 = b1 + 0,47b3 0,57 = b1 + 0,47(0,44 – 0,47b1) b1 = 0,4
0,44 = 0,47b1 + b3 b3 = 0,44 – 0,47b1 b3 = 0,25
t0/1,3 = 0,4t1 + 0,25t3
b1 = (d0 / dx1) b1 = (0,47 / 4,4) 0,4 = 0,071
b3 = (d0 / dx3) b3 = (0,79 / 2,68) 0,25 = 0,073
a = x0 – b1x1 – b3x3 = 4,27 – 0,071 × 16,13 – 0,073 × 4,08 = 2,8
имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 – уравнение линейной множественной регрессии.
R0/1,3 = Öb1r01 + b3r03
R0/1,3 = Ö0,4 × 0,58 + 0,25 × 0,48 = 0,6
Вывод: коэффициент b1 говорит о том, что признак-результат—средний балл зачётки за 1 курс на 0,4 долю от своего среднеквадратического отклонения (0,4 × 0,79 = 0,316 балла) при изменении признака-фактора—посещаемости на 1 курсе на одно своё СКО (4,4 ч/нед).
b3 – средний балл зачётки изменится на 0,25 долю от своего СКО (0,25 0,79 = 0,179 балла) при увеличении признака-фактора—подготовки к семинарским занятиям на одно своё СКО (2,68 ч/сут).
Т. к. b1 < b3, следовательно фактор 1—посещаемость занятий влияет на средний балл зачётки больше, чем фактор 3—подготовка к занятиям.
R2 говорит о том, что 36% общей вариации значений среднего балла зачётки на 1 курсе вызвано влиянием посещаемости и подготовки к занятиям. Остальные 60% вызваны прочими факторами.
R = 0,58 свидетельствует о том, что между посещаемостью занятий и подготовкой к ним и средним баллом зачётки существует заметная линейная зависимость.
Коэффициент b1 говорит о том, что если посещаемость занятий увеличится на 1 ч/нед, то средний балл зачётки увеличится в среднем на 0,071 балла, при условии неизменности всех остальных факторов. b2 говорит о том, что если подготовка к занятиям увеличится на 1 ч/нед, то средний балл зачётки в среднем увеличится на 0,073 балла.
b1 = 0,4 b3 = 0,25
r01 = 0,52
r03 = 0,44
r13 = 0,47
Граф связи признаков-факторов: х2 – подготовки к семинарским занятиям, ч/нед; х1 - посещаемости занятий, ч/нед с признаком-результатом х0 – средним баллом зачётки по итогам экзаменов за 1 курс.
b1 – мера непосредственного влияния на признак-результат посещаемости занятий.
b3 – мера непосредственного влияния подготовки к занятиям на средний балл зачётки.
r01 = b1 + r13b3, где r01 – общее влияние х1 на r13b3 – мера опосредованного влияния х1 через х3 на х0.
r01 = 0,4 + 0,47 × 0,25 = 0,52
r03 = b3 + r31b1, где r03 – общее влияние х3 на r31b1 – мера опосредованного влияния х3 через х1 на х0.
Лабораторная работа № 3.
Тема: «Дисперсионное отношение. Эмпирическая и аналитическая регрессии.»
Цель: выявление зависимости между признаками-факторами и признаком-результатом.
Таблица с исходными данными.
Таблица 1
Средний балл зачётки по итогам экзаменов за 1-ый курс (баллы) | Посещаемость занятий на первом курсе (ч/нед) | Самообразование (доп. Курсы) (ч/нед) | Подготовка к семинарским занятиям (ч/нед) |
4,7 | 19,5 | 0 | 5 |
4,5 | 22 | 2 | 6 |
4,2 | 22 | 0 | 2 |
4,3 | 19,5 | 0 | 7 |
4,5 | 17,5 | 0 | 3 |
4,2 | 9,5 | 6 | 12 |
4,0 | 12,5 | 0 | 5 |
4,7 | 22 | 4 | 7 |
4,6 | 17,5 | 3 | 4 |
4,7 | 9,5 | 0 | 2 |
4,5 | 11,5 | 6 | 3 |
4,0 | 11,5 | 2 | 3 |
4,2 | 19,5 | 4 | 8 |
4,0 | 20,5 | 6 | 9 |
3,2 | 9,5 | 0 | 0 |
4,0 | 17,5 | 0 | 8 |
3,2 | 14,5 | 0 | 2 |
3,5 | 14,5 | 0 | 2 |
4,8 | 22 | 0 | 10 |
4,6 | 8,5 | 0 | 1 |
4,5 | 22 | 0 | 4 |
4,5 | 22 | 6 | 2 |
4,2 | 17,5 | 4 | 4 |
4,5 | 14,5 | 6 | 4 |
4,2 | 11,5 | 2 | 2 |
4,8 | 17,5 | 0 | 4 |
4,0 | 10,5 | 0 | 2 |
4,2 | 17,5 | 2 | 6 |
3,0 | 9,5 | 0 | 0 |
4,8 | 19,5 | 2 | 2 |
4,8 | 19,5 | 2 | 6 |
4,3 | 17,5 | 4 | 2 |
3,2 | 6,0 | 0 | 0 |
4,5 | 22 | 2 | 5 |
4,7 | 22 | 4 | 3 |
4,2 | 22 | 3 | 5 |
4,6 | 9,5 | 0 | 1 |
3,0 | 14,0 | 0 | 2 |
3,0 | 6,5 | 0 | 5 |
4,0 | 22 | 2 | 5 |
4,7 | 17,5 | 6 | 0 |
3,5 | 11,5 | 0 | 6 |
4,7 | 22 | 6 | 2 |
4,5 | 22 | 0 | 0 |
3,2 | 17,5 | 4 | 8 |
4,8 | 22 | 0 | 0 |
3,2 | 9,5 | 0 | 5 |
4,5 | 17,5 | 0 | 3 |
3,0 | 14,5 | 5 | 3 |
4,7 | 11,5 | 5 | 3 |
Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на 1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними.
Расчётная таблица №1
Таблица 2
Посещаемость занятий (ч/нед) | Число наблюдений |
xi |
yi |
dyi |
d2yi |
d2yi ji |
yi - y |
(yi–y)2jI |
[6-10] | 9 | 8,6 | 3,7 | 0,71 | 0,5 | 4,5 | -0,5 | 2,25 |
[10-14] | 8 | 11,5 | 4,1 | 0,38 | 0,14 | 1,12 | -0,1 | 0,08 |
[14-18] | 15 | 16,4 | 3,7 | 1,01 | 1,02 | 15,3 | -0,5 | 3,75 |
[18-22] | 18 | 19,6 | 4,4 | 0,31 | 0,09 | 1,62 | 0,4 | 2,88 |
Сумма | 50 | - | - | - | - | 22,54 | - | 8,96 |
Средняя | - | 15,3 | 4,0 | - | - | 5,6 | - | 2,24 |
d2y = (å(yi–y)2jI)
d 2y = 8,96 / 50 = 0,1792 (балла)2
E2y= (åб2yijI) / åjI
E2y = (4,5 + 1,12 + 15,3 + 1,62) / 50 = 0,4508(балла)2
б2y = E2y + d 2y = 0,4508 + 0,1792 = 0,63 (балла)2
r2 = d 2y / б2y = 0,1792 / 0,63 = 0,28 (0,28%)
построение аналитической регрессии.
yx = a + bx
xy = (åxyjI) / åjI = 62,52
б2x = 19,4 (ч/нед)2
b = (xy – x y) / б2x = (62,52 – 15,3 × 4,0) / 19,4 = 0,068
a = y – bx = 4,0 – 0,068 × 15,3 = 2,96
Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от посещаемости: строим по двум точкам
yx = 2,96 + 0,068х
rxy = (xy – x y) / бxбy = 0,37
Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии
Распределение среднего балла зачётки за 1 курс по признаку-фактору—посещаемости занятий на 1 курсе.
Вывод: r2 свидетельствует о том, что 28% общей вариации результативного признака вызвано влиянием признака фактора—посещаемостью. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением посещаемости занятий на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,068 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором заметная линейная связь.
Рассматриваю вторую пару признаков:
Расчётная таблица № 2.
Таблица 3
Подготовка к семинарским занятиям (ч/нед) | Число наблюдений |
xi |
yi |
dyi |
d2yi |
d2yi ji |
yi - y |
(yi–y)2ji |
[0-3] | 20 | 1,2 | 3,78 | 0,63 | 0,39 | 7,8 | -0,22 | 0,96 |
[3-6] | 18 | 4,0 | 4,31 | 0,45 | 0,2 | 3,6 | 0,31 | 1,72 |
[6-9] | 9 | 6,8 | 4,46 | 0,28 | 0,07 | 0,63 | 0,46 | 1,9 |
[9-12] | 2 | 9,5 | 4,4 | 0,399 | 0,15 | 0,3 | 0,4 | 0,32 |
Сумма | 50 | - | - | - | - | 2,33 | - | 4,9 |
средняя | - | 3,5 | 4,0 | - | - | 3,08 | - | 1,2 |
d2y = (å(yi–y)2jI)
d 2y = 4,9 / 50 = 0,098 (балла)2
E2y= (åб2yijI) / åjI
E2y = 12,33 / 50 = 0,25 (балла)2
б2y = E2y + d 2y = 0,35 (балла)2
r2 = d 2y / б2y = 0,098 / 0,35 = 0,28 (0,28%)
r = 0,53
построение аналитической регрессии.
yx = a + bx
xy = (åxyjI) / åjI
xy = 15,2
б2x = 7,2 (ч/нед)2
b = (xy – x y) / б2x = (15,2 – 3,5 × 4,0) / 7,2 = 0,16
a = y – bx = 4,0 – 0,16 × 3,4
Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от подготовки к семинарским занятиям:
yx = 2,96 + 0,068х
x = 0 y = 3,4
x = 7 y = 4,5
rxy = (xy – x y) / бxбy = (15,2 – 14) / 2,6 = 0,46
Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии
Распределение среднего балла зачётки за 1 курс по признаку-фактору—подготовке к семинарским занятиям.
Вывод: r2 свидетельствует о том, что 28% общей вариации результативного признака вызвано влиянием признака фактора—подготовкой к семинарским занятиям. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать, что это слабая корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для данной совокупности студентов с увеличением подготовки к занятиям на 1 курсе на 1 ч/нед средний балл зачётки увеличивается на 0,16 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором есть умеренная линейная связь.
Рассматриваю третью пару признаков:
Расчётная таблица № 3
Таблица 4
Самообразование (ч/нед) | Число наблюдений |
xi |
yi |
dyi |
d2yi |
d2yi ji |
yi - y |
(yi–y)2ji |
0 | 25 | 0 | 4,07 | 0,68 | 0,46 | 11,5 | -0,03 | 0,022 |
2 | 8 | 2 | 4,38 | 0,3 | 0,09 | 0,72 | 0,28 | 0,62 |
3 | 2 | 3 | 4,40 | 0,2 | 0,04 | 0,08 | 0,3 | 0,18 |
4 | 6 | 4 | 4,22 | 0,5 | 0,25 | 1,5 | 0,12 | 0,08 |
5 | 2 | 5 | 3,35 | 0,35 | 0,12 | 0,24 | -0,75 | 1,16 |
6 | 7 | 6 | 3,3 | 0,40 | 0,16 | 1,12 | 0,2 | 0,28 |
Сумма | 50 | - | - | - | - | 15,88 | - | 2,34 |
средняя | - | 1,96 | 4,1 | - | - | 0,31 | - | 0,39 |
d2y = (å(yi–y)2jI)
d 2y = 2,34 / 50 = 0,046 (балла)2
E2y= (åб2yijI) / åjI
E2y = 15,88 / 50 = 0,31 (балла)2
б2y = E2y + d 2y = 0,31 + 0,046 = 0,36 (балла)2
r2 = d 2y / б2y = 0,046 / 0,36 = 0,13 (13%)
r = 0,36
построение аналитической регрессии.
yx = a + bx
xy = (åxyjI) / åjI
xy = 8,22
б2x = 5,1 (ч/нед)2
b = (xy – x y) / б2x = (8,22 – 8,036) / 5,1 = 0,032
a = y – bx = 4,1 – 0,032 × 1,96 = 4,03
Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс от самообразования:
yx = 2,96 + 0,068х
x = 0 y = 3,4
x = 7 y = 4,5
rxy = (xy – x y) / бxбy = (8,2 – 8,036) / 2,25 × 0,6 = 0,12
Корреляционное поле
Эмпирическая линия регрессии
Аналитическая линия регрессии
Вывод: r2 свидетельствует о том, что 13% общей вариации результативного признака вызвано влиянием признака фактора—самообразованием. Можно сказать, что это очень слабая корреляционная связь. Зная коэффициент b, предполагаем, что для данной совокупности студентов с увеличением самообразования на 1 ч/нед средний балл зачётки увеличивается на 0,032 балла. rxy говорит о том, что между признаком-результатом и признаком-фактором есть слабая прямая линейная связь.
Министерство Высшего Образования РФ
Санкт-Петербургский Государственный Инженерно-Экономический Университет
Студентки 1 курса
Группы 3292
Специальность коммерция
Харькиной Анны.
Преподаватель: Карпова Г. В.
Оценка:
СПб 2001
Лабораторная работа № 1. Тема: «Сводка, группировка, статистические таблицы». Цель: выявление обобщающих закономерностей, характерных для изучаемой совокупности объектов наблюдения как целостной системы. Цель исследования—определение
Лабораторная работа по статистике за второй семестр
Лекции по предмету статистика
Лекции по статистике
Лекции по статистике
Лекции по статистике промышленности
Математическая модель метода главных компонент
Математические методи в психології
Методы проведения экспертного опроса
Методы сглаживания и выравнивания динамических рядов
Метрология, стандартизация и сертификация
Copyright (c) 2025 Stud-Baza.ru Рефераты, контрольные, курсовые, дипломные работы.