Дисперсионный анализ
Дисперсионный анализ
МИНИСТЕРСТВО ОБРАЗОВАНИЯ УКРАИНЫ ДОНЕЦКАЯ ГОСУДАРСТВЕННАЯ МАШИНОСТРОИТЕЛЬНАЯ АКАДЕМИЯ КАФЕДРА: ЭКОНОМИКА И ФИНАНСЫ ЛАБОРАТОРНАЯ РАБОТА ПО КУРСУ «СТАТИСТИКА» 2008 г. Выполнение задания начинают с группирования совокупности данных для этого определяют количество групп с равными интервалами и рассчитывают величины интервала. Величина интервала: d = (xmax - xmin) / n, ГдеХmax, Xmin - соответственно максимум и минимум значения сгруппированного признака;n - число групп.Границы вариант (групп) определяются путем прибавления минимального значения и величин интервала к минимальному признаку, т.е.[xmin + (xmin + d)],ГдеXmin - нижняя граница инт6ервала (Xmin+d) - верхняя граница интервала.Для следующей варианты (Xmin+d) становятся нижней границей интервала, а верхняя граница на d - больше нижней и т.д. Образовав группы с равными интервалами находят частоту (вес) каждой группы (вариант) т.е. подсчитывают число единиц совокупности входящих в каждую группу при этом необходимо задаться условием: если знание признака у единицы больше совокупности верхней границе интервала то это единица войдет в следующий интервал, т.е. чтобы Xi вошло в соответствующую группу ее значение должно быть в пределахxmin < xi < (xmin + d)Для расчета средней и показателей вариации определяют середину интервала (Xi), которая равна полу сумме его нижней и верхней границ.Xi =[Xmin + (Xmin + d)]/2Расчет средней и показателей вариации по данным задачи требует применения арифметической средней, так как данные представлены в виде вариант и частот. Вес каждой варианты различен, поэтому расчет производят по средней арифметической взвешенной. xi = ?xi •fi / ?fi, Где Xi - средняя арифметическая. Xi - значение варианты определяемого признака (средина интервала). fi - частота (вес) варианты. Чтобы вычислить среднюю вначале следует взвесить варианты (перемножить варианты на их частоты (Xi*fi), затем найти сумму их произведений (Xi*fi), сумму частот (fi) и поделить сумму произведений вариант на частоты на сумму частот (1)). Расчет дисперсии - производят по формуле: ?2 = ? (xi - xi)2 • fi / ? fi Следовательно, прежде всего, необходимо найти отклонения вариант от средней (xi - xi), затем возвести их в квадрат ([(xi - xi)2]) квадраты отклонения взвесить [(xi - xi)2 • fi] и просуммировать взвешенные квадраты отклонений [? (xi - xi)2 • fi.]. Полученную сумму разделить на сумму частот (2). Среднее квадратическое отклонение устанавливают извлечением корня квадратного из значения дисперсии ? = v ?2 Коэффициент детерминации вычисляется по формуле ?2 = ?2 вн / ?2 об, Где ?2 вн - внутригрупповая дисперсия. ?2 об - общая дисперсия. Эмпирическое корреляционное отношение рассчитывается по формуле ? = v ?2 вн / ?2 об, Задача 1. Имеются следующие данные о рабочих одного из участников механического цеха |
Рабочий | Возраст, лет | Месячная З/П, грн. | Рабочий | Возраст, лет | Месячная З/П, грн. | | 1 | 25 | 180,00 | 11 | 18 | 100,00 | | 2 | 24 | 210,00 | 12 | 37 | 280,00 | | 3 | 46 | 390,00 | 13 | 25 | 190,00 | | 4 | 45 | 320,00 | 14 | 30 | 220,00 | | 5 | 42 | 260,00 | 15 | 26 | 210,00 | | 6 | 50 | 310,00 | 16 | 36 | 300,00 | | 7 | 29 | 240,00 | 17 | 40 | 330,00 | | 8 | 36 | 290,00 | 18 | 28 | 240,00 | | 9 | 54 | 390,00 | 19 | 35 | 280,00 | | 10 | 29 | 250,00 | 20 | 25 | 280,00 | | |
Для выявления зависимости между возрастом рабочих и оплатой их труда произведите их группировку по возрасту образовав пять групп с равными интервалами. По каждой группе и совокупности рабочих в целом подсчитайте: 1. Число рабочих; 2. Средний возраст; 3. Среднюю заработную плату; Результаты представьте в таблице. Проанализируйте показатели и сделайте краткие выводы. Решение 1.1 Найдем минимальное и максимальное значение варианты данной совокупности Min = 18 лет; Мах = 54 лет. Определим размах вариации: D = 54 - 18 = 36; Тогда величина интервала составит: d = (54 - 18) / 5 = 7 (лет). Определим границы интервалов (групп) и их середины: Таблица 1. |
№ группы | Границы интервала | Середина интервала | | 1 | 18-25 | 21,5 | | 2 | 25-32 | 28,5 | | 3 | 32-39 | 35,5 | | 4 | 39-46 | 42,5 | | 5 | 46-54 | 49,5 | | |
1.3 Определим принадлежность каждого рабочего к определенному интервалу (произведем группировку) В группу 1 (границы: 18 - 25) входят рабочие: №11 возраст составляет 18 лет с заработной платой 100,00 грн №2 (возраст = 24 года) с (з/п = 210,00 грн) №1 (возраст = 25 лет) с (з/п = 180,00 грн) №13 (возраст = 25 лет) с (з/п = 190,00 грн) №20 (возраст = 25 лет) с (з/п = 280,00 грн) Количество человек в 1_ой группе - 5 В группу 2 (границы: 25 - 32) входят рабочие: №15 (возраст = 26 лет) с (з/п = 210,00 грн) №18 (возраст = 28 лет) с (з/п = 240,00 грн) №7 (возраст = 29 лет) с (з/п = 240,00 грн) №10 (возраст = 29 лет) с (з/п = 250,00 грн) №14 (возраст = 30 лет) с (з/п = 220,00 грн) Количество человек во 2_ой группе - 5 В группу 3 (границы: 32 - 39) входят рабочие: №19 (возраст = 35 лет) с (з/п = 280,00 грн) №8 (возраст = 36 лет) с (з/п = 290,00 грн) №16 (возраст = 36 лет) с (з/п = 300,00 грн) №12 (возраст = 37 лет) с (з/п = 280,00 грн) Количество человек в 3_й группе - 4 В группу 4 (границы: 39 - 46) входят рабочие: №17 (возраст = 40 лет) с (з/п = 330,00 грн) №5 (возраст = 42 года) с (з/п = 260,00 грн) №4 (возраст = 45 лет) с (з/п = 320,00 грн) №3 (возраст = 46 лет) с (з/п = 390,00 грн) Количество человек в 4_й группе - 4 В группу 5 (границы: 46 - 54) входят рабочие: №6 (возраст = 50 лет) с (з/п = 310,00 грн) №9 (возраст = 54 года) с (з/п = 390,00 грн) Количество человек в 5_й группе - 2 1.4 Определим средний возраст работы по каждой группе и по совокупности рабочих в целом Группа 1 х1 = (18+24+25+25+25) / 5 = 23,4 (года); Группа 2 х2 = (26+28+29+29+30) / 5 = 28,4 (года); Группа 3 х3 = (35+36+36+37) / 4 = 36 (лет); Группа 4 х4 = (40+42+45+46) / 4 = 43,25 (года); Группа 5 х5 = (50 + 54) / 2 = 52 (года); По совокупности в целом: Х = (23,4 · 5 + 28,4 · 5 + 36 · 4 + 43,25 · 4 + 52 · 2) / 20 = 34 (года) 1.5 Определим среднюю заработную плату по каждой группе и по совокупности рабочих в целом Группа 1 х1 = (100+210+180+190+280) / 5 = 192,00 (грн); Группа 2 х2 = (210+240+240+240+250+220) / 5 = 280,00 (грн); Группа 3 х3 = (280+300+290+280) / 4 = 287,50 (грн); Группа 4 х4 = (330+260+320+390) / 4 = 325,00 (грн); Группа 5 х5 = (310+390) / 2 = 350,00 (грн); По совокупности в целом: Х = (192,00 · 5 + 280,00 · 5 + 287,50 · 4 + 325,00 · 4 + 350,00 · 2) / 20 = 236,50 (грн). Таблица 3. Группировка рабочих по возрасту работы. |
№ группы | Границы интервалов | Показатели по каждой группе | Показатели по совокупности в целом | | | | Вес варианты | Средний возраст работы | Средняя заработная плата | Средний возраст работы | Средняя заработная плата | | 1 | 18-25 | 5 | 23,4 | 192,00 | | | | 2 | 25-32 | 5 | 28,4 | 280,00 | | | | 3 | 32-39 | 4 | 36 | 287,50 | 34 | 236,50 | | 4 | 39-46 | 4 | 43,25 | 325,00 | | | | 5 | 46-54 | 2 | 52 | 350,00 | | | | |
Выводы: На основании полученных результатов по группировке рабочих по возрасту и проведенных расчетов можно сделать следующие выводы: - наибольшее количество рабочих имеют возраст в пределах 18 - 25 лет (в среднем 23,4 года) и 25 - 32 лет (в среднем 28,4 года), наименьшее количество рабочих имеют возраст в интервале 46 - 54 года (в среднем 52 года). Средний же возраст работников предприятия составляет 34 года. - наибольшую среднюю заработную плату имеют рабочие входящие в пятую группу возрастных пределов 46 - 54 года (в среднем 350,00 грн), наименьшую среднюю заработную плату имеют рабочие входящие в первую группу возрастных пределов 18 - 25 лет (в среднем 192,00 грн). Средняя заработная плата работников предприятия составляет 236,50 грн. Задача 7 По данным задачи 1 для выявления тесноты связи между возрастом рабочих и оплатой труда вычислить коэффициент детерминации. Решение Определим дисперсию по каждой группе рабочих и по совокупности в целом: Группа 1 21 = ((18 - 23,4)2 + (24 - 23,4)2 + 3 • (25 - 23,4)2) / 5 = 7,44; Группа 2 22 = ((26 - 28,4)2 + (28 - 28,4)2 + 2 • (29 - 28,4)2 + (30 - 28,4)2) / 5 = 1,84; Группа 3 23 = ((35 - 36)2 + 2 • (36 - 36)2 + (37 - 36)2) / 4 = 0,5; Группа 4 24 = ((40 - 43,25)2 + (42 - 43,25)2 + (45 - 43,25)2 + (46 - ? 43,25)2) / 4 = 5,69; Группа 5 25 = ((50 - 52)2 + (54 - 52)2) / 2 = 4. По совокупности в целом: 2 = ((21,5 - 34)2 · 5 + (28,5 - 34)2 · 5 + (35,5 - 34)2 · 4 + (42,5 - 34)2 · 4 + (49,5 - 34)2 · 2) / 20 = 85,55. Определим общую дисперсию = [(21,5 2 · 5 + 28,52 · 5 + 35,52 · 4 + 42,52 · 4 + 49,52 · 2) / 20] - [(21,5 · 5 + 28,5 · 5 + 35,5 · 4 + 42,5 · 4 + 49,5 · 2) / 20)]2 = 1176,95 - 1092,30 = 84,65. Задача 2 За отчетный период имеются следующие данные об электровооруженности труда выработке продукции рабочими завода |
Рачий | Электровооруженность труда одного рабочего, кВт*ч | Рачий | Электровооруженность труда одного рабочего, кВт*ч | | 1 | 24,7 | 11 | 27,4 | | 2 | 23,0 | 12 | 26,7 | | 3 | 24,0 | 13 | 23,3 | | 4 | 28,0 | 14 | 22,1 | | 5 | 26,3 | 15 | 25,8 | | 6 | 24,3 | 16 | 22,6 | | 7 | 24,7 | 17 | 23,6 | | 8 | 20,0 | 18 | 25,9 | | 9 | 21,4 | 19 | 21,9 | | 10 | 25,0 | 20 | 23,8 | | |
Сгруппируйте рабочих по электровооруженности труда, образовав четыре группы с равными интервалами. По каждой группе и совокупности рабочих в целом подсчитайте: Их число; Среднюю электровооруженность труда; Дисперсию и среднее квадратическое отклонение; Коэффициент вариации. Постройте гистограмму и полигон распределения рабочих. Сделайте вывод. Решение Группировка рабочих по электровооруженности труда. 1. Найдем минимальное и максимальное значение варианты данной совокупности по признаку возраста: Min = 20 кВт·ч; Мах = 28 кВт·ч. Опредилим размах вариации: D =28 - 20=8 (кВт·ч); Тогда величина интервала составит: d = (28 - 20) / 4 = 2 (кВт·ч). 2. Определим границы интервалов (групп) и их середины: Таблица 1 |
№ группы | Границы интервала | Середина интервала | | 1 | 20 - 22 | 21 | | 2 | 22 - 24 | 23 | | 3 | 24 - 26 | 25 | | 4 | 26 - 28 | 27 | | |
4. Определим принадлежность каждого рабочего к определенному интервалу (произведем группировку) В группу 1 (границы: 20 - 22) входят рабочие: №8 (Электровооруженность труда =20,0 кВт·ч) №9 (Электровооруженность труда =21,4 кВт·ч) №19 (Электровооруженность труда = 21,9 кВт·ч) Количество человек в 1_ой группе = 3 В группу 2 (границы: 22 - 24) входят рабочие: №2 (Электровооруженность труда = 23,0 кВт·ч) №13 (Электровооруженность труда = 23,3 кВт·ч) №14 (Электровооруженность труда = 22,1 кВт·ч) №16 (Электровооруженность труда = 22,6 кВт·ч) №17 (Электровооруженность труда = 23,6 кВт·ч) №20 (Электровооруженность труда = 23,8 кВт·ч) Количество человек во 2_ой группе = 6 В группу 3 (границы: 24 - 26) входят рабочие: №1 (Электровооруженность труда = 24,7 кВт·ч) №3 (Электровооруженность труда = 24,0 кВт·ч) №6 (Электровооруженность труда = 24,3 кВт·ч) №7 (Электровооруженность труда = 24,7 кВт·ч) №10 (Электровооруженность труда = 25,0 кВт·ч) №15 (Электровооруженность труда = 25,8 кВт·ч) №18 (Электровооруженность труда = 25,9 кВт·ч) Количество человек в 3_й группе = 7 В группу 4 (границы: 11 - 13) входят рабочие: №4 (Электровооруженность труда = 28,0 кВт·ч) №5 (Электровооруженность труда = 26,3 кВт·ч) №11 (Электровооруженность труда = 27,4 кВт·ч) №12 (Электровооруженность труда = 26,7 кВт·ч) Количество человек в 4_й группе = 4 5. Определим среднюю электровооруженность труда по каждой группе рабочих в отдельности и по всей совокупности в целом: Группа 1 х1 = (19,0 + 20,4 + 20,9) / 3 = 20,1 (кВт·ч) Группа 2 х2 = (22,0 + 22,3 + 21,1 + 21,6 + 22,6 + 22,8) / 6 = 22,1 (кВт·ч); Группа 3 х3 = (23,7 + 23,0 + 23,3 + 23,7 + 24,0 + 24,8 + 24,9) / 7 = 23,9 (кВт·ч); Группа 4 х4 = (27,0 + 25,3 + 26,4 + 25,7) / 4 = 26,1 (кВт·ч). По совокупности в целом: Х = (20 · 3 + 22 · 6 + 24 · 7 + 26 · 4) / 20 = 23,2 (кВт·ч) 6. Определим дисперсию по каждой группе рабочих в отдельности и по всей совокупности в целом: Группа 1 21 = ((19,0 - 20,1)2 + (20,4 - 20,1)2 + (20,9 - 20,1)2) / 3 = 0,65. Группа 2 22 = ((22,0 - 22,1)2 + (22,3 - 22,1)2 + (21,6 - 22,1)2 + (21,1 - -22,1)2 + (22,6 - 22,1)2 + (22,8 - 22,1)2) / 6 = 0,34. Группа 3 23 = ((23,7 - 23,9)2 + (23 - 23,9)2 + (23,3 - 23,9)2 + (23,7 - 23,9)2 + (24,0 - 23,9)2+ (24,8 - 23,9)2 + (24,9 - 23,9)2) / 7 = 0,44. Группа 4 24 = ((27,0 - 26,1)2 + (25,3 - 26,1)2 + (26,4 - 26,1)2 + (25,7 - 26,1)2) / 4 = 0,42. По совокупности в целом: 2 = ((20 - 23,2)2 ·3+ (22 - 23,2)2 · 6+ (24 - 23,2)2 · 7+ (26 - 23,2)2 · 4) / 20 =3,76 7. Определим среднее квадратическое отклонение по каждой группе рабочих в отдельности и по всей совокупности в целом: Группа 1 1 = 0,65= 0,8. (кВт·ч) Группа 2 2 = 0,34 = 0,58 (кВт·ч) Группа 3 3 = 0,44 = 0,66 (кВт·ч) Группа 4 4 = 0,42 = 0,65 (кВт·ч) По совокупности в целом: = 3,76 = 1,94 (кВт·ч). 8. Определим коэффициент вариации по каждой группе рабочих в отдельности и по всей совокупности в целом: Группа 1 v1 = 0,8 / 20,1 = 0,040 (4,0%). Группа 2 v2 = 0,58 / 22,1 = 0,026 (2,6%). Группа 3 v3 = 0,66 / 23,9 = 0,028 (2,8%). Группа 4 v4 = 0,65 / 26,1 = 0,025 (2,5%). По совокупности в целом: V = 1,94 / 23,2 = 0,084 (8,4%). Таблица 1. Группировка рабочих по электровооруженности труда |
Границы интервалы | Середина интервала | Вес варианты | Показатели по каждой группе | | | | | Средняя электровооруженность труда. | Дисперсия | Ср. квад. отклонение | Коеффициент вариации % | | 19 - 21 | 20 | 3 | 20,1 | 0,65 | 0,8 | 4,0 | | 21 - 23 | 22 | 6 | 22,1 | 0,34 | 0,58 | 2,6 | | 23 - 25 | 24 | 7 | 23,9 | 0,44 | 0,66 | 2,8 | | 25 - 27 | 26 | 4 | 26,1 | 0,42 | 0,65 | 2,5 | | |
Выводы На основании полученных результатов по группировке рабочих по электровооруженности труда и проведенных расчетов можно сделать следующие выводы:- наибольшее количество рабочих имеют электровооруженности труда в пределах 23-25 кВт·ч (в среднем 24 кВт·ч), наименьшее количество рабочих имеют электровооруженности труда в интервале 19 - 21 кВт·ч (в среднем 20 кВт·ч). Средняя электровооруженности труда работников предприятия составляет 23,2 кВт·ч.- в среднем отклонение от средней электровооруженности труда работников как в сторону увеличения, так и в сторону уменьшения составляет 1,94 кВт·ч, что составляет 8,4%.Лабораторная работа №2Расчет средней и показателей по данным сгруппированного массива Цель - научиться производить расчеты на ЭВМ по данным интервального вариационного ряда. Рассчитать среднюю, среднее квадратическое отклонение. Построить полигон и гистограмму. Проанализировать полученные данные. Расчет средней, дисперсии и среднего квадратического отклонение производя по формулам (1) и (3). Однако в качестве вариант в задачах приведены так называемые «открытые» варианты. В начале следует закрыть варианты, а затем, найдя полу сумму интервалов, ввести их в программу в виде усредняемых значений признака xi и fi - частоты повторения каждой варианты. Среднее линейное отклонение L - есть средняя арифметическая из абсолютных значений отклонений вариант от средней и определяется по формуле: L=((Xi-X)*fi)/fi Согласно формуле в начале находят абсолютные отклонения каждой варианты от средней ((Xi-X), а затем каждое абсолютное отклонение взвешивают ((Xi-X)*fi), суммируют взвешенные абсолютные отклонения ((Xi-X)*fi) и это суммы делят на сумму частот (fi). Задача 1 В целях изучения норм расхода сырья на единицу продукции из партий изделий проведена двухпроцентная механическая выборка, в результате которой получена двухпроцентная механическая выборка, в результате которой получено следующее распределение |
Расход сырья, г | Изготовлено изделий, шт. | | До 20 | 25 | | 20-22 | 32 | | 22-24 | 67 | | 24-26 | 37 | | Свыше 26 | 24 | | Итого | 185 | | |
Определите: средний расход сырья на одно изделие; дисперсию и среднее квадратическое отклонение; среднее линейное отклонение; коэффициент вариации. Решение предоставьте в таблице. Поясните значение исчисленных показателей. Решение Для упрощения решения представим его в виде таблицы и для нахождения средней и дисперсии воспользуемся способом моментов: |
Расход сырья на 1_цу изделия, г. | Изготовленно изделий, шт. | Середина интервала. | |Х-Х|·f | (X - A) | (X - A) i | (Х - А)·f i | (Х - А) 2 i2 | (X - A) 2 ·f i2 | | До 20 | 25 | 19 | 100 | -4 | -2 | -50 | 4 | 100 | | 20 - 22 | 32 | 21 | 64 | -2 | -1 | -32 | 1 | 32 | | 22 - 24 | 67 | 23 | 0 | 0 | 0 | 0 | 0 | 0 | | 24 - 26 | 37 | 25 | 72 | 2 | 1 | 37 | 1 | 37 | | Свыше 26 | 24 | 27 | 96 | 4 | 2 | 48 | 4 | 96 | | Итого | 185 | | |Х-Х| · f= 332 | | | (X-A) ·f/ i = 3 | | ((X - A) / i) 2·f = 265 | | |
1. Для нахождения средней и дисперсии воспользуемся способом моментов: Х=m1 · i +A; 2 = i 2 (n ·(m2 - m1 2); m1= ((X - A) ·f / i))/f; m2= ((X - A) / i) 2·f)/f; где m1, m2 - соответственно моменты первого и второго порядка; i - величина интервала; А - варианта, имеющая наибольшую частоту; F - значение весов или частот каждой варианты. Наиболее частото встречаются изделия с расходом сырья на единицу продукции =23 г. Значит А=23 (г.). Определим величину интервала (визуально видно, что интервалы имееют равную величину): I=22-20=24-22=26-24=2 (г.) На основании расчетов представленных в таблице найдем Х и 2: Х= (3/185) · 2 + 23=23,03 (г.) 2 = 4 · ((265/185) - (3/185) 2)= 4 · (1,43 - 0)=5,72 Найдем среднее квадратическое отклонение: =v5,72=2,39 (г.) 2. Определим среднее линейное отклонение: L= 332/185=1,79 (г.) 3. Определим коэффициент вариации: V=1,79/23,03=0,078 (7,8%). Вывод На основании проведенных расчетов можно сделать следующие выводы: - средний расход сырья на единицу изделия равен ? 23 г. - среднее квадратическое отклонение показывает, что возможно отклонение от среднего расхода сырья на единицу продукции как в сторону увеличения, так и в сторону уменьшения на 2,39 г., что составляет 7,8% (см. коэффициент вариации). - среднее линейное отклонение также показывает возможное отклонение от среднего расхода сырья на единицу продукции как в сторону увеличения, так и в сторону уменьшения, но менее точно, чем среднее квадратическое отклонение, и составляет 1,79 г. Лабораторная работа №3 Расчет внутри групповой и межгрупповой дисперсии. Правило сложения дисперсийЦель - изучить элементы дисперсионного анализа. Получить практические навыки производства на ЭВМ трудоемких расчетов показателей внутригрупповой, межгрупповой дисперсий для различного количества групп. Произвести расчет корреляционного отношения.Проверить правило сложений дисперсий. Приобрести навыки анализа и практического применения этих показателей.Выполнение задания предусматривает расчет показателей, характеризующих случайную и систематическую вариации и их роли в общей вариации. Эти показатели широко используются на производстве при количественной оценке влияния различных факторов на те или иные показатели, осуществляемой с помощью дисперсионного анализа.Общая дисперсия рассматривалась при выполнение заданий 1 и 2. Она характеризует общую вариацию под влиянием всех причин, ее вызывающих и исчисляется по формуле (3).Для оценки влияния группировочного признака (постоянного фактора) на величину вариаций рассчитывают межгрупповую дисперсию, исчисляемую на основании групповых средних:U? =((Xi-X)? *fi)/fi (1)U? - межгрупповая дисперсия;Xi - групповые средние исчисляются по формуле (1)X - общее среднее (также исчисляется по формуле (1)fi - групповые частоты.При оценке влияния случайных факторов и их роли в общей вариации определяют внутригрупповую дисперсию. Она исчисляется как средняя арифметическая из групповых дисперсий. ? =( ? i *fi)/fi (2)? - внутригрупповая (средняя из групповых) дисперсия;? - групповые дисперсии (исчисляются по формуле (2)).В математической статистика доказано, что общая дисперсия ? равна сумме внутригрупповой и межгрупповой дисперсий, т.е.? = ? +U?Исходя из этого правила, можно определить влияние случайной и систематической дисперсий на общую дисперсию, установить тесноту связи между признаками. Для этого применяется в дисперсионном анализе корреляционное отношение ?:?= /хЗадача 2 Имеются следующие данные о распределении рабочих по возрасту работы двух заводов и объединения |
Возраст работы, лет | | Количество рабочих | | | | Завод 1 | Завод 2 | Объединение | | До 5 лет | 67 | 32 | 99 | | 5-10 | 125 | 77 | 202 | | 10-15 | 162 | 119 | 281 | | 15-20 | 89 | 70 | 159 | | Свыше 20 | 42 | 37 | 79 | | |
Определите: средний возраст работы одного рабочего по каждому заводу и по объединению в целом; дисперсию для каждого завода (внутригрупповую) и для объединения в целом (общую); среднюю из внутригрупповых дисперсий; межгрупповую дисперсию; корреляционное отклонение. Проверьте правило сложения дисперсий. Поясните сущность исчисленных показателей. Решение 1. Определим средний возраст работы одного рабочего по каждому заводу и по объединению в целом. Так как нам дан интервальный ряд с равными интервалами, то определим сначала середины интервалов и полученные данные занесем в таблицу. Таблица 1 |
Возраст работы, лет. | Середина интервала. | Количество рабочих. | | | | Завод 1 | Завод 2 | Объединение. | | До 5 | 2,5 | 67 | 32 | 99 | | 5 - 10 | 7,5 | 125 | 77 | 202 | | 10 - 15 | 12,5 | 162 | 119 | 281 | | 15 - 20 | 17,5 | 89 | 70 | 159 | | Свыше 20 | 22,5 | 42 | 37 | 79 | | Итого | | 485 | 335 | 820 | | |
Средний возраст работы одного рабочего на заводе 1: Х1 = (2,5 ? 67 + 7,5 ? 125 + 12,5 ? 162 + 17,5 ? 89 + 22,5 ? 42)/485=11,6 (лет). Средний возраст работы одного рабочего на заводе 2: Х2 = (2,5 ? 32 + 7,5 ? 77 + 12,5 ? 119 + 17,5 ? 70 + 22,5 ? 37)/335=12,5 (лет). Средний возраст работы одного рабочего на объединении в целом: Х =(2,5 ? 99 + 7,5 ? 202 + 12,5 ? 281 + 17,5 ? 159 + 22,5 ? 79)/820=12,0 (лет). 2. Определим дисперсию для каждого завода в отдельности (внутригрупповую) и по объединению в целом: Дисперсия на заводе 1: 2 1= ((2,5-11,6) 2 ? 67 + (7,5-11,6) 2 ? 125 +(12,5-11.6) 2 ? 163 + (17,5 -11,6)2? 89 + (22,5-11,6) 2 ? 42)/485=32,72; Дисперсия на заводе 1: 22=((2,5-12,5) 2 ? 32 + (7,5-12,5) 2? 77 + (12,5-12,5) 2 ?119 + (17,5-12,5) 2? 70+ (22,5-12,5) 2 ? 37)/335=31,57 Дисперсия по объединению в целом (общую дисперсию): u 2=((2,5-12.0) 2 ? 99 + (7,5-12,0) 2 ? 202 + (12,5-12,0) 2 ? 281 + (17,5-12,0) 2 ?159 + (22,5-12,0) 2 ? 79)/820=32,46 3. Определим среднюю из внутригрупповых дисперсий: 2 =(32,72+31,57) /2=32,15 4. Определим межгрупповую дисперсию: 2 = ((11,6-12,0) 2 ?485 +(12,5-12,0) 2 ?335)/820=0,20 5. Определим среднее квадратическое отклонение для каждого завода в отдельности и по объединению в целом: Завод 1: 1=v32,72=5,72 (лет). Завод 2: 2=v31,57=5,62 (лет). Объединение: =v32,46=5.7 (лет). 6. Определим корреляционное отклонение (коэффициент вариации): Корреляционное отклонение (коэффициент вариации) для завода 1: ? =v32,72 /11,6=0,493 (49,3%); Корреляционное отклонение (коэффициент вариации) для завода 2: ? = v31,57 /12,5=0,449 (44,9%); Корреляционное отклонение (коэффициент вариации) по объединению в целом (общее): ? = v32,46 /12,0=0,475 (47,5%). 7. Проверим правило сложения дисперсий: u 2= 32,17 +0,2=32,37?32,46 Выводы На основании проведенных расчетов можно сделать следующие выводы: - средний возраст работы одного рабочего на заводе 1 равен 11,6 лет, на заводе 2 -12,5 лет и по объединению в целом -12,0 лет. - в среднем отклонение от среднего возраста работы одного рабочего, как в сторону увеличения, так и в сторону уменьшения по заводу 1 составляет 5,72 лет (или 49,3%), по заводу 2 -5,62 лет (или 44,9%), по объединению в целом -5,7 лет (или 47,5%).
|