Метод главных компонент
Метод главных компонент
Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования ВОСТОЧНО-СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ (ГОУ ВПО ВГТУ) ИНСТИТУТ ЭКОНОМИКИ И ПРАВА Кафедра «Макроэкономика, экономическая информатика и статистика» Индивидуальное задание по МСА Метод главных компонент Выполнила: ст-ка гр 527 Горюнова Зинаида Проверила: Орехова Р.А. Улан-Удэ 2009 Задача Провести компонентный анализ на основе показателей Х1 - товарооборот единицы продукции, Х2 - цена продукции. По данным годовых отчетов 6 предприятий имеем: |
№ предприятия | Х1 | Х2 | | 1 2 3 4 5 6 | 0.36 0.39 0.27 0.25 0.35 0.33 | 0.83 0.81 0.70 0.77 0.69 0.72 | | xj | 0.33 | 0.74 | | sj | 0.014 | 0,026 | | |
Решение 1 ЭТАП 1. Определим среднее значение показателей Х1 и Х2 и их среднеквадратическое отклонение 2. Постоим матрицу коэффициентов корреляции, если R12 = 0.28 R= = 3. Оценим вклад в суммарную дисперсию первой и второй компоненты. Преобразуем матрицу R в диагональную матрицу Л собственных значений характеристического многочлена ¦лE - R¦ ¦лE - R¦ = = = (л - 1)2 - (-0.28)2 = 0 л - 1 = ф ф2 - 0,282 = 0 ф = ±0.28 ф1 = 0.28 ф2 = -0.28 л1 - 1 = ф1 л2 - 1 = ф2 л1 - 1 = 0.28 л2 - 1 = -0.28 л1 = 1.28 л2 = -0.72 лj упорядочены, т.е. л1 > л2 D = ? лj = л1 + л2 = k = 2 Вклад в суммарную дисперсию первой главной компоненты можно подсчитать так: (Лr/ m)*100% л1/2 *100% = 64% л2/2*100% = 36% Вывод: расчеты показали, что оба фактора Х1 и Х2 необходимы для включения в дальнейшие расчеты. 2 ЭТАП. Рассчитаем элементы матрицы нормированных собственных векторов U, т.е. ортогональную матрицу, составленную из собственных векторов матрицы R Собственный вектор Uj, отвечающий собственному числу лj, находится как отличное от 0 решение уравнения (лjE - R) = 0 Т.к. определитель ¦лE - R¦= 0, то строки системы линейно зависимы. Составим нужные нам 2 уравнения. j =1 ¦л1E - R¦= 0 (л1 - 1)u11 + (-r12)u21 = 0 -r21u11 + (л1 - 1)u21 = 0 Видим, что система линейных уравнений зависима. Это значит, что для нахождения параметров можно воспользоваться только одним из уравнений. Используем только первое. (л1 - 1)u11 + (-r12)u21 = 0 0.28 u11 - 0.28 u21 = 0 Примем u11 = 1, тогда u21 = 1 U1 = (1,1) Находим норму вектора U1 ¦U1¦ = v uij2 = v u11 2 + u212 = v2 = 1.41 v1 = u1/ ¦u1¦= Повторяем эту операцию для j = 2 ¦л1E - R¦= 0 (л2 - 1)u12 + (-r12)u22 = 0 -r21u12 + (л2 - 1)u22 = 0 Также выбираем первое уравнение (л2 - 1)u12 + (-r12)u22 = 0 Примем u12 =1, тогда u22 = -1 U2 = (1,-1) ¦ U2¦ = v uij2 = v u12 2 + u222 = v2 = 1.41 V2 = u2/ ¦u2¦= U = Данная матрица является ортогональной. UUT = UTU = E UT= * = = 3 ЭТАП А = U Л Ѕ Л Ѕ = = A = = ?ajr2 = лr л1 = a112 + a212 = 0.64 + 0.64 = 1.28 л2 = a122 + a222 = 0.36 + 0.36 = 0.72 Из матрицы факторных нагрузок А видно, что первая главная компонента имеет одинаковую тесноту связи 0.80 с обоими признаками Х1 и Х2. Вторая главная компонента также определяется признаками Х1 и Х2, но со вторым признаком связь обратная -0.60 В результате анализа можно сказать, что первая главная компонента, складывающаяся под влиянием обоих факторов, может быть интерпретирована как фактор, характеризующий уровень организации в отрасли. 4 ЭТАП. Рассчитаем элементы матрицы F значений главных компонент F = A-1z = Л-ЅUTz m=2, n=6 Строим матрицу нормированных значений z zji = (xij - xj)/ sj z11 = (x11 - x1)/s1 = = 2.14 z12 = 4.29 z13 = -4.29 z14 = -5.71 z15 = 1.42 z16 = 0 z21 = (x12 - x2)/s2 = = 3.46 z22 = 2.69 z23 = -1.92 z24 = 1.15 z25 = -3.84 z26 = -0.77 z = Значения главных компонент получаем из выражения fr1 =( 1/ vлl )*? uilzji l = 1,2 f11 = 1/vл1 (u11z11 +u21z21) = (0.71*2.14 + 0.71*3.46) = 0.88(1.519 + 2.456) = 3.50 f12 = 4.36 f13 = -3.88 f14 = -2.85 f15 = -1.51 f16 = -0.48 f21 = 1/vл2 (u12z11 +u22z21) = (0.71*2.14 - 0.71*3.46) = 1.18(1.519 - 2.456) = 1.11 f22 = 0.99 f23 = -1.48 f24 = -4.30 f25 = 3.30 f26 = 0.48 Таким образом, матрица значений главных компонент имеет вид: F = Элементы каждого столбца характеризуют предприятия в пространстве главных компонент По рисунку видно, что организация производства в отрасли не стабильна.
|