|
Прогнозирование финансово-экономических показателей и их обработка
Прогнозирование финансово-экономических показателей и их обработка
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ Региональная кафедра "Высшей математики и информатики" Челябинского филиала Отчет по лабораторным работам Студентки Преподаватель кафедры Челябинск 2009 Содержание - Лабораторная работа № 1
- Предварительная обработка статистических данных финансово-экономических показателей с помощью корреляционного анализа
- Практическая часть
- Анализ результатов решения задачи по протоколу лабораторной работы №1
- Лабораторная работа № 2
- Прогнозирование финансово-экономических показателей на основе качественной оценки регрессионной модели
- Практическая часть
Лабораторная работа №1Предварительная обработка статистических данных финансово-экономических показателей с помощью корреляционного анализаКраткие теоретические сведения.Корреляционный анализ является статистическим методом, который применяется только тогда, когда данные наблюдений можно считать случайными и выбранными из генеральной совокупности, имеющей нормальный закон распределения.Основная задача корреляционного анализа заключается в выявлении формы и степени тесноты связи между показателями, включенными в исследование. Кроме того, с помощью корреляционного анализа решаются задачи:Отбор факторов, оказывающих наиболее существенное влияние на результативный признак (эндогенную или зависимую переменную), на основании измерения степени связи между ними;Обнаружение ранее неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между параметрами, но устанавливает численное значение этих связей и достоверность суждений об их наличии.При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n наблюдений. Основными средствами анализа данных являются парные коэффициенты корреляции, частные коэффициенты корреляции и множественные коэффициенты корреляции.Рассмотрим двумерную модель корреляционного анализа. Связь между экономическими показателями X и Y в генеральной совокупности можно описать коэффициентом корреляции: (1)где - коэффициент корреляции (парный коэффициент корреляции) генеральной совокупности; - момент корреляции (или корреляционный момент).Оценкой коэффициента корреляции генеральной совокупности является выборочный парный коэффициент корреляции: (2)где - выборочные оценки среднеквадратических отклонений показателей Х и Y; - выборочные оценки математических ожиданий показателей Х и Y.Значение парного коэффициента корреляции является показателем тесноты связи. Его знак определяет форму связи между показателями:отрицательная связь - при возрастании одного показателя, другой имеет тенденцию в среднем уменьшаться;положительная связь - при возрастании одного показателя, другой имеет тенденцию в среднем возрастать.(Знак "+" или "-" несет не математическое предназначение, а определяет направление связи взаимного влияния показателей).По данным выборки (объемом n) для заданных показателей Х и Y определяется выборочный коэффициент корреляции . Для каждой выборки (объема n) выборочный коэффициент корреляции этих показателей будет иметь свое значение, отличное от коэффициентов других выборок (объема n). Таким образом, выборочный коэффициент корреляции будет случайной величиной.В связи с этим, вывод о наличии (отсутствии) корреляционной связи между показателями Х и Y обосновывается путем проверки нулевой гипотезы : , т.е. равен ли нулю выборочный коэффициент корреляции. Проверка этой гипотезы осуществляется с применением критерия Стьюдента, расчетное значение которого определяется по формуле: (3)где - среднеквадратическое отклонение (стандартная ошибка) коэффициента корреляции r: (4)Расчетное значение критерия (3) сравнивается с табличным (критическим) значением критерия Стьюдента .если , то нулевая гипотеза об отсутствии корреляционной связи между показателями Х и Y не отвергается (связь отсутствует);если <, то нулевая гипотеза об отсутствии корреляционной связи между показателями Х и Y отвергается (связь есть).Для качественной оценки коэффициента корреляции применяются различные шкалы. Наиболее часто применяется шкала Чеддока. В зависимости от значения коэффициента корреляции, он может иметь одну из оценок:0,1 - 0,3 - слабая;0,3 - 0,5 - умеренная;0,5 - 0,7 - заметная;0,7 - 0,9 - высокая;0,9 - 1,0 - весьма высокая.Как правило, экономический процесс описывается числом показателей больше двух, т.е. вектором , где - i-ый показатель (фактор). В таком случае для анализа процессов в экономике применяется множественный корреляционный анализ.Взаимосвязь между показателями для вектора Х можно описать коэффициентами корреляции , которые определяются по формуле (2), а их совокупность называется нормированной корреляционной матрицей R: (5)Свойства корреляционной матрицы, значение которых полезно для решения ряда прикладных задач:1. Все диагональные элементы матрицы R равны единице: (6)2. Корреляционная матрица - симметричная, коэффициенты корреляции (элементы корреляционной матрицы), симметричные относительно главной диагонали, равны между собой: , так как произведение не зависит от порядка следования сомножителей в формуле:= (7)В случае многомерной корреляции взаимосвязи между показателями более многообразны и сложны, чем в двумерном случае. Одной корреляционной матрицей уже нельзя полностью описать эти взаимосвязи. В связи с этим, в многомерном корреляционном анализе рассматривается две задачи:1. Определение тесноты связи одного показателя с совокупностью остальных (n-1), включенных в исследование;2. Определение тесноты связи между показателями при фиксировании или исключении влияния остальных k, при k< (n-2).Решение этой задачи осуществляется с помощью выборочного коэффициента множественной корреляции: (8)где - определитель корреляционной матрицы R (5): - алгебраическое дополнение элемента матрицы R.Коэффициент множественной корреляции изменяется от 0 до +1.Проверка значимости коэффициента множественной корреляции осуществляется путем сравнения расчетного значения критерия Фишера: (9)с табличным . Табличное значение критерия определяется заданным уровнем значимости и степенями свободы и (). Коэффициент R значимо отличается от нуля, если выполняется неравенство >.Квадрат коэффициента множественной корреляции принято называть выборочным множественным коэффициентом детерминации, который показывает, какую долю вариации (случайного разброса) исследуемого показателя объясняет вариация совокупности остальных показателей .Если рассматриваемые случайные величины коррелируют друг с другом, то на величину коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между двумя показателями при исключении влияния остальных показателей, включенных в данное исследование. Есть два взаимосвязанных обстоятельства, которые препятствуют широкому практическому применению частных характеристик статистической связи:частные характеристики зависят от заданных уровней "мешающих" показателей ;для подсчета выборочных значений частных характеристик необходимо иметь выборку специальной структуры, обеспечивающей наличие хотя бы нескольких наблюдений при каждом из заданного ряда фиксированных значений "мешающих" показателей .Если исследуемые показатели подчиняются нормальному многомерному закону, то указанные выше неудобства автоматически исчезают, так как в этом случае частные коэффициенты корреляции не зависят от уровней "мешающих" показателей , и выборочный частный коэффициент корреляции определяется по формуле: (10)где - алгебраические дополнения к соответствующим элементам матрицы (5).Частный коэффициент корреляции, так же как и парный коэффициент корреляции изменяется от - 1 до +1. Значимость частных коэффициентов корреляции оценивается путем сравнения расчетного значения критерия Стьюдента (3) с табличным :если , частный коэффициент корреляции значим;если , частный коэффициент корреляции не значим.Практическая частьИсследовать структуру привлеченных ресурсов Калининского филиала ОАО "Челиндбанк" за 2004 год (тыс.руб.) - выявить статьи ресурсов, которые оказывают наибольшее влияние на сумму привлеченных ресурсов и выполнить прогноз на первые три месяца 2005 года с доверительной вероятностью 0,95.|
Ресурсы | 2004г | | | | | | | | | | | | | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | | Ресурсы купленные | 412.7 | 383.7 | 392 | 422.1 | 464.2 | 372.5 | 351.8 | 358.9 | 375.6 | 391.4 | 393.1 | 402.8 | | Средства на счетах юридических лиц | 76.5 | 68.0 | 77.7 | 91.4 | 105.9 | 97.2 | 103.6 | 100.7 | 118.1 | 111.3 | 113.9 | 133.7 | | Депозиты юридических лиц | 2.1 | 2.0 | 1.7 | 2.0 | 1.7 | 2.0 | 2.2 | 2.4 | 3.6 | 4.3 | 4.3 | 4.1 | | Собственные векселя | 14.7 | 14.1 | 15.9 | 13.0 | 12.2 | 14.4 | 13.8 | 11.6 | 15.2 | 15.4 | 14 | 17.5 | | Вклады физических лиц | 98.9 | 105.0 | 111.3 | 117.3 | 121.3 | 124.0 | 121.5 | 120.4 | 121.4 | 124.9 | 129.8 | 136 | | Всего привлеченных ресурсов | 604.9 | 572.8 | 598.6 | 645.8 | 705.3 | 610.1 | 592.9 | 594.0 | 633.9 | 647.3 | 655.1 | 694.1 | | |
Обозначим переменные: · Ресурсы купленные Х1 - независимая переменная; · Средства на счетах юридических лиц Х2 - независимая переменная; · Депозиты юридических лиц Х3 - независимая переменная; · Собственные векселя Х4 - независимая переменная; · Вклады физических лиц Х5 - независимая переменная; Всего привлеченных ресурсов Y - зависимая переменная Анализ результатов решения задачи по протоколу лабораторной работы №1При выборе факторов в модель, которую будем исследовать, необходимо руководствоваться коэффициентами частной корреляции. Они показывают "чистую" корреляционную связь между показателем и фактором, при этом остальные факторы, включенные в исследование, зафиксированы на уровне своих средних значений.Таблица 1|
Матрица частных корреляций | | Переменная | Фактор - Х1 | Фактор - Х2 | Фактор - Х3 | Фактор - Х4 | Фактор - Х5 | Показатель - Y | | Фактор - Х1 | 1.000 | 0.275 | -0.586 | -0.193 | -0.407 | 0.627 | | Фактор - Х2 | 0.275 | 1.000 | 0.363 | 0.208 | 0.870 | -0.017 | | Фактор - Х3 | -0.586 | 0.363 | 1.000 | -0.179 | -0.324 | 0.642 | | Фактор - Х4 | -0.193 | 0.208 | -0.179 | 1.000 | -0.247 | 0.422 | | Фактор - Х5 | -0.407 | 0.870 | -0.324 | -0.247 | 1.000 | 0.285 | | Показатель - Y | 0.627 | -0.017 | 0.642 | 0.422 | 0.285 | 1.000 | | Критическое значение на уровне 95% при 6 степенях свободы = +0.5239 | | |
Как видно из табл.1 факторы Х1 и Х3 оказывают заметное влияние на показатель Y. Значение частных коэффициентов корреляции каждого фактора больше критического значения коэффициента корреляции, равного +0,5239. Поэтому эти факторы включаются в модель исследования. Дополнительно приведем таблицу 2, анализ данных которой позволяет сделать вывод о степени значимости множественного коэффициента корреляции всех привлеченных ресурсов (показатель Y) от всей совокупности факторов (Х1-Х5). Таблица 2 |
Множественные корреляции | | Переменная | Коэффициент | F-значение | %точка F- распределен. | | Фактор - Х1 | 0.704 | 0.819 | 40.132 | | Фактор - Х2 | 0.959 | 9.421 | 98.684 | | Фактор - Х3 | 0.868 | 2.553 | 83.867 | | Фактор - Х4 | 0.616 | 0.510 | 21.780 | | Фактор - Х5 | 0.950 | 7.692 | 97.964 | | Показатель - Y | 0.918 | 4.470 | 93.917 | | Число степеней свободы = 6 и 4. | | |
Расчетное значение критерия Фишера Fрасч.=6,16 Исследуем влияние "Ресурсов купленных" (Фактор 1), "Депозитов юридических лиц" (Фактор 3) на "Сумму привлеченных ресурсов" (Показатель - Y). Качественную оценку парных коэффициентов корреляции (табл.3) выполним с помощью шкалы Чеддока. Главная цель анализа данных табл.3 состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Х1 и Х3. Критическое значение коэффициента корреляции rкр=0,4982 (табл.3). Таблица 3 |
Матрица парных корреляций | | | | Переменная | Фактор - Х1 | Фактор - Х3 | Показатель - Y | | Фактор - Х1 | 1.000 | -0.158 | 0.262 | | Фактор - Х3 | -0.158 | 1.000 | 0.759 | | Показатель - Y | 0.262 | 0.759 | 1.000 | | Критическое значение на уровне 95% при 2 степенях свободы = +0.4982 | | |
На уровень Показателя Y высокое влияние оказывает Фактор Х3, rух3=0,759. Причем, это влияние носит положительный характер, т.е. при увеличении значения Фактора приводит к тому, что уровень Показателя Y в среднем возрастает. Теперь рассмотрим влияние Факторов Х1, Х3 на показатель Y при зафиксированных средних значениях остальных факторов (табл.4). Таблица 4 |
Матрица частных корреляций | | | | Переменная | Фактор - Х1 | Фактор - Х3 | Показатель - Y | | Фактор - Х1 | 1.000 | -0.568 | 0.594 | | Фактор - Х3 | -0.568 | 1.000 | 0.840 | | Показатель - Y | 0.594 | 0.840 | 1.000 | | Критическое значение на уровне 95% при 3 степенях свободы = +0.5024 | | |
Значение частных коэффициентов корреляции каждого фактора больше критического значения коэффициента корреляции, равного +0,5024. Как видно из табл.4 Фактор Х1 оказывает заметное, а Фактор Х3 высокое влияние на Показатель Y. Для наглядности на рис.1 и рис.2 представлены значения парных и частных коэффициентов корреляции табл.3 и табл.4, соответственно. Рис.1 Рис.2 Оценка данных таблицы "Матрица оптимальных лагов" (табл.5) позволяет сделать вывод о том, что с начала сбора информации на показатель Y оказывает влияние фактор Х3 (rмакс. Х3 = 0,759, см. табл.6). Таблица 5 |
Матрица оптимальных лагов | | | | Переменная | Фактор - Х1 | Фактор - Х3 | Показатель - Y | | Фактор - Х1 | 0 | 4 | 3 | | Фактор - Х3 | 4 | 0 | 0 | | Показатель - Y | 3 | 0 | 0 | | |
А фактор Х1 начинает максимально действовать на Показатель Y с запаздыванием (табл.5) и принимает rмакс. Х1 = - 0,439 (табл.6). Таблица 6 |
Матрица максимальных корреляций | | | Переменная | Фактор - Х1 | Фактор - Х3 | Показатель - Y | | Фактор - Х1 | 1.000 | 0.234 | -0.439 | | Фактор - Х3 | 0.234 | 1.000 | 0.759 | | Показатель - Y | -0.439 | 0.759 | 1.000 | | |
Анализ данных табл.7 позволяет сделать вывод о значимости множественного коэффициента корреляции Показателя Y от всей совокупности факторов, рассматриваемых в модели (rух1*х3=0, 852). Это обусловлено тем, что расчетное значение критерия Фишера Fрасч.= 7.061 (табл.7) больше табличного Fтабл. (a=0,05; к1=3; к2=7) = 4,35. Таблица 7 |
Множественные корреляции | | | | Переменная | Коэффициент | F-значение | %точка F-распред. | | Фактор - Х1 | 0.608 | 1.562 | 76.284 | | Фактор - Х3 | 0.844 | 6.624 | 98.982 | | Показатель - Y | 0.852 | 7.061 | 99.153 | | Число степеней свободы = 3 и 7 | | | | |
Таким образом, проведенный анализ показывает, что Факторы Х1 "Ресурсы купленные", Х3 "Депозиты юридических лиц" в той или иной степени оказывают влияние на Показатель Y "Сумма привлеченных ресурсов". Сравнивая значения Показателя Y, приведенные в таблицах 2 и 7 (Множественные корреляции), можно сделать вывод о правильности проведенного исследования и выбора факторов в модель. В качестве общего вывода по проведенному предварительному исследованию исходных данных можно сказать, что для продолжения исследования, т.е. построения регрессионной модели (второй этап) целесообразно включить Факторы Х1 и Х3. Лабораторная работа №2Прогнозирование финансово-экономических показателей на основе качественной оценки регрессионной моделиКраткие теоретические сведения.Основной задачей линейного регрессионного анализа является установление формы связи между показателями, выбор наиболее информативных факторов , включенных в модель, оценивание неизвестных значений параметров уравнения связи и анализ его точности: (1)где - независимое случайное i - ое наблюдение с условным математическим ожиданием , т.е. математическое ожидание зависимой переменной при условии, что факторы Х приняли конкретное значение .Функция (1), описывающая зависимость условного среднего значения зависимой переменной Y от заданных значений факторов называется функцией (уравнением) регрессии, а метод статистического анализа показателя Y (зависимая переменная) от факторов (неслучайные переменные) называется регрессионным анализом.В регрессионном анализе под линейной моделью подразумевается модель, линейно зависящая от неизвестных параметров . Собственно линейной называется модель, линейно зависящая как от параметров , так и от переменных . Регрессионной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы, влияющие на вариацию результативного признака, обладает высоким (не ниже 0,5) коэффициентом детерминации и коэффициентами регрессии, интерпретируемыми в соответствии с теоретическим знанием о природе связей в изучаемой системе.Рассмотрим простейший случай регрессионного анализа для линейной зависимости между зависимой переменной Y и одной независимой переменной Х (парный корреляционный анализ):, (2)где - постоянная величина (свободный член уравнения). Можно ли дать разумное объяснение значению Y даже при Х=0 зависит от гипотезы, для которой применяется регрессионный анализ (в некоторых случаях свободный член в уравнении регрессии не имеет реального смысла); - коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны данные наблюдений. Это параметр, характеризующий процентное изменение переменной Y, при изменении значения Х на единицу. Если >0 - переменные Х и Y положительно коррелированны, если <0 - отрицательно коррелированны; - независимая (, если ) нормально распределенная случайная величина - остаток (помеха) с нулевым математическим ожиданием (=0) и постоянной дисперсией (). Она отражает тот факт, что изменение Y будет неточно описываться изменением Х, т.к. присутствуют другие факторы, неучтенные в данном исследовании.Статистическая значимость параметров модели и (их надежность) измеряется степенью вариации (их разброса) относительно теоретических значений и . Надежность получаемых оценок и зависит от дисперсии случайных отклонений (ошибок). По данным выборки эти отклонения и, соответственно, их дисперсия не оцениваются. В расчетах используются отклонения зависимой переменной Y от ее модельных значений . Так как ошибки (остатки) нормально распределены, то среднеквадратическое отклонение ошибок используется для измерения этой вариации. Среднеквадратические отклонения коэффициентов известны как стандартные ошибки (отклонения): (3) (4)где - математическое ожидание независимой переменной Х; - дисперсия (мера разброса, вариация) зависимой переменной Y, обусловленная влиянием случайных факторов - необъясненная дисперсия, или дисперсия остаточной компоненты: (5)где k - число оцениваемых параметров уравнения регрессии.Для определения степени значимости параметров модели выдвигается нулевая гипотеза , утверждающая, что коэффициенты статистически незначимо отличны от нуля: .Проверка этих гипотез связана с определением расчетных значений критерия Стьюдента (t-статистика) для соответствующих коэффициентов регрессии: (6)Затем расчетные значения сравниваются с табличными . Табличное значение критерия Стьюдента (Приложение 5 методического пособия) определяется при (n-2) степенях свободы (n - число наблюдений) и соответствующем уровне значимости . Нулевая гипотеза отвергается, если выполняется условие: (7)и параметры модели считаются значимыми. В противном случае, если условие (7) не выполняется, гипотеза не отвергается и параметры модели считаются не значимыми.Регрессионные модели применяются для прогнозирования возможных ожидаемых значений зависимой переменной Y. При этом перенос закономерности связи, измеренной в исследуемой совокупности в статике, на динамику не является корректным и требует проверки условий допустимости такого переноса (экстраполяции).Прогнозируемое значение переменной Y получается при подстановке в уравнение регрессии (8)ожидаемой величины фактора Х. Данный прогноз называется точечным. Возникает ограничение при выборе ожидаемой величины Х: нельзя подставлять значения независимой переменной , значительно отличающиеся от входящих в исследуемую выборку, по которой вычислено уравнение регрессии. Для определения ожидаемого значения фактора Х можно порекомендовать следующий алгоритм:1. Вычисляется "средний абсолютный прирост" (САП): (9)где и - это значения фактора Х, соответственно, при t=n и t=1.2. По формуле:, (10)рассчитываются прогнозные значения фактора (k - шаг прогноза).3. Вычисляются прогнозные значения зависимой переменной Y - полученные значения подставляются в формулу (8).Вероятность того, что фактическое значение показателя Y в будущем будет в точности равно значению точечного прогноза практически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с заданной вероятностью (надежностью).Средняя ошибка положения линии регрессии в генеральной совокупности при значении фактора вычисляется для линии регрессии по формуле: (11)где - табличное значение t-статистики с уровнем значимости и числом степеней свободы (n - 2);S - стандартная ошибка остаточной компоненты (5).Границы доверительного интервала вычисляются, соответственно, как:нижняя граница - верхняя граница - (12)Считается, что период прогнозирования должен быть в 3 раза короче, чем тот период, для которого было оценено уравнение регрессии.В случае, когда изменения результативного признака Y определяются действием совокупности других признаков Х= () имеет место многомерный регрессионный анализ. Модель множественной линейной регрессии в матричной форме имеет вид: (13)где - вектор-столбец зависимой переменной размерности n; - вектор-столбец неизвестных параметров размерности m+1; - вектор-столбец случайных ошибок, размерности n; - матрица значений известных неслучайных факторов размеренности n (m+1) причем n> m.Оценке подлежат параметры матрицы и остаточная дисперсия . Заменив параметры в формуле (13) их оценками, уравнение регрессии примет вид:. (14)Вектор оценок параметра определяется по формуле:, (15)где () - матрица неособенная, т.е. ее определитель отличен от нуля.Метод пошаговой регрессии состоит в том, что в процессе вычисления для обычной множественной линейной регрессии по n независимым переменным получается n последовательных уравнений, которые при исследовании функционального соотношения между зависимой переменной и отобранным k подмножеством из полного множества параметров, имеют вид: (16)Управление введением переменных в уравнение регрессии осуществляется с помощью статистических критериев значимости, например: добавляется переменная , корреляция которой с из данных предварительно отобранных параметров максимальна.Описанный выше алгоритм называется движением вперед. Движение назад определяется последовательностью регрессионных функций, начинающейся с полной регрессии по n независимым переменным . На каждом шаге решения исключается одна из переменных . В пакете программ "СтатЭкперт" реализован метод последовательного включения переменных в уравнение регрессии.Гребневая регрессия. Процедура с использованием "следа гребня" (ridge trace) предназначена для "плохо обусловленных" ситуаций, когда имеются значительные корреляции между разными независимыми переменными (факторами), входящими в модель. Вследствие этого матрица () становится почти вырожденной, а оценки параметров модели регрессии не устойчивы. В этом случае крайне затруднительно получить единственное решение. Это явление во множественном регрессионном анализе получило название "мультиколлинеарность".Мультиколлинеарность - это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. Проблема мультиколлинеарности возникает только для случая множественной регрессии и в основном проявляется в задачах, где исходные данные являются результатом пассивного эксперимента. Особенно часто она имеет место при анализе макроэкономических данных, таких, как доходы и производство, где инфляция, например, может повлиять на оба параметра.В условиях наличия мультиколлинеарности нельзя применять уравнение регрессии для прогноза значений переменной Y. В то же время, если уравнение регрессии предполагается использовать для прогноза значений переменной Y только в точках, близких к значениям объясняющих переменных из матрицы данных Х, то оно может оказаться вполне удовлетворительным. Таким образом, последствия мультиколлинеарности тем серьезнее, чем больше информации необходимо получить из имеющейся совокупности наблюдений.Коэффициенты регрессии , являются именованными числами, выраженными в разных единицах измерения. Поэтому трудно, а иногда и невозможно сопоставить факторы Х по степени их влияния на зависимую переменную Y. Для устранения этого недостатка в практике экономического анализа используются следующие коэффициенты:коэффициент эластичности, Э;бета-коэффициент, ;дельта-коэффициент, .С помощью частных коэффициентов эластичности, а также бета-коэффициентов можно выполнить ранжирование факторов по степени их влияния на зависимую переменную, сопоставить их между собой по величине этого влияния. С другой стороны, они не позволяют непосредственно оценить долю влияния фактора в суммарном влиянии всех факторов на объясняемую переменную Y. Для решения этой задачи используется дельта-коэффициент.Коэффициент эластичности для линейной регрессии имеет вид:, (17)где - коэффициент модели при j-м факторе; - среднее значение j-го фактора; - среднее значение зависимой переменной.Формула коэффициента эластичности определяется видом модели регрессии. В руководстве пользователя представлена таблица их соответствия выбранной модели регрессии.Коэффициент эластичности j-го фактора говорит о том, что при отклонении его величины от среднего значения на 1%, и при фиксированных на постоянном уровне значениях других факторов, входящих в уравнение, объясняемая переменная Y отклонится от своего среднего значения на процентов. Иначе, - при увеличении значения фактора на 1% от его средней величины объясняемая переменная увеличивается на процентов от ее средней величины.Для устранения различий в измерении и степени изменения объясняющих переменных (факторов) используется стандартизованный коэффициент регрессии или -коэффициент: (18)где - коэффициент модели при j-м факторе; - оценка среднеквадратического отклонения j-го фактора; - оценка среднеквадратического отклонения зависимой переменной Y.Бета-коэффициент при факторе определяет меру влияния его вариации (изменения) на вариацию зависимой переменной Y при фиксированной на одном уровне вариации остальных независимых факторов, входящих в уравнение регрессии.Отношение -коэффициента фактора к его коэффициенту эластичности есть отношение коэффициента вариации фактора к коэффициенту вариации зависимой переменной: (19)где - коэффициент вариации по выборочному значению среднеквадратического отклонения j-го фактора; - коэффициент вариации по выборочному значению среднеквадратического отклонения зависимой переменной Y.Доля вклада каждой независимой переменной в суммарное влияние всех факторов определяется дельта-коэффициентом: (20)где - бета - коэффициент j-го фактора ; - коэффициент парной корреляции j-го фактора и зависимой переменной Y; - коэффициент множественной детерминации, вычисляемый по формуле: (21)Произведение называется коэффициентом раздельной детерминации и обозначается, как: (22)причем, . Следовательно, дельта-коэффициент k независимых факторов равен единице: (23)При корректно проводимом анализе значения -коэффициентов положительны, т.е. все коэффициенты регрессии имеют тот же знак, что и соответствующие парные коэффициенты корреляции. Но в случаях сильной коррелированности факторов некоторые дельта-коэффициенты могут быть отрицательными вследствие того, что соответствующий коэффициент регрессии имеет знак, противоположный парному коэффициенту корреляции.Практическая частьНа основании данных табл.1 модель изменения Суммы привлеченных ресурсов от изменения значений факторов Х1, Х3 имеет вид:375,977 + 0,441* Х1 + 26,721* Х3 (1)где - модельные значения Суммы привлеченных ресурсов; Х1 - Ресурсы купленные; Х3 - Депозиты юридических лиц.Параметры модели (,,) значимы, т.к. их расчетные значения критерия Стьюдента (табл.1) больше критического (табличного) значения (k=9) = +1,101 (табл.1). Включенные в модель факторы Х1, Х3 на 99,9% (табл.3) описывают изменения Суммы привлеченных ресурсов - коэффициент множественной детерминации равен YХ1, Х3 = 0.999 (табл.3). Коэффициент множественной детерминации значим, т.к. расчетное значение критерия Фишера (табл.3) больше табличного : .Данный факт подтверждает правильность выбора факторов для описания изменения уровня Суммы привлеченных ресурсов в данном исследовании.Таблица 1|
Оценки коэффициентов линейной регрессии | | Переменная | Коэффи циент | Среднекв. отклонение | t- значение | Нижняя оценка | Верхняя оценка | Эластичость | Бета- коэф-т | Дельта- коэф-т | | Св. член | 375,977 | 82,407 | 4,562 | 285,243 | 466,711 | 0,000 | 0,000 | 0,000 | | Фактор - X1 | 0,441 | 0, 199 | 2,217 | 0,222 | 0,661 | 0,279 | 0,103 | 0,111 | | Фактор - X3 | 26,721 | 5,753 | 4,645 | 20,387 | 33,055 | 0,116 | 0,821 | 0,889 | | Кpитическое значения t-pаспpеделения пpи 9 степенях свободы (p=85%) = +1.101 | | |
Анализ коэффициентов эластичности, бета-коэффициентов и дельта-коэффициентов позволяет сделать следующие выводы (табл.1): 1. При отклонении значения фактора на 1% от своего среднего значения приводит к отклонению Суммы привлеченных ресурсов на величину: - 0,279 % для Ресурсов купленных; - 0,116 % для Депозитов юридических лиц; 2. При вариации значений фактора на одно среднеквадратическое отклонение приводит к отклонению Суммы привлеченных ресурсов от своего среднего на величину: =0,103 ее среднеквадратического отклонения для Ресурсов купленных; =0,821 ее среднеквадратического отклонения для Депозитов юридических лиц. 3. Наибольший вклад в суммарное влияние факторов Х1, Х3 на изменение Суммы привлеченных ресурсов вносит фактор Х3, т.к. дельта коэффициент имеет значение равное = 88,9 %. Таким образом, изменение Суммы привлеченных ресурсов определяется изменением значений Депозитов юридических лиц. Для оценки качества модели необходимо доказать ее адекватность. Доказательство адекватности модели осуществляется путем оценки свойств остаточной компоненты: (2) где - i-е значение остаточной компоненты; - i-е фактическое значение уровня полной себестоимости; - i-е значение уровня полной себестоимости, полученное с помощью модели. Значения остаточной компоненты представлены в табл.2, а некоторые ее характеристики - в табл.3. Таблица 2 |
Таблица остатков | | номер | Факт | Расчет | Ошибка абсолютная | Ошибка относительная, (%) | | 1 | 604,900 | 614,255 | -9,355 | -1,546 | | 2 | 572,800 | 598,782 | -25,982 | -4,536 | | 3 | 598,600 | 594,429 | 4,171 | 0,697 | | 4 | 645,800 | 615,732 | 30,068 | 4,656 | | 5 | 611,850 | 626,298 | -14,448 | -2,361 | | 6 | 610,100 | 593,838 | 16,262 | 2,665 | | 7 | 592,900 | 590,046 | 2,854 | 0,481 | | 8 | 594,000 | 598,524 | -4,524 | -0,762 | | 9 | 633,900 | 637,961 | -4,061 | -0,641 | | 10 | 647,300 | 663,639 | -16,339 | -2,524 | | 11 | 655,100 | 664,390 | -9,290 | -1,418 | | 12 | 694,100 | 663,327 | 30,773 | 4,434 | | |
Таблица 3 |
Характеристики остатков | | Характеристика | Значение | | Среднее значение | 0,011 | | Дисперсия | 291,884 | | Приведенная дисперсия | 389,179 | | Средний модуль остатков | 14,011 | | Относительная ошибка | 2,227 | | Критерий Дарбина-Уотсона | 1,947 | | Коэффициент детерминации | 0,999 | | F - значение (n1 = 2, n2 = 9) | 5972,299 | | Критерий адекватности | 90,910 | | Критерий точности | 81,717 | | Критерий качества | 84,016 | | Уравнение значимо с вероятностью 0.95 | | | |
Оценим свойства остаточной компоненты: 1. Математическое ожидание остаточной компоненты ,011 (табл.3). Примем его условно равным 0, следовательно, первое свойство выполняется. 2. Уровни остаточной компоненты не коррелированны между собой, т.к. расчетное значение критерия Дарбина-Уотсона (табл.3) больше верхней границы табличного (). Табличные значения критерия получены при уровне значимости , числе объясняющих переменных р=2 и числе уровней остаточной компоненты n=12. (Приложение 7 методического пособия). >, следовательно, это свойство выполняется. 3. Уровни остаточной компоненты будут распределены по нормальному закону, если выполняется требование: Расчетное значение RS - критерия определяется по формуле: (3) где максимальное и минимальное значения уровней остаточной компоненты (столбец абсолютных значений уровней остаточной компоненты табл.2); - среднеквадратическое отклонение остаточной компоненты, как корень квадратный из дисперсии, значение которой находится в табл.3; (30,773+25,982) /17,085=3,32 Сравним полученное значение с табличными (Приложение 8 методического пособия). Параметры - это нижняя и верхняя границы табличного значения RS-критерия, которые определяются при уровне значимости (ошибке) =0,05 и числе уровней остаточной компоненты n=12. , значит, свойство выполняется. 4. Проверим, носят ли уровни остаточной компоненты случайный характер. Если , то это свойство выполняется. - это количество “пиков”, которые определяются по значениям остаточной компоненты (столбец абсолютных значений уровней остаточной компоненты табл.2). - расчетное значение количества "пиков", которое определяется по формуле: , (4) где n=12 - число уровней временного ряда остаточной компоненты; [] - обозначают целую часть числа [3,97] = 3. 6 > 3,следовательно, это свойство выполняется. Все свойства остаточной компоненты выполняются и, следовательно, модель является адекватной. Кроме того, модель имеет высокий уровень точности, т.к. средняя относительная ошибка остаточной компоненты составляет всего 2,227 %, а значение критерия точности составляет 81,717 % (табл.3). Таким образом, полученное уравнение регрессии (1) значимо с вероятностью 0,95 (табл.3) и может применяться для прогнозирования уровня Суммы привлеченных ресурсов, т.к. модель адекватна реальному процессу ее изменения (90,910 %) и имеет высокое качество (84,016 %). На рис.1 и рис.2 в виде номограммы и графика представлены данные абсолютных и относительных значений остаточной компоненты, соответственно, взятые из табл.2. Рис.1 Рис.2 Выводы относительно возможности применения полученной модели для прогноза подтверждают результаты расчета ретро прогноза (табл.4, табл.5). Полученные значения точек прогноза практически совпадают с фактическими значениями уровней ряда - подтверждением этому являются не значительные абсолютные и относительные отклонения (табл.4). Кроме того, фактические значения временного ряда Суммы привлеченных ресурсов попадают в интервал прогноза, полученный с помощью модели регрессии (1) (табл.4). Статистические характеристики ретро-прогноза имеют не высокие значения, кроме максимального отклонения (табл.5). Все это говорит о весьма высоком уровне качества модели, и возможности ее применения для прогнозирования. Таким образом, полученные результаты ретро-прогноза подтвердили выводы предыдущего этапа моделирования об адекватности модели и ее высокой точности. Таблица 4 |
Таблица ретро-прогнозов (p = 80%) | | Упреждение | Факт | Прогноз | Нижняя граница | Верхняя граница | Абс. откл-ние | Отн. откл-ние, (%) | | 1 | 647,300 | 656,423 | 623,568 | 689,278 | -9,123 | -1,409 | | 2 | 655,100 | 657,081 | 624,055 | 690,107 | -1,981 | -0,302 | | 3 | 694,100 | 656,124 | 624,993 | 687,255 | 37,976 | 5,471 | | |
Таблица 5 |
Таблица характеристик ретро-прогнозов | | Характеристика | Абсолют. значение | Относит. значение, (%) | | Среднее значение | 8,957 | 1,253 | | Среднеквадратическое отклонение | 20,725 | 3,017 | | Средний модуль ошибки | 16,360 | 2,394 | | Максимальное отклонение | (-3,37*10^38) | (-3,37*10^38) | | Минимальное отклонение | -1,981 | -0,302 | | |
Рис.3 На завершающем этапе моделирования с помощью модели регрессии (1) было выполнено прогнозирование уровня Суммы привлеченных ресурсов Калининского филиала ОАО "Челиндбанка". С вероятностью 0,95 можно утверждать, что предполагается рост в первом квартале уровня Суммы привлеченных ресурсов за счет роста Депозитов юридических лиц и Ресурсов купленных. Скорее всего, это будет обусловлено вкладами денежных средств (банковские депозиты) в Калининский филиал ОАО "Челиндбанка" со стороны предприятий, организаций, учреждений, фирм. Таблица 6 |
Таблица прогнозов (p = 95%) | | Упреждение | Прогноз | Нижняя граница | Верхняя граница | | 1 | 687.392 | 657.917 | 716.867 | | 2 | 698.841 | 664.221 | 733.462 | | 3 | 713.175 | 672.780 | 753.571 | | |
Рис.4
|
|