|
Розрахунок основних показників адекватності модел
Розрахунок основних показників адекватності модел
МІНІСТРЕСТВО НАУКИ ТА ОСВІТИ УКРАЇНИ ДОНЕЦЬКИЙ ДЕРЖАВНИЙ УНІВЕРСИТЕТ УПРАЛІННЯ Кафедра маркетингу Контрольна робота №1 Виконала Студентка 4 курсу групи М - 06 - 1 Даценко У.В. Перевірила Шкрабак І.В. Донецьк , 2009 Групування - розділення сукупності статистичних показників на групи однорідні за якоюсь ознакою. Інтервал - окреслює кількісні межі груп. Для виконання роботи беремо рівні інтервали. Визначимо інтервал групування за формулою: I=(Xmax - Xmin)/k, де - відповідно максимальна та мінімальна середня кількість відвідувань; - кількість груп. Створимо 4 групи з рівними інтервалами: I=(850 - 185)/4 Розрахуємо інтервали карманів: |
Xmax | 850 | | Хmax | 20282 | | Xmin | 185 | | Xmin | 2712 | | i= | 166,25 | | i= | 4392,5 | | интервал карманов | интервал карманов | | 185,00 | | | 2712,00 | | 351,25 | | | 7104,50 | | 517,50 | | | 11497,00 | | 683,75 | | | 15889,50 | | 850,00 | | | 20282,00 | | |
|
кільк відвідув | дата | | | 185 - 351,25 | 4, 11, 12, 13, 14, 15, 21, 28, 29, 30, 31 | 4657 + 5483,8+3212+4077,4+3165+ 4090,4+4725,2+3165+4090,4 +17556,8+20282 | | | 11 | 74505,00 | | 351,26 - 517,5 | 5, 6, 9,22, 23, 26, | 3032,6+2712+13128,8+3883+ 13128,8+3212 | | | 6 | 39097,20 | | 517,51 - 683,75 | 1, 7, 8, 10, 16, 18, 24, 25, 27 | 10725,6+4725,2+3883+17308+17556,8 +4657+17308+5483,8+4077,4 | | | 9 | 85724,80 | | 683,76 - 850 | 2, 3, 17, 19, 20, | 13298,6+17509,2+20282+3032,6+2712 | | | 5 | 56834,40 | | | | | | сума грн. | дата | | | 2720 - 7104,50 | 4,5,6,7,8, 11,12,13,14, 15,18,19,20,21,22,25,26, 27,28,29 | 4657+3032,6+2712+4725,2 +3883+5483,8+3212+4077 +3165+4090,4+4657+3032,6 +2712+4725,2+3883+5483,8 +3212+3165+40077,4+4090,4 | | | 20 | 78076,80 | | 7104,51 -11497 | 1 | 10725,6 | | | 1 | 10725,6 | | 11497,01 - 15889,50 | 2,9,23 | 13298,6+13128,8+13128,8 | | | 3 | 39556,20 | | 15889,51 - 20282 | 3,10,16,17,24,30,31 | 17509,2+17308+17556,8+20282 +17308+17556+20282 | | | 7 | 127802,80 | | |
Гістограма - є графічним зображенням залежності частоти попадання елементів вибірки від відповідного інтервалу угрупування. |
Карман | Частота | | 185,00 | 2 | | 351,25 | 9 | | 517,50 | 6 | | 683,75 | 9 | | 850,00 | 5 | | Еще | 0 | | |
За даними гістограми можна побачити, що сукупність неоднорідна. За даними гістограми видно, що найбільша кількість відвідин доводиться на вихідні дні. Діаграма Парето є стовбчатою діаграмою, в якій стовпці розташовуються в порядку убування, а додаткова крива може указувати на сукупну частоту для представлених категорій. |
Карман | Частота | Интегральный % | Карман | Частота | Интегральный % | | 185,00 | 2 | 6,45% | 351,25 | 9 | 29,03% | | 351,25 | 9 | 35,48% | 683,75 | 9 | 58,06% | | 517,50 | 6 | 54,84% | 517,50 | 6 | 77,42% | | 683,75 | 9 | 83,87% | 850,00 | 5 | 93,55% | | 850,00 | 5 | 100,00% | 185,00 | 2 | 100,00% | | Еще | 0 | 100,00% | Еще | 0 | 100,00% | | |
Відповідно до гістограми Паретто 77% відповідає тим дням на яких припадало на 1085,6-1533,2 відвідин, а оскільки сукупність неоднорідна, на це впливає кількість вихідних днів у отриманій сукупності.. 64% та 90% також свідчать про вихідні дні, але 32% - це навпаки початок тижня. Описова статистика дозволяє узагальнювати первинні результати, отримані при спостереженні або в експерименті. Процедури тут зводяться до угрупування даних по їх значеннях, побудові розподілу їх частот, виявленню центральних тенденцій розподілу (наприклад, середньої арифметичної) і, нарешті, до оцінки розкиду даних по відношенню до знайденої центральної тенденції. Мета описової статистики - обробка емпіричних даних, їх систематизація, наочна вистава у формі графіків і таблиць, а також їх кількісний опис за допомогою основних статистичних показників.. Середня арифметична (або просто «середня») - це показник центральної тенденції, що часто використовується. Її застосовують, зокрема, в розрахунках, необхідних для опису розподілу і для його подальшого аналізу. Її обчислюють, розділивши суму всіх значень даних на число цих даних. Середньоквадратична помилка середнього характеризує середньоквадратичне відхилення розподілу значень серії. «Помилка» відноситься до помилки вибіркового обстеження. Зважене середнє арифметичне. Зважене середнє використовується, коли спостереження мають різні ступені важливості або частоти. Медіана - можливе значення ознаки, яке ділить ранжирувану сукупність (варіаційний ряд вибірки) на дві рівні частини: 50 % «нижних» одиниць ряду даних матимуть значення ознаки не більше, ніж медіана, а «верхние» 50 % - значення ознаки не менше, ніж медіана.Мода - значення в безлічі спостережень, яке зустрічається найчастіше. Дисперсія вибірки - міра розсіяння, яка є сумою зведених в квадрат відхилень спостережуваних значень від їх середнього значення, ділену на число, на одиницю менше ніж число спостережень. Інтервал - різниця між максимальним і мінімальним значеннями ознаки в кожній групі. Він визначає кількісні межі груп, що для статистичної практики має велике значення, особливо коли потрібно утворити якісно однорідні групи. Після отриманих результатів можна зробити висновки: Дані беруться за 31 день. Кількість відвідувань за цей час становила від 185 до 850 разів за день(всередньому 486 разів на день). Всього за місяць 15045 відвідувань. Відвідини що частіше зустрічаються - 530 Корреляционный анализ. Модель - рішення, що включає сукупність певних елементів звязків, яка із заданою точністю відтворює реакції реального процесу або явиша на зовніші дії Парна лінійна регресія - причинна модель статистичного зв'язку лінійного між двома кількісними змінними х і у, представлена рівнянням в = а + уx, де х - змінна незалежна, у - змінна залежна. В аналітичних угрупуваннях з двох взаємоповязаних показників один розглядається як впливовий чинник( кількість відвідувачів), а інший як наслівок цієї дії( сума виручки) Адекватність побудованого рівняння регресії оцінюється по чотирьох параметрах: - коефіцієнт множинної кореляції R; |
| Столбец 1 | Столбец 2 | | Столбец 1 | 1 | | | Столбец 2 | 0,24164246 | 1 | | |
Коефіцієнт кореляції характеризує не всяку залежність, а лише лінійну. Лінійна імовірнісна залежність випадкових величин полягає в тому, що при зростанні однієї випадкової величини інша має тенденцію зростати (або ж убувати) по лінійному закону. Коефіцієнт кореляції характеризує ступінь тісноти лінійної залежності між випадковими величинами. Якщо випадкові величини і зв'язані точною лінійною функціональною залежністю: то знак «плюс» або «минус» береться залежно від того, позитивний або негативний коефіцієнт В спільному випадку коли величини і зв'язані довільною статистичною залежністю, цей коефіцієнт знаходиться в межах: [-1;1] У випадку -1 говорять про позитивну вибіркову кореляцію величин і, в разі 1 - про негативну кореляцію. Позитивна кореляція між випадковими величинами означає, що при зростанні однієї з них інша має тенденцію в середньому зростати. Негативна кореляція означає що при зростанні однієї з випадкових величин інша має тенденцію в середньому убувати. Таким чином, при R = 0,24164246 можна сказати, що є слабка пряма залежність між кількістю відвідин і сумою виручки - коефіцієнт детермінації R2; Лінійна множинна регресія методом найменших квадратів (МНК) - найбільш розповсюджений випадок використання коефіцієнта детермінації R2. Лінійна множинна регресія МНК має властивість - чим ближче значення до 1 тим ближче модель до емпіричних спостережень Для адекватності моделі R20,75 в даній роботі R2 = 0,058 - F-статистика (критерій Фішера); Критерій Фішера (F-крітері ) - апостеріорний статистичний критерій, використовуваний для визначення значимих відмінностей між груповими середніми в установці дисперсійного аналізу. Рівень значущості (р)0 це підтвердить наявність лінійної регресії. В даній роботі (р) = 0,19 це показує, що говорить про відсутність лінійної регресії - t-статистика (критерій Ст'юдента). Значення t-статистика (критерій Ст'юдента) використовується для оцінки значущості вільного члена отриманої лінійної залежності. Таким чином, рівняння регресії для цієї роботи має вигляд: У=0,008х+416,3. Оскільки відповідність усіх 4х показників дозволяє робити висновок про адекватність моделі, то стає очевидно, що дана модель на адекватна.
|
|