Примеры решения задач по статистике
Примеры решения задач по статистике
10 Вариант 2. 1. Какая шкала называется ранговой? Приведите примеры. Ранговая шкала - это порядковая шкала, в которой числа присваиваются объектам для обозначения относительной степени, в которой определенные характеристики присущи тому или иному объекту. Она позволяет узнать, в какой мере выражена конкретная характеристика данного объекта, но не дает представления о степени ее выраженности. Таким образом, порядковая шкала отображает относительную позицию, но не значительность разницы между объектами. Объект, находящийся по рангу на первом месте, имеет более сильно выраженную характеристику по сравнению с тем, что находится на втором месте, но при этом не известно, насколько значительно различие между ними. Примерами порядковых шкал служат качественные ранги, ранги команд в турнирах, социально-экономические классы и профессиональный статус. В маркетинговых исследованиях порядковые шкалы используются для измерения отношения, мнения, восприятия и предпочтения. Измерительные инструменты подобного типа включают такие суждения респондентов, как «более чем» или «менее чем». В порядковой шкале, как и в номинальной, эквивалентные объекты имеют одинаковый ранг. Объектам могут присваиваться значения любого ряда чисел, при условии сохранения характера взаимосвязей между ними. Например, порядковые шкалы можно трансформировать любым способом, если при этом сохраняется первоначальный порядок расположения. Другими словами, допустимо любое монотонное положительное (сохраняющее порядок) преобразование шкал, так как, кроме порядка расположения, другие свойства чисел полученного ряда значения не имеют (ниже приведен пример). 2. Репрезентативная выборка - это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Таким образом, если 50% всех законодательных органов штатов собираются лишь раз в два года, приблизительно половина состава репрезентативной выборки законодательных органов штатов должна быть такого типа. Если 2% всех студентов колледжей являются спортсменами, приблизительно та же самая часть репрезентативной выборки студентов колледжей должна приходиться на спортсменов. Иными словами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Это распространение результатов и есть то, что мы называем генерализуемостью. 3. Охарактеризуйте понятие «разброс выборки» Разброс = Обобщенное название характеристик изменчивости распределения. Типичными мерами разброса являются дисперсия, стандартное отклонение, размах и интерквартильная широта. 4. Что такое стандартное отклонение? Стандартное отклонение - мера, позволяющая некоторым образом учитывать вероятность возможных “плохих” результатов и их величину. Вместо того чтобы измерять вероятности различных результатов, мера риска должна некоторым образом оценивать степень возможного отклонения действительного результата от ожидаемого. 5. Меры центральной тенденции - это (measures of central tendency) -- различные способы осмысления центральной или средней позиции группы наблюдений, чисел и т.д. Имеются три меры: мода, медиана и среднее. Мода -- наиболее частое значение. Медиана -- значение, занимающее центральное положение, имея множество величин как ниже, так и выше себя. Среднее (чаще называемое средней величиной) вычисляется путем суммирования всех индивидуальных значений и деления суммы на число случаев или наблюдений. Иногда совокупность наблюдений выдает бимодальное распределение (где две разные величины встречаются наиболее часто). Кроме того, при наличии равного числа наблюдений центрального значения медианы нет. В этом случае ее проводят на полпути между двумя центрально расположенными значениями. Если в распределении много значений, медиана приблизительно вычисляется путем интерполяции. Данные сначала группируются в совокупность числа частот, а за нее принимают расположенные внутри средней группы, и математически определяют ее положение от процента случаев более низких и более высоких частот. Выбор применяемой меры центральной тенденции зависит от двух факторов: используемых уровней измерения (см. Критерии и уровни измерения) и величины дисперсии в совокупности наблюдений. Там, где используется мера номинального уровня, следует рассчитывать только моду. Например, если числовые величины были назначены различным типам размещения, мода покажет, который из них наиболее распространенный, но и среднее, и медиана были бы лишены значений. Медиана лучше всего подходит к мерам порядкового уровня, где относительные расстояния между категориями не известны (хотя надо сказать, что многие социальные ученые прибегают к среднему, когда имеют дело с переменными порядкового уровня. Ведь тогда можно провести большое количество статистических тестов). Наконец, среднему, как правило, отдается предпочтение при мерах интервального уровня, кроме тех случаев, в которых имеется ряд предельных значений, искажающих распределение. Например, средние доходы группы респондентов легко исказить, включив в модель нескольких получателей высоких заработков. Тогда лучше применять медиану, которая пригодна и к сгруппированным данным с открытой "самой высокой" категорией. Так, доход мог бы быть сгруппирован таким образом, что все получают по 100 тыс. ф. ст. в год объединены вместе, и нет верхнего предела заработка у людей данной категории. Тогда среднее не может быть рассчитано, а величина медианы оценивается путем интерполяции, 6. Что такое шкала Z-оценок? Буквой Z обозначается стандартная оценка, основанная на нормальном распределении. Иначе говоря, Z-o. яв-ся мерой отклонения от среднего, выраженной в единицах стандартного отклонения. Если х -- нормально распределенная переменная со средним ми стандартным отклонением у, тогда Z стандартная оценка. Говорят, что любое значение переменной, преобразованное в Z-o., яв-ся нормированным (т. е. переведенным в значения другой шкалы, основанной на единичном нормальном распределении со средним, равным 0, и стандартным отклонением, равным 1). Преимущество стандартизации (нормирования) несравнимых распределений заключается в том, что эти распределения приводятся к одному масштабу, что позволяет напрямую сравнивать ранее несопоставимые переменные. Участок нормальной кривой, заключенный между Z= -1,96 и Z= +1,96, содержит 95% всех случаев, а участок между Z= -2,576 и Z= +2,576 включает 99% случаев, и потому одно из этих двух множеств Z-o. обычно используется при определении конечных точек критической области для принятия нулевой гипотезы в психол. исслед. 7. Охарактеризуйте понятие «ось значимости» Ось значимости - направленная прямая, на которой откладываются значения G-параметра, полученных в различных критериях зона значимости зона неопределенности зона не значимости G кр. (p ? 0,01) G кр. (p ? 0,05) Если G эмп. ? G кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости. Если G эмп. › G кр. на некотором уровне значимости, то H0 принимается на том же уровне значимости. Чем меньше G эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен. Н0 и Н1 - принимаемые гипотезы. 8. Решить задачу, используя критерий тенденций Пейджа. Шести респондентам предъявлялся тест Равенна. Фиксируется время решения каждого задания. Экспериментатор предполагает, что время решения четвёртого задания будет значимо отличаться от времени решения первых трёх заданий. Результаты замеров представлены в таблице. Решение Критерий L Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых. Критерий позволяет выявить тенденции в измерении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений. |
| Время решения первого задания теста. Сек. | Ранг | Время решения второго задания теста. Сек. | Ранг | Время решения третьего задания теста. Сек. | Ранг | Время решения четвёртого задания теста. Сек. | Ранг | | 1 | 8 | 3 | 3 | 1 | 5 | 2 | 12 | 4 | | 2 | 4 | 1 | 15 | 4 | 12 | 2 | 13 | 3 | | 3 | 6 | 1 | 23 | 4 | 15 | 2 | 20 | 3 | | 4 | 3 | 1 | 6 | 2 | 6 | 2 | 12 | 3 | | 5 | 7 | 2 | 12 | 4 | 3 | 1 | 8 | 3 | | 6 | 15 | 3 | 24 | 4 | 12 | 2 | 7 | 1 | | Суммы | 43 | 11 | 83 | 19 | 53 | 11 | 72 | 17 | | Средние | 7,1 | | 13,8 | | 8,8 | | 12 | | | |
Сумма рангов составляет: 11+19 + 11+17 = 58. Сформулируем гипотезы. Но: Тенденция увеличения индивидуальных показателей от первого условия к четвёртому является случайной. Н1: Тенденция увеличения индивидуальных показателей от первого условия к четвёртому не является случайной. Эмпирическое значение L определяется по формуле: L=?(Tij), где Ti - сумма рангов по каждому условию; j - порядковый номер, приписанный каждому условию в новой последовательности Lэмп.=2*(11*1)+(17*2)+(19*3)=107 По табл. VIII приложения 1 определяем критические значения L для данного количества испытуемых: n=6, и данного количества условий: с=4. Построим «Ось значимости»: L0,05 L 0,01 … ? ! Lэмп. ›L кр. Ответ: Но отклоняется. Принимается Н1. Тенденция увеличения индивидуальных показателей от первого условия к третьему не является случайной (р<О,О1). 9. Решите задачу, используя критерий хи-квадрат. Экспериментатору необходим идеальный кубик для чистоты эксперимента. Идеальный кубик - это кубик, каждая грань которого выпадала бы примерно равное число раз при достаточно большом числе подбрасываний. Задача состоит в выяснении того. Будет ли данный кубик близок к идеальному? Для решения этой задачи кубик подбрасывали 60 раз. Выпадение граней распределилось следующим образом. |
Грани кубика | 1 | 2 | 3 | 4 | 5 | 6 | | Частота выпадения | 12 | 9 | 11 | 14 | 8 | 6 | | |
1. проверим выполнение ограничений: количество испытуемых в группе - 60 испытаний (60 > 20); 2. результаты занесены в таблицу. Число составляемых разрядов ? = 6; 3. сформулируем гипотезы: Н 0: различия между данным кубиком и идеальным не значимы; Н 1: различия между данным кубиком и идеальным значимы. 4. вычисления чІ проведем в таблице |
чІ | ѓi ґ | ?i ґґ | ?i ґ- ?i ґґ | (ѓiґ - ѓiґґ) І | ?i ґ + ?i ґґ | (ѓiґ - ѓiґґ) І ?i ґ + ?i ґґ | | 1 | 12 | 10 | 2 | 4 | 22 | 0.18 | | 2 | 9 | 10 | -1 | 1 | 19 | 0.05 | | 3 | 11 | 10 | 1 | 1 | 21 | 0,05 | | 4 | 14 | 10 | 4 | 16 | 24 | 0.67 | | 5 | 8 | 10 | -2 | 4 | 18 | 0,22 | | 6 | 6 | 10 | -4 | 16 | 16 | 1 | | | | | | | | ? = 2,17 чІ = 2,17 | | |
5. по таблице 6 приложения найдем для к = 5 (к = ? - 1= 6 - 1 = 5) значение чІ (p ? 0,05) = 9,49. Так как 2,17 < 9,49, то принимается гипотеза Н0: различия между частотами двух кубиков не значимы. Обе эмпирические совокупности можно считать выборками из одной генеральной совокупности. 10. Охарактеризуйте понятие «множественная корреляция». Множественный коэффициент корреляции R (множественное R) - это положительный квадратный корень из R-квадрата. Эта статистика полезна при проведении многомерной регрессии (т.е. использовании нескольких независимых переменных), когда необходимо описать зависимость между переменными. Множественный коэффициент корреляции характеризует тесноту связи между зависимой переменной и предиктором. Он изменяется в пределах от 0 до 1 и рассчитывается по формуле: где - определитель корреляционной матрицы; - алгебраическое дополнение -го элемента. Наблюдаемое значение находится по формуле: При небольшом числе наблюдений величина множественного коэффициента корреляции, как правило, завышается. Множественный коэффициент корреляции считается значительным, т.е. имеет место статистическая зависимость между и остальными факторами , если где определяется по таблице F-распределения.
|