[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Здравствуйте, уважаемые слушатели. Тема очередных наших занятий — сравнение двух выборок. На экране вы видите группы математических моделей, это изображение вы уже видели. Мы говорили о том, что все множество методов анализа можно свести к трем группам. Это группа анализа частот, мы ее достаточно подробно рассмотрели на прошлом занятии. Это корреляционный анализ, когда мы анализируем взаимосвязи количественных переменных. И наконец, третья группа математических моделей — это методы сравнительного анализа. И методы сравнения двух выборок относятся именно к этой группе методов, поскольку речь идет о связи номинальной переменной, которая делит испытуемых на выборки, и количественной переменной, то есть той переменной, по уровню выраженности которой мы сравниваем выборки. Методы сравнения выборок — пожалуй, наиболее многочисленная группа методов и требуют отдельной классификации. На экране вы видите классификацию методов сравнения. Она требуется для того, чтобы правильно определить, к какому методу обратиться. Для этого исследователь должен ответить на три вопроса, каждый из которых предполагает два ответа. Первый вопрос: сколько выборок сравнивается: две выборки или больше двух выборок? Второй вопрос: как соотносятся между собой сравниваемые выборки, а они могут быть независимыми или зависимыми. И наконец третий вопрос: количественная переменная или признак Y, является ли она метрической, равноинтервальной или порядковой, ранговой. Вот в зависимости от ответа на все три вопроса мы получаем восемь методов сравнения. Ну, на этом занятии мы с вами будем рассматривать сравнение двух выборок, а сравнение более двух выборок мы будем рассматривать позже. Как видите, методы сравнения двух выборок разделяются на две группы в зависимости от того, в какой шкале представлена количественная переменная. Если Y, количественная переменная, является метрической, то есть распределение ее приблизительно нормальное, то применяются методы сравнения средних. Если эта количественная переменная порядковая, ну или количественная переменная имеет выбросы, ассиметрию распределения, а также и в том случае, когда объем выборки недостаточен для того, чтобы судить о форме распределения, то в этом случае применяются ранговые методы или ранговые критерии сравнения, предполагающие предварительное ранжирование количественной переменной. Итак, сравнение двух средних, с этого начнем. Для сравнения двух средних применяется критерий t-Стьюдента. t-Стьюдента представлен в трех вариантах. Во-первых, одновыборочный t-критерий Стьюдента для одной выборки, во-вторых, для двух независимых выборок, и в-третьих, для двух зависимых выборок. Одновыборочный критерий мы вкратце уже рассмотрели, когда рассматривали основы статистического вывода. Сейчас мы рассмотрим с вами сравнение двух независимых выборок с использованием критерия t-Стьюдента. Исходные данные: связь бинарной и метрической переменных. Нулевая гипотеза — это гипотеза о равенстве двух средних в генеральной совокупности. Следует иметь в виду ограничения. Во-первых, распределение переменных должно быть приблизительно нормальное, а в случае разной численности сравниваемых выборок их дисперсии статистически достоверно не различаются. Проверяется по критерию f-Фишера или критерию f-Левина в компьютерной программе. Обратите внимание на формулу критерия t-Стьюдента. В числителе — разность средних или величина эффекта, а в знаменателе — корень квадратный из суммы стандартных ошибок средних. Число степеней свободы равно сумме численностей выборок минус два. В случае, если не выполняются ограничения, которые наложены на применение этого самого критерия, то есть распределение отличается от нормального, или дисперсии различаются статистически достоверно, в этом случае применяется непараметрический, ранговый критерий U-Манна-Уитни. Итак, сравнение дисперсий. Нулевая гипотеза о равенстве дисперсий в сравниваемых выборках. Как мы уже говорили, сравнение дисперсий является необходимой процедурой перед применением критерия t-Стьюдента. Однако само по себе сравнение дисперсий, получение статистически достоверного результата зачастую имеет самостоятельное значение. Рассмотрим пример. Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытание, а остальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом, фактическим результатом выполненного задания в секундах. То есть вычислял сдвиг самооценки. Ожидалось, что сообщение о неудаче вызовет некоторую неадекватность самооценки. Проверяемая статистическая гипотеза на уровне 0,05 состояла в том, что дисперсия совокупностей самооценок не зависит от сообщения об удаче или неудаче. То есть дисперсии в генеральной совокупности равны. Это нулевая гипотеза. Результаты. При сообщении о неудаче дисперсия сдвига самооценки статистически достоверно выше, чем при сообщении об успехе. В описании результата указывается, во-первых, значение дисперсий, численности выборок, также значение критерия F, в скобочках вы видите указание чисел степеней свободы. И p-уровень значимости. В данном случае p-уровень значимости меньше 0,01. То есть различие статистически достоверно на высоком уровне статистической значимости. Рассмотрим следующий пример, собственно говоря, применения уже критерия t-Стьюдента. Предположим, сравнивались выборки студентов первого и пятого курса по IQ, по интеллекту. В таблице приведены статистики групп, видите, численность первой группы — 30 человек, второй группы — 28 человек. Среднее значение (103 и 109 соответственно), среднеквадратическое отклонение и среднеквадратическая ошибка среднего. И во второй таблице критерий для независимых выборок называется. Мы видим, во-первых, проверка равенства дисперсий при помощи критерия Левина. В данном случае мы видим, что p-уровень значимости превышает 0,05, то есть дисперсии различаются статистически недостоверно, и в данном случае критерий t-Стьюдента применим. И мы вправе обратиться к результату его применения. Второй раздел этой таблицы как раз и содержит результаты применения критерия t-Стьюдента. Значения критерия t-Стьюдента, число степеней свободы и статистическая значимость — все это указывается в результатах применения критерия t-Стьюдента. Мы видим, что p-уровень значимости меньше 0,05, и таким образом вправе сделать вывод о том, что интеллект студентов пятого курса статистически значимо выше, чем интеллект студентов первого курса. Обратим внимание, что мы принимаем во внимание результаты первой строки, предполагаются равные дисперсии. Дело в том, что выборки обычно разные по численности, и поэтому нам необходимо это предположение. Вторая строка — не предполагаются равные дисперсии — относится к тому случаю, если выборки равны по численности. На экране представлены результаты применения рангового аналога критерия U-Манна-Уитни. Сравнивались юноши и девушки по количеству ассоциаций на ряд стимулов, ну, скажем, предметов кухонной утвари. И подсчитывалось среднее количество ассоциаций для каждого испытуемого. И проверяемая гипотеза о том, что среднее количество ассоциаций у девушек выше, чем у юношей. Среди результатов мы видим описательные статистики. По описательным статистикам обращаем внимание на средний ранг, видим, что средний ранг у девушек выше, чем у юношей, таким образом количество ассоциаций у девушек выше, чем у юношей. И в таблице «Статистические критерии» мы видим значение самого критерия U-Манна-Уитни, соответствующее ему значение Z-критерия и асимптотическая значимость двусторонняя, то есть p-уровень значимости, который меньше 0,05. Таким образом мы делаем вывод о том, что среднее количество ассоциаций у девушек статистически достоверно выше, чем у юношей. Хорошей иллюстрацией подобного результата является график box plot, который изображен правее. Как вы видите, изображены медианы и значения медиан. Для девушек медиана составляет 14,5, для юношей — 7,5. И также видим, что распределение ассоциаций для юношей приблизительно симметричное, а для девушек обладает правосторонней ассиметрией, то есть чаще встречаются значения выше среднего. [БЕЗ_ЗВУКА] [БЕЗ_ЗВУКА]