[МУЗЫКА]
[МУЗЫКА] [МУЗЫКА]
Здравствуйте, дорогие друзья.
Продолжаем наши практические занятия по курсу «Математические методы психологии.
Основы применения».
На этом занятии мы с вами рассмотрим варианты анализа переменных, измеренных
количественными шкалами, то есть случаи, когда у нас все шкалы количественные.
При этом будем оценивать так называемые корреляционные связи,
или связи, описываемые через понятия совместной изменчивости.
Корреляционных связей может быть довольно много,
и методов описания этих связей также может быть много.
Мы же с вами будем рассматривать лишь небольшую часть из них,
а именно меры, которые позволяют описывать
линейные связи или в некоторых случаях просто монотонные связи.
Линейные связи — это связи,
которые описываются функцией довольно простой прямой линии.
Монотонные связи могут быть немножко сложнее, но самый главный принцип
здесь — это отсутствие в графиках функции точек перегиба.
Один из самых распространенных методов подобных
связей — это коэффициент корреляции Пирсона.
Рассмотрим формулу представленного коэффициента корреляции Пирсона.
Вы можете видеть ее на экране.
Формула довольно-таки большая, но если внимательно присмотреться к ней,
она относительно простая, и все элементы этой формулы нам уже известны.
Следует сразу обратить ваше внимание на то, что коэффициент корреляции Пирсона,
как и многие другие коэффициенты, является стандартизированным
параметром и меняется в диапазоне от −1 до +1,
что довольно-таки удобно для того, чтобы сравнивать эти коэффициенты между собой.
На следующем слайде вы можете видеть вариант гипотезы, который можно проверять
с помощью корреляционных методов, в частности коэффициента корреляции Пирсона.
Обратите внимание на то,
что представлен вариант ненаправленной гипотезы, то есть тот случай, когда
наша задача — лишь найти отличие отличие нашего коэффициента корреляции от нуля.
В эту ненаправленную гипотезу включены сразу два варианта: когда
коэффициент корреляции больше нуля и когда коэффициент корреляции меньше нуля.
Обязательно обращайте внимание, какую гипотезу вам необходимо проверить в ваших
собственных исследованиях и в задачах, которые вы выполняете.
Таблицы для представленного нами уже коэффициента корреляции Пирсона не требуют
преобразований, то есть мы сразу можем пользоваться таблицами исходных данных.
Если мы говорим об ограничениях этого коэффициента,
нужно остановиться на четырех важных моментах.
Момент первый: уже знакомая нам проверка нормальности распределения.
Те две переменные, связь которых мы пытаемся оценить,
обязательно должны распределяться нормальным образом, поскольку,
если вы помните, в формулу нашего коэффициента входят такие параметры,
как среднее значение, стандартное отклонение.
Среднее значение очень чувствительно к форме распределения и, что самое важное,
к выбросам, которые могут быть в нашем распределении.
Следующее ограничение, о котором нам стоит сказать, это линейность связи.
Коэффициент корреляции Пирсона является линейным коэффициентом.
То есть этот коэффициент описывает связь,
которая графически может быть представлена в виде прямой линии.
Соответственно, нам обязательно нужно проверять,
действительно ли при построении точечной диаграммы наши переменные
демонстрируют линейную совместную изменчивость.
Если это правило не соблюдается, целесообразнее применять
непараметрический критерий — коэффициент корреляции Спирмена.
Ограничение следующее связано с монотонностью связи.
Это более общее ограничение, и оно распространяется на многие другие другие
коэффициенты корреляции, в частности и на коэффициент корреляции Пирсона,
и на коэффициент корреляции Спирмена.
Обязательно нужно отслеживать, что функция,
которая описывает совместную изменчивость наших двух переменных, представляет из
себя монотонно меняющуюся функцию, то есть монотонно растет или монотонно убывает.
График этой функции не имеет точек перегиба.
Если это правило не выполняется, очень велик риск
получения некорректного расчета коэффициента корреляции.
Соответственно, один из выходов из сложившейся ситуации — это
деление нашей выборки на небольшие группы,
в которых наблюдается монотонная изменчивость признака.
Наконец, четвертое ограничение является логическим.
Так просто его не посчитать, так просто его не заметить,
самое главное — мы должны понимать, что пытаясь определить связь двух переменных,
мы должны представлять, что эта связь действительно имеется.
Кроме того, обратите внимание, на слайде представлены наиболее типичные
случаи ошибок, которые могут встретиться при интерпретации корреляционных связей.
Если не соблюдаются подобного рода правила, то есть
если вы пытаетесь описывать корреляционные связи в терминах причин и следствий,
если вы не замечаете влияние какой-то другой переменной и другого фактора на
связь ваших двух эмпирических переменных или вы не видите каких-либо
других ограничений, то возможны логические нарушения при интерпретации связи.
Математический аппарат позволит вам сделать расчеты, но эти расчеты могут
быть в корне неверны, поскольку изначально мы могли построить нелогичную модель.
Обязательно внимательно относитесь к подобного рода ограничениям.
Итак, приступим к расчету нашего примера.
Профессор Яблоков изучает вопрос совместной изменчивости таких переменных
как: количество съеденных испытуемыми конфет и количество решенных ими задач.
Для этого было проведено эмпирическое исследование,
результаты вы видите в таблице на экране.
Необходимо проверить гипотезу о корреляции двух переменных: количество
съеденных конфет и количество решенных задач.
Предположение о нормальности распределения,
прямолинейности и монотонности связи переменных выполняются.
α-ошибка установлена на уровне 0,05.
Условие задачи нам явно подсказывает,
что нам необходимо применить коэффициент корреляции Пирсона.
Сформулируем наши статистические гипотезы.
Варианты этих формулировок вы можете видеть на экране.
Обратите внимание, что гипотеза, которую мы с вами проверяем,
в наших расчетах ненаправленная.
То есть нам явно не указали в задаче,
положительная или отрицательная будет связь, которую мы с вами оцениваем.
Приступаем к расчетам нашего коэффициента.
Перво-наперво нам необходимо выполнить расчет средних значений и стандартных
отклонений.
Эти варианты расчетов мы уже делали неоднократно, это нам знакомо.
Второе: нам необходимо выполнить расчет отклонений каждой нашей
переменной от среднего значения этой самой переменной.
Затем высчитать произведение этих отклонений и суммировать эти произведения.
Тем самым мы получим значения числителя нашего критерия.
После этого нам необходимо выполнить дополнительные расчеты и в итоге
получить непосредственное значение коэффициента корреляции Пирсона.
На следующем слайде мы видим значение нашего критерия.
Убеждаемся, что оно достаточно большое, то есть связь,
которую мы пытаемся оценить, достаточно сильна, она положительная.
Нам остается лишь оценить достоверность ее.
Так же, как и при решении других типов задач, нам необходимо сопоставить значение
нашего эмпирического коэффициента со значениями в критических точках,
воспользовавшись таблицами критических значений.
Воспользовавшись этим самым, мы убеждаемся, что наш коэффициент
корреляции высокозначим, и можем приступить к выводам.
На экране вы можете видеть выводы к нашей задаче.
Это краткий числовой вывод и полный содержательный вывод,
который может быть сформулирован следующим образом: подтверждена сильная,
прямая, высокого уровня достоверности связь переменных
«количество съеденных конфет» и «количество решенных задач».
В этот вывод также входит и краткий числовой вывод.
Обратите внимание на два важных аспекта.
Первый аспект: диаграмма, которую вы видите, точечная диаграмма, чаще
всего используется для проверки линейности связи, а не для иллюстрации этой связи.
Обычно для иллюстрации связи применяется метод построения корреляционных плеяд,
о нем мы поговорим позже.
Второй момент: это то, что корреляционные связи не являются причинно-следственными.
То есть корреляция не является отражением связи причин и следствий тех событий,
которые вы изучаете.
Она лишь показывает меру совместной изменчивости.
Меняется один признак, меняется второй признак,
они меняются примерно похожим образом.
Но это не значит, что один признак является причиной второго.
Обязательно следите за этим.
Мы рассмотрели с вами вариант решения этой задачи при расчетах вручную.
Вы можете самостоятельно ознакомиться с алгоритмами применения расчетов
коэффциента корреляции автоматизированным способом в специализированных
статистических пакетах.
С вариантами, как это можно проделать, вы можете ознакомиться в книге,
ссылку на которую вы видите на экране.