[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Рассмотрим следующий вариант анализа переменных, измеренных в номинальных шкалах, а именно анализ таблиц сопряженности, причем анализировать таблицы сопряженности мы будем в общем виде, когда у переменных более двух градаций. Пример отличается от того, что мы уже рассматривали ранее, тем, что здесь будут анализироваться две эмпирических переменных в отличие от рассмотренного ранее варианта анализа одной эмпирической переменной. Соответственно, задача, которая будет решаться в данном виде анализа, это сравнение этих самых двух эмпирических переменных. Расчетную формулу вы можете видеть на экране. Если вы обратите внимание, расчетная формула является идентичной расчетной формуле общего вида, которую мы рассматривали ранее. То есть это самая большая, самая объемная формула из тех, которые доступны нам. Рассмотрим пример решения задач подобного рода. Итак, известные уже нам исследователи продолжили изучать успешность решения задач испытуемыми разных специальностей, предлагая им дополнительно новый тип задач на социальное взаимодействие. Всего в новом исследовании приняло участие 164 человека. Исследователи предполагали, что представители четырех разных специальностей будут различаться в успешности решения задач двух разных типов. Необходимо проверить гипотезу о различиях в частоте решения задач разного типа представителями разных специальностей. Уровень ошибки альфа установлен на уровне 0,05. Как и в предыдущих рассмотренных нами задачах, первый этап — это работа с эмпирическими частотами. Для расчетов вручную нам необходимо преобразовать таблицу исходных данных в таблицу сопряженности. Обратите внимание на экран, таблица сопряженности несколько сложнее, чем таблица частот, которую мы рассматривали ранее. Для удобства и для облегчения расчетов вы можете воспользоваться электронными таблицами Excel, для того чтобы вычислить и построить таблицы сопряженности быстрее и удобнее. Для этого можно воспользоваться функциями СЧЕТЕСЛИ и некоторыми логическими функциями. Обратите внимание, что из-за взаимодействия двух номинальных переменных число групп, которые мы будем сравнивать, достигло восьми. Четыре градации одной переменной и две градации другой переменной в сумме дают нам восемь новых групп для сравнения. Затем нам также нужно сформулировать статистические гипотезы. Обратите внимание, что из-за наличия двух номинальных переменных, двух эмпирических переменных гипотезы выглядят следующим образом. Мы сопоставляем две переменные друг относительно друга, то есть сравнивать мы будем две эмпирических переменных. Однако теоретические частоты нам все-таки рассчитать придется, поскольку чисто формально из-за формулы, которая имеется у нас, с математической точки зрения происходит все-таки сопоставление эмпирических частот и теоретических. Расчет теоретических частот для анализа таблиц сопряженности может иметь некоторые трудности. Поэтому разберем все достаточно подробно, пошагово. На первом шаге мы строим макет таблицы теоретических частот. Он полностью должен совпадать с макетом таблицы для эмпирических частот. Обратите внимание, пример построения такой таблицы вы видите сейчас на экране. Далее мы применяем уже известное нам правило равенства сумм теоретических и эмпирических частот. Обратите внимание, что нам нужно обязательно следить за равенством сумм как общей суммы частот, так и по строкам и по столбцам наших таблиц эмпирических и теоретических частот. Пример применения этого правила вы также можете видеть сейчас на экране. Обратим наше внимание на экран. Сейчас вы можете видеть следующие расчеты, для того чтобы получить теоретические частоты, а именно применение формулы расчета теоретических частот для таблиц сопряженности. Обратите внимание на саму формулу, а также на варианты применения этой формулы для каждой из восьми ячеек, для каждой из восьми групп, полученных в результате взаимодействия наших двух эмпирических переменных. В итоге мы получаем полноценную таблицу с теоретическими частотами. У нас в наличии имеются как эмпирические частоты, так и теоретические частоты. Все готово для применения формулы Хи-квадрат Пирсона. Небольшое задание для самостоятельной работы: попробуйте подумать над тем, какие будут получаться теоретические частоты в процессе расчетов, если суммы частот в теоретической таблице по столбцам будут равны, и суммы частот по строкам будут равны. На экране вы сейчас можете видеть этапы расчета Хи-квадрат Пирсона, обратите внимание, что они похожи на те этапы, которые мы рассматривали в предыдущих задачах. Единственное отличие — групп для сравнения становится больше, а именно целых восемь групп, полученных в результате взаимодействия наших двух эмпирических переменных. Применяя формулу Хи-квадрат Пирсона, в процессе расчетов мы в итоге получаем значение Хи-квадрат Пирсона. Значение этого критерия вы можете видеть также в таблице. На заключительном этапе расчетов нашего Хи-квадрата Пирсона после получения его значения нам остается лишь определить, каков уровень значимости этого рассчитанного эмпирического критерия. Для этого нам необходимо вычислить число степеней свободы, в нашем случае в соответствии с формулой число степеней свободы равно трем, поскольку первая переменная дает нам четыре градации нашей эмпирической переменной. Вторая переменная дает две градации. В итоге, применяя формулу расчета числа степеней свободы, мы получаем его равным трем. Далее, используя таблицы критических значений Хи-квадрата Пирсона, мы определяем критические значения Хи-квадрата Пирсона и сопоставляем наше эмпирическое значение критерия с критическими точками. Обращаю внимание, что в нашем случае Хи-квадрат Пирсона достаточно высок. Он больше, чем имеющиеся у нас в наличии критические значения. Таким образом, мы подтверждаем с вами высокую достоверность нашего полученного эмпирического значения критерия. Нам остается лишь только сформулировать вывод. Для начала мы с вами определимся, какую же гипотезу мы можем принять — нулевую или альтернативную. Поскольку мы только что сейчас выяснили, что p-уровень значимости нашего эмпирического критерия позволяет нам говорить о том, что мы достаточно успешно преодолели барьер ошибки альфа в 0,05, причем достаточно существенно наш p-уровень значимости меньше, чем этот самый барьер. Таким образом, мы вправе отвергнуть нулевую гипотезу, принять альтернативную гипотезу о наличии достоверных различий нашей эмпирической переменной. На экране вы можете видеть краткий числовой вывод. который содержит результаты наших расчетов. Кроме того, мы можем сформулировать полный содержательный вывод, который может звучать следующим образом: гипотеза о различиях в частоте решения задач разного типа представителями разных специальностей подтверждена на очень высоком уровне статистической значимости. Полный содержательный вывод обязательно сопровождается кратким числовым выводом, которым вы иллюстрируете те слова, которые только что сказали. Обратите внимание, что применение Хи-квадрата Пирсона при анализе номинативных переменных числом градации больше двух не позволяет нам точно сказать, какие именно группы отличаются от каких. Для этого нам необходимо проводить парные сопоставления, применять более точные варианты анализа. Об этом мы поговорим чуть позже. Мы рассмотрели с вами варианты расчетов задач вручную, то есть тот вариант, при котором вы можете использовать лишь бумагу и карандаш. В некоторых случаях для ускорения расчетов вы можете применять электронные таблицы, калькуляторы, любую другую технику. При больших объемах данных целесообразнее применять специальные статистические пакеты. С алгоритмом применения расчетов специализированных пакетов вы можете ознакомиться в специализированной литературе. Пример подобного рода литературы вы можете видеть по ссылке на экране. [БЕЗ_ЗВУКА]