0:00
[МУЗЫКА]
[МУЗЫКА] [МУЗЫКА]
Продолжаем знакомиться со сравнительными критериями.
Сейчас мы рассмотрим с вами критерий, который позволяет рассматривать и изучать,
сопоставлять две группы по выраженности признака, другими словами,
позволяет сопоставлять средние значения двух групп, которые мы с вами сравниваем.
Собственного говоря,
задачи применения подобного рода критерия вы видите сейчас на экране.
Называется этот критерий t-критерий Стьюдента, или t-test,
или в некоторых случаях уточняется, что это t-критерий Стьюдента для независимых
выборок, поскольку мы сопоставляем две несвязанные друг с другом выборки.
Обратимся к нашей расчетной формуле и убедимся, что она достаточно знакома нам.
Она похожа на формулу, которую мы применяли ранее,
выполняя расчет одновыборочного t-критерия Стьюдента.
Единственное крупное отличие мы видим в числителе,
а именно — это сопоставление двух средних значений.
Именно это является основным расчетом по этой формуле,
то есть именно разница в средних значениях, существенная разница,
большая разница и позволяет нам говорить нам о существенной разнице,
говорить о достоверной разнице между нашими группами.
Если говорить о гипотезах применения подобного рода критерия,
то вариант подобного рода гипотез вы видите сейчас на экране.
Звучат они примерно одинаково.
В подобного рода исследованиях при применении t-критерия для независимых
выборок мы сопоставляем средние значения или, другими словами, выясняем,
различаются ли сравниваемые нами группы по выраженности признака.
Кроме того, преобразование таблицы исходных данных,
которую вы видите на следующем слайде, очень похоже на те преобразования,
которые мы проводили в предыдущей нашей задаче при применении F-критерия Фишера,
а именно нам необходимо провести преобразование таблицы исходных данных в
таблицу для расчетов, разделив значение нашей количественной переменной отдельно
для одной группы, отдельно — для другой для удобства расчетов вручную.
Поговорим об ограничениях применения t-критерия Стьюдента.
Основных ограничений три.
Первое ограничение уже знакомо нам.
Мы много уже говорили о нем.
Это нормальность распределения нашей количественной переменной.
Помним обязательно о том, что, поскольку при расчетах t-критерия Стьюдента
производятся вычисления средних значений, нам необходимо помнить о выбросах,
о форме распределения и, конечно же, в идеальном случае лучше,
чтобы количественная переменная полностью совпадала по форме с идеальным нормальным
распределением или, по крайней мере, была на него похожа.
Ограничение второе.
Когда мы на него смотрим, мы видим, что это однородность дисперсии,
то есть дисперсии двух сравниваемых групп должны быть примерно одинаковыми.
Подобного рода проверка производится с помощью критерия Фишера
или его модификации.
О нем мы говорили ранее.
Помним о том, что это очень важный параметр.
Очень важно отслеживать момент,
чтобы две сравниваемые группы были действительно двумя разными выборками.
При этом не должна одна выборка быть частью другой выборки.
Подобного рода проверки на однородность дисперсии позволяют убедиться в этом.
Наконец, третье ограничение, на которое часто не обращают внимание,
но оно также важно, — это равенство выборок по численности.
Если мы по каким-то причинам не можем соблюдать это ограничение,
например, мы не смогли набрать выборку одну такую же по численности,
как вторую, не хватило нам испытуемых, мы все равно можем проводить сопоставления,
но пользоваться специальной скорректированной формулой,
которую вы видите сейчас на экране.
Рассмотрим пример применения t-критерия Стьюдента непосредственно в
практической задаче.
Профессора Персикова интересует вопрос о различиях в выраженности
коэффициента интеллекта студентов 2-го и 4-го курсов.
Необходимо проверить гипотезу,
различается ли уровень коэффициента интеллекта у студентов 2-го и 4-го курса.
При этом предположения о нормальности распределения и однородности дисперсии
выполняются, группы равны по численности.
Ошибка α установлена на уровне 0,05.
Как видите, в условии задачи нам явно дают понять, что нам необходимо
применить t-критерий Стьюдента, поскольку выполняются все ограничения.
Соответственно, t-критерий Стьюдента как наиболее мощный критерий сопоставления
двух групп по выраженности признака в этом случае применять предпочтительнее.
Итак, сформулируем статистические гипотезы.
Нулевая гипотеза у нас будет звучать как гипотеза,
которая говорит об отсутствии достоверных различий в сравниваемых группах,
об отсутствии различий средних значений.
Альтернативная гипотеза будет говорить нам о том,
что средние значения достоверно различаются.
Нам остается только узнать, какую гипотезу мы можем с вами подтвердить.
Обращаем внимание на то,
что и в этой задаче мы с вами используем ненаправленную гипотезу.
В условии задачи нам явно нигде не указали,
студенты какого курса имеют коэффициент интеллекта гипотетически выше,
а студенты какого курса — гипотетически ниже.
Приступаем к расчету нашего t-критерия Стьюдента.
По уже имеющейся нам формуле нам необходимо вычислить средние
значения двух сравниваемых групп, дисперсии двух сравниваемых групп,
а также определить число степеней свободы.
Если мы не хотим проводить расчеты вручную абсолютно,
воспользовавшись бумагой и карандашом, можно пользоваться калькулятором или
специализированными пакетами, электронными таблицами, например,
таблицей Excel, в которую встроен специализированный пакет анализа данных.
Воспользовавшись подобного рода пакетом,
можно произвести расчет t-критерия Стьюдента, уровня значимости.
Одновременно с этим подсчитываются средние значения,
дисперсии и многие другие параметры, что довольно удобно.
Выполняя небольшое количество действий, получаете достаточно большой результат,
который легко интерпретировать.
Всевозможные варианты настроек, как пользоваться этим пакетом,
остаются на ваше самостоятельное задание.
Произведя расчет нашего эмпирического t-критерия Стьюдента,
нам необходимо определить его уровень значимости.
Для этого мы наш эмпирический критерий, который только что рассчитали,
сопоставляем с теоретическими критериями,
которые рассчитаны были ранее для критических точек.
Пользоваться можно при этом специализированными таблицами критических
значений.
В нашем случае, проводя подобного рода сопоставления, мы убеждаемся,
что наш t-критерий Стьюдента выше, чем t-критерий Стьюдента в критических точках.
А это позволяет нам говорить о том, что p-уровень значимости нашего критерия
оказался меньше порогового значения α-ошибки.
Другими словами, мы можем отклонить нулевую гипотезу и принять гипотезу
альтернативную о том, что, действительно, мы обнаружили достоверные различия.
На следующем слайде вы можете видеть выводы.
Как и в предыдущих задачах, перво-наперво мы обращаем внимание на числовой вывод,
краткий вывод, который иллюстрирует результаты наших расчетов.
Также обращаем внимание и на полный содержательный вывод.
Уровни коэффициента интеллекта студентов 2-го и 4-го курсов
различаются на высоком уровне статистической значимости.
Помним о том, что обязательно в полный содержательный вывод нужно включать и
краткий числовой вывод, который иллюстрирует результаты ваших расчетов.
Также на слайде представлена диаграмма, на которой видно, наглядно видно,
насколько существенно отличаются средние значения двух сравниваемых групп.
Визуально мы видим эту разницу, а с помощью подсчитанного t-критерия
Стьюдента и его p-уровня значимости убеждаемся, что эта разница достоверна.
Мы только что произвели с вами расчеты t-критерии Стьюдента вручную.
Как видите, применение этого критерия относительно несложно.
Чтобы сократить некоторые арифметические действия,
можно пользоваться электронными таблицами, либо можно пользоваться
специализированными статистическими пакетами.
Алгоритм применения подобного рода пакетов можете найти в книге,
ссылку на которую видите на экране.
[БЕЗ_ЗВУКА]