Это видео посвящено
критерию Стьюдента для связанных выборок.
С помощью этого критерия мы будем решать задачу оценки эффективности
лечения синдрома дефицита внимания и гиперактивности у
умственно отсталых детей.
В эксперименте участвуют 24 ребенка.
Каждый из них неделю принимает плацебо, а неделю принимает препарат метилфенидат.
По окончании каждой недели каждый ребенок проходит тест на способность к подавлению
импульсивных поведенческих реакций.
Данные, которые мы анализируем, перед вами на этой диаграмме рассеяния.
По горизонтальной оси здесь отложена способность к подавлению
импульсивных поведенческих реакций после недели приема плацебо,
по вертикальной — после недели приема препарата.
Каждая точка здесь соответсвует одному ребенку.
Таким образом, несмотря на то что у нас две выборки, эти выборки не являются
независимыми, поскольку значения здесь померяны на одних и тех же объектах.
Это и есть случай связанных выборок.
Мы хотим понять, эффективно ли лечение с помощью метилфенидата.
Большая часть точек на этом графике лежит выше диагонали.
Это значит, что после приема метилфенидата у большинства детей способность к
подавлению импульсивных поведенческих реакций увеличилась.
Но значимо ли это изменение?
Для того чтобы ответить на этот вопрос, нам нужен статистический критерий.
Будем использовать t-критерий Стьюдента для связанных выборок.
Итак, у нас есть две связанные выборки одинакового объема n.
Первая — из нормального распределения с параметрами μ1 и σ1,
вторая — с параметрами μ2 и σ2.
Мы хотим проверять нулевую гипотезу о том, что μ1 и μ2 равны, и мы можем это делать
против любой односторонней или двусторонней альтернативы.
Проверку мы будем вести с помощью T-статистики, равной отношению разности
выборочных средних X1 и X2 к какому-то стандартному отклонению S / √n.
Вот это S — это выборочное стандартное отклонение,
посчитанное на выборке D попарных разностей между X1 и X2,
взятых на соответствующих объектах.
Нулевое распределение такой статистики —
это распределение Стьюдента с числом степеней свободы n − 1.
В числителе здесь стоит разность выборочных средних X1 и X2.
Это то же самое, что выборочное среднее разности X1 − X2.
Таким образом, t-критерий для двух связанных выборок эквивалентен
одновыборочному t-критерию, примененному к выборке попарных разностей.
Вернемся к нашей задаче.
Нулевая гипотеза, которую мы проверяем,
— это отсутствие эффективности нашего лечения: способность
к подавлению импульсивных поведенческих реакций не изменилась, μ1 = μ2.
Проверять эту гипотезу мы будем против двусторонней альтернативы,
поскольку мы не можем исключать, что способность к подавлению импульсивных
поведенческих реакций в результате применения нашего препарата уменьшится.
t-критерий Стьюдента для связанных выборок дает значение достигаемого уровня
значимости p, равное примерно 0,004.
То есть нулевая гипотеза о том, что средняя способность
к подавлению импульсивных поведенческих реакций не изменилась,
отвергается на уровне значимости 0,05.
Точечная оценка для изменения признака в результате применения нашего препарата,
а это разность выборочных средних, и равна она примерно пяти пунктам.
95 % доверительный интервал для этой величины,
построенный с помощью распределения Стьюдента,
составляет от 1,8 до 8,1 пунктов.
Итак, на протяжении последних трех видео мы
рассмотрели пять разновидностей t- и z-критериев Стьюдента.
Мы рассмотрели критерии Стьюдента для одновыборочной задачи,
для двухвыборочной задачи с независимыми выборками и со связанными выборками.
В следующем видео мы поговорим о предположении нормальности,
которое лежит в основе всех рассмотренных нами критериев.