W критерий Уилкоксона — это непараметрический аналог парного критерия Стьюдента (t-критерий для зависимых выборок) для сравнения больных до и после лечения. Этот непараметрический критерий основан на рангах.
Принцип критерия следующий. Для каждого больного вычисляется величина изменения признака. Все изменения упорядочивают по абсолютной величине (без учета знака). Затем рангам приписывают знак изменения и суммируют эти «знаковые ранги» — в результате получается значение критерия Уилкоксона W.
Ранжирование. Попарные разности величин признака для каждого больного ранжируются следующим образом. Положительные и отрицательные значения ставят (кроме нулевых) в один ряд так, чтобы наименьшая абсолютная величина (без учета знака) получила первый ранг, одинаковым величинам присваивают один ранг.
Отдельно вычисляют сумму рангов положительных и отрицательных разностей, меньшую из двух сумм без учета знака считают тестовой статистикой данного критерия. Нулевую гипотезу принимают при данном уровне значимости, если вычисленное значение превзойдет критической значение.
- Определить нулевую и альтернативную гипотезы.
: медиана разницы в популяции равна нулю.
: медиана разницы в популяции не равна нулю.
- Отобрать необходимые данные из двух взаимосвязанных выборок.
- Вычислить величину статистики критерия, отвечающую H0.
Вычислите разность для каждой пары результатов. Проранжируйте все n’ ненулевые разности, присваивая ранг 1 наименьшей разности и ранг n’ — наибольшей. Сложите ранги положительных (Т+) и отрицательных (T_) разностей.
- Если n’ 25, статистика критерия t принимает значение Т+ или Т_ в зависимости от того, какая из них меньше.
- Если n’ > 25, рассчитайте статистику критерия z, где
которая подчиняется нормальному распределению (ее величина должна быть скорректирована, если имеется много связанных значений).
- Сравнить величину статистики критерия с величинами известного распределения вероятности.
- Интерпретировать значение достигнутого уровня значимости р и результаты.
Интерпретируйте значение p и рассчитайте доверительный интервал для медианы разностей.
Пример
Допустим в результате проведения исследования был вычислен ряд попарных разностей между показателем эффекта в двух попарно связанных группах (n1 = n2 = 10) (например, так называемая задача «До и после лечения»):
0,2 | -0,4 | 0,7 | -0,9 | 1,3 | 1,5 | -0,1 | 0,8 | -1,0 | 1,1 |
Ранжируем попарно разности в один ряд, независимо от знака разности, получаем следующий ранжированный ряд:
-0,1 | 0,2 | -0,4 | 0,7 | 0,8 | -0,9 | -1,0 | 1,1 | 1,3 | 1,5 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Рассчитаем отдельно сумму рангов положительных (W+) и отрицательных (W_) разностей, в нашем случае W+ = 2 + 4 + 5 + 8 + 9 + 10 = 38, W_ = 1 + 3 + 6 + 7 = 17. Для проверки двустороннего W-критерия используем меньшую статистику W_ = 17 и сравним ее с критическим значением для числа попарных разностей n = 10 и уровня значимости 5%. Такое значение равно 9. Рассчитанное минимальное значение W статистики превосходит соответствующее табличное значение, а значит нулевая гипотеза остается в силе.
В случае анализа результатов клинических исследований непараметрические критерии бывают полезны не только для анализа количественных данных, а также при качественной или альтернативной форме представления признаков.
Пример в STATISTICA
Выберите команду Непараметрическая статистика в меню Анализ для отображения стартовой панели модуля Непараметрическая статистика. Далее выберите Сравнение двух зависимых переменных и нажмите кнопку OK для отображения диалогового окна Сравнение двух переменных. В принципе, можно выполнить тест для списка переменных (точнее, списка пар); однако в данном примере мы имеем только 2 переменные.
Нажмите кнопку Переменные для отображения стандартного диалогового окна Выбор переменных, выберите переменные До лечения и После лечения.
Теперь нажмите кнопку критерий Вилкоксона, отобразится таблица результатов, показанная ниже.
Критерий Вилкоксона значим на уровне .05. В нашем случае p=0,28, то есть в нашем случае критерий незначим, значит, мы остаемся в рамках нулевой гипотезы. Из результатов можно сделать вывод, что тенденция есть, но, возможно, нам не хватило чувствительности непараметрического критерия для выявления его значимости.
Для визуализации результатов можно построить диаграмму размаха, нажав кнопку Диаграммы размаха в диалоговом окне Сравнение двух переменных. Выберите обе переменные в диалоговом окне Выбор переменных и нажмите кнопку OK. Далее, выберите тип графика в диалоге Тип диаграммы размаха. В этом примере выберите Среднее/ст.откл./ст.ош. и нажмите кнопку OK.
График ясно показывает, что переменная После лечения имеет большее среднее, чем переменная До лечения.