Корреляционный анализ по методу Спирмена (ранги Спирмена)
Ранговая корреляция Спирмена (корреляция рангов). Ранговая корреляция Спирмена - самый простой способ определения степени связи между факторами. Название метода свидетельствует о том, что связь определяют между рангами, то есть рядами полученных количественных значений, ранжированных в порядке убывания или возрастания. Надо иметь в виду, что, во-первых, ранговое корреляцию Не рекомендуется проводить, если связь пар меньше четырех и больше двадцати; во-вторых, ранговая корреляция позволяет определять связь и в другом случае, если значение имеют полуколичественный характер, то есть не имеют числового выражения, отражают четкий порядок следования этих величин; в-третьих, ранговое корреляцию целесообразно применять в тех случаях, когда достаточно получить приблизительные данные. Пример расчета коэффициента ранговой корреляции для определения вопрос: замеряют вопросник X и Y подобные личностные качества испытуемых. С помощью двух вопросников (X и Y), которые требуют альтернативных ответов "да" или "нет", получили первичные результаты - ответы 15 испытуемых (N = 10). Результаты подали в виде суммы утвердительных ответов отдельно для вопросника X и для вопросника В. Эти результаты сведены в табл. 5.19.
Таблица 5.19. Табулирование первичных результатов для расчета коэффициента ранговой корреляции по Спирмену (р) *
Анализ сводной корреляционной матрицы. Метод корреляционных плеяд.
Пример. В табл. 6.18 приведены интерпретации одиннадцати переменных, которые тестируют по методике Векслера. Данные получили на однородной выборке в возрасте от 18 до 25 лет (n = 800).
Перед расслаиванием корреляционную матрицу целесообразно ранжировать. Для этого в исходной матрицы вычисляют средние значения коэффициентов корреляции каждой переменной со всеми остальными.
Затем по табл. 5.20 определяют допустимые уровни расслоение корреляционной матрицы при заданных доверительной вероятности 0,95 и n - количества
Таблица 6.20. Восходящая корреляционная матрица
Переменные | 1 | 2 | 3 | 4 | бы | 0 | 7 | 8 | 0 | 10 | 11 | M (rij) | Ранг |
1 | 1 | 0,637 | 0,488 | 0,623 | 0,282 | 0,647 | 0,371 | 0,485 | 0,371 | 0,365 | 0,336 | 0,454 | 1 |
2 | 1 | 0,810 | 0,557 | 0,291 | 0,508 | 0,173 | 0,486 | 0,371 | 0,273 | 0,273 | 0,363 | 4 | |
3 | 1 | 0,346 | 0,291 | 0,406 | 0,360 | 0,818 | 0,346 | 0,291 | 0,282 | 0,336 | 7 | ||
4 | 1 | 0,273 | 0,572 | 0,318 | 0,442 | 0,310 | 0,318 | 0,291 | 0,414 | 3 | |||
5 | 1 | 0,354 | 0,254 | 0,216 | 0,236 | 0,207 | 0,149 | 0,264 | 11 | ||||
6 | 1 | 0,365 | 0,405 | 0,336 | 0,345 | 0,282 | 0,430 | 2 | |||||
7 | 1 | 0,310 | 0,388 | 0,264 | 0,266 | 0,310 | 9 | ||||||
8 | 1 | 0,897 | 0,363 | 0,388 | 0,363 | 5 | |||||||
9 | 1 | 0,388 | 0,430 | 0,846 | 6 | ||||||||
10 | 1 | 0,336 | 0,310 | 8 | |||||||||
11 | 1 | 0,300 | 10 |
Обозначения: 1 - общая осведомленность; 2 - понятийнисть; 3 - внимательность; 4 - вдатнисть К обобщения; б - непосредственное запоминание (на цифрах) 6 - уровень освоения родном языке; 7 - скорость овладения сенсомоторном навыками (кодирование символами) 8 - наблюдательность; 9 - комбинаторные способности (к анализу и синтезу) 10 - способность к организации частей в осмысленное целое; 11 - способность к эвристического синтеза; M (rij) - среднее значение коэффициентов корреляции переменной с остальными переменных наблюдений (в нашем случае n = 800): r (0) - значение нулевой "Рассекая" плоскости - минимальная значимая абсолютная величина коэффициента корреляции (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | Δr | - допустимый шаг расслоения (n = 40, | Δr | = 0,558) в - допустимое количество уровней расслоения (n = 40, s = 1 ; n = 120, s = 2); r (1), r (2), ..., r (9) - абсолютное значение секущей плоскости (n = 40, r (1) = 0,965).
Для n = 800 находим значение гтип и границ ги после чего Расслаивающая ранжированы корреляционную матрицу, выделяя корреляционные плеяды внутри слоев, или отделяем части корреляционной матрицы, вырисовывая объединения корреляционных плеяд для вышележащих слоев (рис. 5.5).
Содержательный анализ полученных плеяд выходит за пределы математической статистики. Надо отметить два формальные показатели, которые помогают при содержательной интерпретации плеяд. Одним существенным показателем служит степень вершины, то есть количество ребер, примыкающих к вершине. Переменная с наибольшим количеством ребер является "ядром" плеяды и ее можно рассматривать как индикатор остальных переменных этой плеяды. Другой существенный показатель - плотность связи. Переменная может иметь меньше связей в одной плеяде, но теснее, и больше связей в другой плеяде, однако менее тесных.
Предсказания и оценки. Уравнение у = b1x + b0 называется общим уравнением прямой. Оно свидетельствует о том, что пары точек (x, y), которые
Рис. 5.5. Корреляционные плеяды, полученные расслоением матрицы
лежат на некоторой прямой, связанные так, что для любого значения х величину в в находящегося с ним в паре, можно найти, умножив х на некоторое число b1 добавив вторых, число b0 к этому произведению.
Коэффициент регрессии позволяет определить степень изменения следственной фактора при изменении причинного фактора на одну единицу. Абсолютные величины характеризуют зависимость между переменными факторами по их абсолютными значениями. Коэффициент регрессии вычисляют по формуле:
Планирование и анализ экспериментов. Планирование и анализ экспериментов - это третья важная отрасль статистических методов, разработанных для нахождения и проверки причинных связей между переменными.
Для исследования многофакторных зависимостей в последнее время все чаще используют методы математического планирования эксперимента.
Возможность одновременного варьирования всеми факторами позволяет: а) уменьшить количество опытов;
б) свести ошибку эксперимента к минимуму;
в) упростить обработку полученных данных;
г) обеспечить наглядность и легкость по сравнению результатов.
Каждый фактор может приобретать некоторую соответствующее количество различных значений, которые называются уровнями и обозначают -1, 0 и 1. Фиксированный набор уровней факторов определяет условия одного из возможных опытов.
Совокупность всех возможных сочетаний вычисляют по формуле:
Полным факторным экспериментом называется эксперимент, в котором реализуются все возможные сочетания уровней факторов. Полные факторные эксперименты могут обладать свойством ортогональности. При ортогональном планировании факторы в эксперименте является некоррелированными, коэффициенты регрессии, которые высчитывают в итоге, определяют независимо друг от друга.
Важным преимуществом метода математического планирования эксперимента является его универсальность, пригодность во многих областях исследований.
Рассмотрим пример сравнения влияния некоторых факторов на формирование уровня психического напряжения в регулировщиков цветных телевизоров.
В основу эксперимента положен ортогональный План 2 три (три фактора изменяются на двух уровнях).
Эксперимент проводили с полным части 2 +3 с трехкратным повторением.
Ортогональное планирование базируется на построении уравнения регрессии. Для трех факторов оно выглядит так:
Обработка результатов в этом примере включает:
а) построение ортогонального плана 2 +3 таблице для расчета;
б) вычисления коэффициентов регрессии;
в) проверку их значимости;
г) интерпретацию полученных данных.
Для коэффициентов регрессии упомянутого уравнения надо было поставить N = 2 3 = 8 вариантов, чтобы иметь возможность оценить значимость коэффициентов, где количество повторений К равнялось 3.
Составлена матрица планирования эксперимента выглядела.
Дисциплина "высшая математика" у некоторых вызывает неприятие, так как поистине не всем дано ее понять. Но те, кому посчастливилось изучать этот предмет и решать задачи, используя различные уравнения и коэффициенты, могут похвастаться практически полной в ней осведемленности. В психологической науке существует не только гуманитарная направленность, но и определенные формулы и способы для математической проверки выдвигаемой в ходе исследований гипотезы. Для этого применяются различные коэффициенты.
Коэффициент корреляции Спирмена
Это распространенное измерение по определению тесноты связи между какими-либо двумя признаками. Коэффициент еще называют непараметрическим методом. Он показывает статистику связи. То есть мы знаем, например, что у ребенка агрессия и раздражительность связаны между собой, а коэффициент корреляции рангов Спирмена показывает статистическую математическую связь этих двух признаков.
Как вычисляется ранговый коэффициент?
Естественно, что для всех математических определений или величин существуют свои формулы, по которым они вычисляются. Ею обладает и коэффициент корреляции Спирмена. Формула у него следующая:
С первого взгляда формула не совсем понятна, но если разобраться, все очень легко вычисляется:
- n - это количество признаков или показателей, которые проранжированы.
- d - разность определенных двух рангов, соответствующих конкретным двум переменным каждого испытуемого.
- ∑d 2 - сумма всех квадратов разностей рангов признака, квадраты которых вычисляются отдельно для каждого ранга.
Область применения математической меры связи
Для применения рангового коэффициента необходимо, чтобы количественные данные признака были проранжированы, то есть им был присвоен определенный номер в зависимости от места, на котором расположен признак, и от его значения. Доказано, что два ряда признаков, выраженных в числовом виде, несколько параллельны между собой. Коэффициент ранговой корреляции Спирмена определяет степень этой параллельности, тесноты связи признаков.
Для математической операции по расчету и определению связи признаков с помощью указанного коэффициента нужно произвести некоторые действия:
- Каждому значению какого-либо испытуемого или явления присваивается номер по порядку - ранг. Он может соответствовать значению явления по возрастанию и по убыванию.
- Дальше сопоставляются ранги значения признаков двух количественных рядов для того, чтобы определить разность между ними.
- В отдельном столбце таблицы для каждой полученной разности прописывается ее квадрат, а внизу результаты суммируются.
- После этих действий применяется формула, по которой рассчитывается коэффициент корреляции Спирмена.
Свойства коэффициента корреляции
К основным свойствам коэффициента Спирмена относят следующие:
- Измерение значений в пределах от -1 до 1.
- Знак коэффициента интерпретаций не имеет.
- Теснота связи определяется по принципу: чем выше величина, тем теснее связь.
Как проверить полученное значение?
Для проверки связи признаков между собой необходимо выполнить определенные действия:
- Выдвигается нулевая гипотеза (H0), она же основная, затем формулируется другая, альтернативная первой (H 1). Первая гипотеза будет заключаться в том, что коэффициент корреляции Спирмена равняется 0 - это значит, что связи не будет. Вторая, наоборот, гласит, что коэффициент не равен 0, тогда связь есть.
- Следующим действием будет нахождение наблюдаемого значения критерия. Оно находится по основной формуле коэффициента Спирмена.
- Далее находятся критические значения заданного критерия. Это можно сделать только с помощью специальной таблицы, где отображаются различные значения по заданным показателям: уровень значимости (l) и число, определяющее (n).
- Теперь нужно сравнить два полученных значения: установленного наблюдаемого, а также критического. Для этого необходимо построить критическую область. Нужно начертить прямую линию, на ней отметить точки критического значения коэффициента со знаком "-" и со знаком"+". Слева и справа от критических значений полукругами от точек откладываются критические области. Посередине, объединяя два значения, отмечается полукругом ОПГ.
- После этого делается вывод о тесноте связи между двумя признаками.
Где лучше использовать эту величину
Самой первой наукой, где активно использовался этот коэффициент, была психология. Ведь это наука, не основывающаяся на цифрах, однако для доказательства каких-либо важных гипотез, касающихся развития отношений, черт характера людей, знаний студентов, требуется статистическое подтверждение выводов. Также его используют в экономике, в частности, при валютных оборотах. Здесь оцениваются признаки без статистики. Очень удобен коэффициент ранговой корреляции Спирмена в этой области применения тем, что оценка производится независимо от распределения переменных, так как они заменяются ранговым числом. Активно применяется коэффициент Спирмена в банковском деле. Социология, политология, демография и другие науки также используют его в своих исследованиях. Результаты получаются быстро и максимально точно.
Удобно и быстро используется коэффициент корреляции Спирмена в Excel. Здесь существуют специальные функции, которые помогают быстро получить необходимые значения.
Какие еще коэффициенты корреляции существуют?
Кроме того, что мы узнали про коэффициент корреляции Спирмена, существуют еще различные корреляционные коэффициенты, позволяющие измерить, оценить качественные признаки, связь между количественными признаками, тесноту связи между ними, представленными в ранговой шкале. Это такие коэффициенты, как биссериальный, рангово-биссериальный, контенгенции, ассоциации, и так далее. Коэффициент Спирмена очень точно показывает тесноту связи, в отличие от всех остальных методов ее математического определения.
Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.
Величина коэффициента корреляции Спирмена также лежит в интервале +1 и -1. Он, как и коэффициент Пирсона, может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.
В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего, чем 20 числа признаков -- затруднителен. Возможно, что именно поэтому таблица критических значений рангового коэффициента корреляции рассчитана лишь для сорока ранжируемых признаков (n < 40, табл. 20 приложения 6).
Ранговый коэффициент корреляции Спирмена подсчитывается по формуле:
где n - количество ранжируемых признаков (показателей, испытуемых);
D - разность между рангами по двум переменным для каждого испытуемого;
Сумма квадратов разностей рангов.
Используя ранговый коэффициент корреляции, рассмотрим следующий пример.
Пример : Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.
Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в табл. 13.
Таблица 13
№ учащихся | |||||||||||
Ранги показателей школьной готовности | |||||||||||
Ранги среднегодовой успеваемости | |||||||||||
Подставляем полученные данные в формулу и производим расчет. Получаем:
Для нахождения уровня значимости обращаемся к табл. 20 приложения 6, в которой приведены критические значения для коэффициентов ранговой корреляции.
Подчеркнем, что в табл. 20 приложения 6, как и в таблице для линейной корреляции Пирсона, все величины коэффициентов корреляции даны по абсолютной величине. Поэтому, знак коэффициента корреляции учитывается только при его интерпретации.
Нахождение уровней значимости в данной таблице осуществляется по числу n, т. е. по числу испытуемых. В нашем случае n = 11. Для этого числа находим :
0,61 для P 0,05
0,76 для P 0,01
Строим соответствующую ``ось значимости"":
Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью - иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Нгипотезу о сходстве и принять альтернативную (Но наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.
Случай одинаковых (равных) рангов
При наличии одинаковых рангов формула расчета коэффициента линейной корреляции Спирмена будет несколько иной. В этом случае в формулу вычисления коэффициентов корреляции добавляются два новых члена, учитывающие одинаковые ранги. Они называются поправками на одинаковые ранги и добавляются в числитель расчетной формулы.
где n - число одинаковых рангов в первом столбце,
k - число одинаковых рангов во втором столбце.
Если имеется две группы одинаковых рангов, в каком-либо столбце то формула поправки несколько усложняется:
где n - число одинаковых рангов в первой группе ранжируемого столбца,
k - число одинаковых рангов в второй группе ранжируемого столбца. Модификация формулы в общем случае такова:
Пример : Психолог, используя тест умственного развития (ШТУР) проводит исследование интеллекта у 12 учащихся 9 класса. Одновременно с этим, но просит учителей литературы и математики провести ранжирование этих же учащихся по показателям умственного развития. Задача заключается в том, чтобы определить, как связаны между собой объективные показатели умственного развития (данные ШТУРа) и экспертные оценки учителей.
Экспериментальные данные этой задачи и дополнительные столбцы, необходимые для расчета коэффициента корреляции Спирмена, представим в виде табл. 14.
Таблица 14
№ учащихся |
Ранги тестирования с помощью ШТУРа |
Экспертные оценки учителей по математики |
Экспертные оценки учителей по литературе |
D (второго и третьего столбцов) |
D (второго и четвертого столбцов) |
(второго и третьего столбцов) |
(второго и четвертого столбцов) |
Поскольку при ранжировании использовались одинаковые ранги, то необходимо проверить правильность ранжирования во втором, третьем и четвертом столбцах таблицы. Суммирование в каждом из этих столбцов дает одинаковую сумму - 78.
Проверяем по расчетной формуле. Проверка дает:
В пятом и шестом столбцах таблицы приведены величины разности рангов между экспертными оценками психолога по тесту ШТУР для каждого ученика и величинами экспертных оценок учителей, соответственно по математике и литературе. Сумма величин разностей рангов должна быть равна нулю. Суммирование величин D в пятом и шестом столбцах дало искомый результат. Следовательно, вычитание рангов проведено правильно. Подобную проверку необходимо делать каждый раз при проведении сложных видов ранжирования.
Прежде, чем начать расчет по формуле необходимо рассчитать поправки на одинаковые ранги для второго, третьего и четвертого столбцов таблицы.
В нашем случае во втором столбце таблицы два одинаковых ранга, следовательно, по формуле величина поправки D1 будет:
В третьем столбце три одинаковых ранга, следовательно, по формуле величина поправки D2 будет:
В четвертом столбце таблицы две группы по три одинаковых ранга, следовательно, по формуле величина поправки D3 будет:
Прежде, чем преступить к решению задачи, напомним, что психолог выясняет два вопроса - как связаны величины рангов по тесту ШТУР с экспертными оценками по математике и литературе. Именно поэтому расчет проводится дважды.
Считаем первый ранговый коэффициент с учетом добавок по формуле. Получаем:
Подсчитаем без учета добавки:
Как видим, разница в величинах коэффициентов корреляции оказалась очень незначительной.
Считаем второй ранговый коэффициент с учетом добавок по формуле. Получаем:
Подсчитаем без учета добавки:
И опять, различия оказались очень незначительны. Поскольку число учащихся в обоих случаях одинаково, по табл. 20 приложения 6 находим критические значения при n = 12 сразу для обоих коэффициентов корреляции.
0,58 для P 0,05
0,73 для P 0,01
Откладываем первое значение на ``оси значимости"":
В первом случае полученный коэффициент ранговой корреляции находится в зоне значимости. Поэтому психолог должен отклонить нулевую Нгипотезу о сходстве коэффициента корреляции с нулем и принять альтернативную Но значимом отличии коэффициента корреляции от нуля. Иными словами, полученный результат говорит о том, что чем выше экспертные оценки учащихся по тесту ШТУР, тем выше их экспертные оценки по математике.
Откладываем второе значение на ``оси значимости"":
Во втором случае коэффициент ранговой корреляции находится в зоне неопределенности. Поэтому психолог может принять нулевую Нгипотезу о сходстве коэффициента корреляции с нулем и отклонить альтернативную Но значимом отличии коэффициента корреляции от нуля. В этом случае полученный результат говорит о том, что экспертные оценки учащихся по тесту ШТУР не связаны с экспертными оценками по литературе.
Для применения коэффициента корреляции Спирмена, необходимо соблюдать следующие условия:
1. Сравниваемые переменные должны быть получены в порядковой (ранговой) шкале, но могут быть измерены также в шкале интервалов и отношений.
2. Характер распределения коррелируемых величин не имеет значения.
3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
Таблицы для определения критических значений коэффициента корреляции Спирмена (табл. 20 приложение 6) рассчитаны от числа признаков равных n = 5 до n = 40 и при большем числе сравниваемых переменных следует использовать таблицу для пирсоновского коэффициента корреляции (табл. 19 приложение 6). Нахождение критических значений осуществляется при k = n.
На практике для определения тесноты связи двух признаков часто применяется коэффициент ранговой корреляции Спирмена (Р). Значения каждого признака ранжируются по степени возрастания (от 1 до n), затем определяется разница (d) между рангами, соответствующими одному наблюдению.
Пример №1
. Зависимость между объемом промышленной продукции и инвестициями в основной капитал по 10 областям одного из федеральных округов РФ в 2003 году характеризуется следующими данными.
Вычислите ранговые коэффициенты корреляции Спирмена
и Кендэла . Проверить их значимость при α=0,05. Сформулируйте вывод о зависимости между объемом промышленной продукции и инвестициями в основной капитал по рассматриваемым областям РФ.
Присвоим ранги признаку Y и фактору X . Найдем сумму разности квадратов d 2 .
Используя калькулятор , вычислим коэффициент ранговой корреляции Спирмена:
X | Y | ранг X, d x | ранг Y, d y | (d x - d y) 2 |
1.3 | 300 | 1 | 2 | 1 |
1.8 | 1335 | 2 | 12 | 100 |
2.4 | 250 | 3 | 1 | 4 |
3.4 | 946 | 4 | 8 | 16 |
4.8 | 670 | 5 | 7 | 4 |
5.1 | 400 | 6 | 4 | 4 |
6.3 | 380 | 7 | 3 | 16 |
7.5 | 450 | 8 | 5 | 9 |
7.8 | 500 | 9 | 6 | 9 |
17.5 | 1582 | 10 | 16 | 36 |
18.3 | 1216 | 11 | 9 | 4 |
22.5 | 1435 | 12 | 14 | 4 |
24.9 | 1445 | 13 | 15 | 4 |
25.8 | 1820 | 14 | 19 | 25 |
28.5 | 1246 | 15 | 10 | 25 |
33.4 | 1435 | 16 | 14 | 4 |
42.4 | 1800 | 17 | 18 | 1 |
45 | 1360 | 18 | 13 | 25 |
50.4 | 1256 | 19 | 11 | 64 |
54.8 | 1700 | 20 | 17 | 9 |
364 |
Связь между признаком Y фактором X сильная и прямая.
Оценка коэффициента ранговой корреляции Спирмена
По таблице Стьюдента находим Tтабл.
T табл = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл, то отклоняем гипотезу о равенстве нулю коэффициента ранговой корреляции. Другими словами, коэффициента ранговой корреляции Спирмена статистически - значим.
Интервальная оценка для коэффициента ранговой корреляции (доверительный интервал)
Доверительный интервал
для коэффициента ранговой корреляции Спирмена: p(0.5431;0.9095).
Пример №2 . Исходные данные.
5 | 4 |
3 | 4 |
1 | 3 |
3 | 1 |
6 | 6 |
2 | 2 |
Новые ранги | ||
1 | 1 | 1 |
2 | 2 | 2 |
3 | 3 | 3.5 |
4 | 3 | 3.5 |
5 | 5 | 5 |
6 | 6 | 6 |
Номера мест в упорядоченном ряду | Расположение факторов по оценке эксперта | Новые ранги |
1 | 1 | 1 |
2 | 2 | 2 |
3 | 3 | 3 |
4 | 4 | 4.5 |
5 | 4 | 4.5 |
6 | 6 | 6 |
ранг X, d x | ранг Y, d y | (d x - d y) 2 |
5 | 4.5 | 0.25 |
3.5 | 4.5 | 1 |
1 | 3 | 4 |
3.5 | 1 | 6.25 |
6 | 6 | 0 |
2 | 2 | 0 |
21 | 21 | 11.5 |
где
j - номера связок по порядку для признака х;
А j - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
В k - число одинаковых рангов в k-й связке по у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1
Связь между признаком Y и фактором X умеренная и прямая.
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений,
которые могут быть проранжированы. Такими рядами значений могут быть:
1) два признака, измеренные в одной и той же группе испытуемых;
2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков;
3) две групповые иерархии признаков,
4) индивидуальная и групповая иерархии признаков.
Вначале показатели ранжируются отдельно по каждому из признаков.
Как правило, меньшему значению признака начисляется меньший ранг.
В первом случае (два признака) ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку.
Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по
одному из признаков, будут иметь по другому признаку также высокие ранги. Для подсчета rs необходимо определить разности (d) между рангами, полученными данным испытуемым по обоим признакам. Затем эти показатели d определенным образом преобразуются и вычитаются из 1. Чем
меньше разности между рангами, тем больше будет rs, тем ближе он будет к +1.
Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет
никакого соответствия. Формула составлена так, что в этом случае rs окажется близким к 0.
В случае отрицательной корреляции низким рангам испытуемых по одному признаку
будут соответствовать высокие ранги по другому признаку, и наоборот. Чем больше несовпадение между рангами испытуемых по двум переменным, тем ближе rs к -1.
Во втором случае (два индивидуальных профиля), ранжируются индивидуальные
значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до
20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов).
Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С
(эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по
этому фактору высокий ранг и т.д.
В третьем случае (два групповых профиля), ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.
В случае 4-ом (индивидуальный и групповой профили), ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого – он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.
Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки n. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N – это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах. Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.
Гипотезы.
Возможны два варианта гипотез. Первый относится к случаю 1, второй – к трем остальным случаям.
Первый вариант гипотез
H0: Корреляция между переменными А и Б не отличается от нуля.
H1: Корреляция между переменными А и Б достоверно отличается от нуля.
Второй вариант гипотез
H0: Корреляция между иерархиями А и Б не отличается от нуля.
H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.
Ограничения коэффициента ранговой корреляции
1. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений.
2. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги.
Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:
Если в обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов, перед подсчетом коэффициента ранговой корреляции необходимо внести поправки на одинаковые ранги Та и Тв:
Та = Σ (а3 – а)/12,
Тв = Σ (в3 – в)/12,
где а – объем каждой группы одинаковых рангов в ранговом ряду А, в – объем каждой
группы одинаковых рангов в ранговом ряду В.
Для подсчета эмпирического значения rs используют формулу:
Расчет коэффициента ранговой корреляции Спирмена rs
1. Определить, какие два признака или две иерархии признаков будут участвовать в
сопоставлении как переменные А и В.
2. Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования (см. П.2.3). Занести ранги в первый столбец таблицы по порядку номеров испытуемых или признаков.
3. Проранжировать значения переменной В, в соответствии с теми же правилами. Занести ранги во второй столбец таблицы по порядку номеров испытуемых или признаков.
5. Возвести каждую разность в квадрат: d2. Эти значения занести в четвертый столбец таблицы.
Та = Σ (а3 – а)/12,
Тв = Σ (в3 – в)/12,
где а – объем каждой группы одинаковых рангов в ранговом ряду А; в – объем каждой группы
одинаковых рангов в ранговом ряду В.
а) при отсутствии одинаковых рангов
rs 1 − 6 ⋅
б) при наличии одинаковых рангов
Σd 2 T T
r 1 − 6 ⋅ a в,
где Σd2 – сумма квадратов разностей между рангами; Та и Тв – поправки на одинаковые
N – количество испытуемых или признаков, участвовавших в ранжировании.
9. Определить по Таблице (см. Приложение 4.3) критические значения rs для данного N. Если rs, превышает критическое значение или, по крайней мере, равен ему, корреляция достоверно отличается от 0.
Пример 4.1.При определении степени зависимости реакции употребления алкоголя на глазодвигательную реакцию в испытуемой группе были получены данные до употребления алкоголя и после употребления. Зависит ли реакция испытуемого от состояния опьянения?
Результаты эксперимента:
До:16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. После: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Сформулируем гипотезы:
Н0: корреляция между степенью зависимости реакции до употребления алкоголя и после не отличается от нуля.
Н1: корреляция между степенью зависимости реакции до употребления алкоголя и после достоверно отличается от нуля.
Таблица 4.1. Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей глазодвигательной реакции до эксперимента и после (N=17)
значения |
значения |
|||||
Так как, мы имеем повторяющиеся ранги, то в данном случае будем применять формулу с поправкой на одинаковые ранги:
Та= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6
Тb =((23-2)+(23-2)+(33-3))/12=3
Найдем эмпирическое значение коэффициента Спирмена:
rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05
По таблице (приложение 4.3) находим критические значения коэффициента корреляции
0,48 (p ≤ 0,05)
0,62 (p ≤ 0,01)
Получаем
rs=0,05∠rкр(0,05)=0,48
Вывод: Н1гипотеза отвергается и принимается Н0. Т.е. корреляция между степенью
зависимости реакции до употребления алкоголя и после не отличается от нуля.