Обработка полученных в ходе исследования данных является одним из наиболее важных этапов для получения валидных результатов. Поэтому перед исследователем наиболее остро встает вопрос выбора статистического критерия. Для осуществления статистического анализа данных предлагаем выполнить следующие шаги:
Соберите все полученные данные в таблицу, где каждый столбец это один из измеряемых параметров, а каждая строка это данные по одному испытуемому. Избегайте объединения ячеек для правильного последующего экспорта в программы для статистической обработки.
Определите, в какой из четырех шкал (номинативная, ранговая, интервальная, абсолютная) измерен каждый из исследуемых параметров. Например, пол испытуемых является номинативной шкалой (не забудьте закодировать подобные данные в числовой форме), оценка продукта по пятибалльной шкале - ранговой шкалой, балл по шкале тревоги Бека - интервальной шкалой, а количество фиксаций на определенной зоне интереса - абсолютной шкалой. Отличие абсолютной шкалы от интервальной заключается в том, что ноль в ней говорит о полном отсутствие измеряемого признака.
Воспользуйтесь описательными статистиками и рассчитайте следующие параметры исследуемых признаков по всей выборке или по отдельной группе испытуемых: среднее, стандартное отклонение, медиану, моду, а также доверительные интервалы.
Проверьте распределение каждого параметра на нормальность при помощи критерия Шапиро-Уилка. Если распределение значимо отличается от нормального, то используйте в дальнейшем непараметрические критерии (наиболее простой вариант, не требующий дополнительных вычислений) или же трансформируйте данные (например, с помощью логарифмической трансформации).
Выполнив вышеперечисленные подготовительные этапы, определитесь с задачами статистического анализа. Основных задач всего несколько:
- сравнить выборки;
- сравнить исследуемые параметры;
- найти взаимосвязь;
- оценить вклад одной переменной в другую;
- классифицировать данные;
- снизить размерность.
Рассмотрим подробнее как справиться с этими задачами при помощи статистических критериев:
- Для сравнения двух выборок используйте t-Стьюдента для независимых выборок или его непараметрический аналог U-Манна-Уитни. Для сравнения трех и более выборок используйте ANOVA или его непараметрический аналог Н-Краскала-Уоллеса. Для дальнейшего попарного сравнения при помощи ANOVA примените апостериорный критерий, например Тьюки.
- Если выборки сравниваются по нескольким признакам (например, по полу и уровню тревоги), то воспользуйтесь многофакторным ANOVA.
- Для сравнения исследуемых параметров (например, количества фиксаций на разных областях интереса) используйте критерии для повторных измерений. Если параметра два, то вам поможет t-Стьюдента для зависимых выборок (непараметрический аналогом является Т-Вилкоксона), если три и более - ANOVA с повторными измерениями (непараметрический аналог - хи2-Фридмана)
- Для поиска взаимосвязи воспользуйтесь корреляционным анализом и рассчитайте коэффициент корреляции Пирсона (или его непараметрический аналог - тест ранговой корреляции Спирмена).
- Оценить вклад независимой переменной (одной или нескольких) в зависимую переменную поможет регрессионный анализ. Если зависимая переменная является номинативной, то используйте дискриминантный анализ.
- “Классификация без обучения” (в том случае, когда количество распределение испытуемых по группам неизвестно) осуществляется при помощи кластерного анализа. Для “классификации с обучением” (по заранее заданным группам) используйте метод деревьев классификации.
- Снизить размерность данных (например, из десяти исследуемых переменных создать меньшее количество новых) можно применив факторный анализ.
Проинтерпретируйте полученные результаты и, при необходимости, визуализируйте их используя широкий выбор графиков и диаграмм.