Факторный анализ в spss пошаговая инструкция

10. Факторный анализ

Факторный анализ — представляет собой метод обобщения или сокращения большого количества переменных, объединение их в группы на основе характерных связей. В факторном анализе переменные не делятся
на независимые и зависимые.

В практике маркетинговых исследований с факторный анализ применяется в следующих ситуациях

  • для сегментирования рынка и выявления переменных с целью группировки потребителей;
  • для определения характеристик торговой марки с целью выявления предпочтений потребителей;
  • при разработке рекламной стратегии с целью выявления особенностей восприятия потребителем рекламного продукта

Факторный анализ применяется для выделения из большого массива данных малое число групп, состоящих из переменных, объединенных общими факторами (Рисунок 10.1).

Рисунок 10.1 –Диалоговое окно факторного анализа

Рисунок 10.1 –Диалоговое окно факторного анализа

В один фактор объединяются переменные, плотно коррелирующие между собой и слабо коррелирующие с переменными, которые объединяются на основе других факторов. Факторный анализ проводится с целью
сокращения числа переменных и упрощение процедуры анализа существующей базы данных.

В процессе проведения факторного анализа рассчитываются и анализируются следующие показатели:

  • Критерий сферичности Бартлетта — показатель, с помощью которого проверяют, отличаются ли корреляции от 0. Если г близко к нулю, то выбранная переменная не взаимосвязана с другими.
    Значимость меньше 0,05 указывает, на то что проведение факторного анализа приемлемо.
  • Корреляционная матрица — матрица, включающая в себя все возможные коэффициенты корреляций r между анализируемыми перемнными.
  • КМО — мера адекватности выборки Кайзера—Мейера—Олкина — величина, используемая для оценки применимости факторного анализа. Значения от 0,5 до 1 говорят об адекватности факторного анализа,
    значения до 0,5 указывают на то, что факторный анализ неприменим к выборке.

Графическое изображение критерия “каменистой осыпи” — график собственных значений факторов, расположенных в порядке убывания, используется для определения достаточного числа факторов.

Процедура факторного анализа включает следующие этапы:

  1. Формулировка проблемы.
  2. Проверка возможности проведения, вычисление корреляционной матрицы.
  3. Выбор метода факторного анализа.
  4. Извлечение факторов.
  5. Вращение факторов.
  6. Определение значений факторов.
  7. Проведение подгонки выбранной модели.

Пример. Проведем факторный анализ с целью сокращения массива данных, содержащих информацию о мотивах туристов, при выборе места отдыха за городом. Оптимизируем структуру данных, сократив
число переменных.

Основные задачи:

  • оценить возможность проведения и адекватность факторного анализа для данной выборки;
  • вычислить корреляционную матрицу и выявить взаимосвязи между переменными базы данных;
  • выявить и извлечь необходимое количество факторов для создания упрощенной структуры;
  • разбить базу данных на группы факторов на основе значений совместной корреляции;
  • подобрать названия созданным переменным.

Вверх

Мотивы туристов, при выборе места отдыха за городом:

  1. близость к городу
  2. приемлемые цены
  3. близость водоема, леса
  4. уровень комфорта
  5. тишина, уединение
  6. хорошее питание
  7. наличие развлечений
  8. комфорт отдыха с детьми
  9. возможность лечения, ухода за здоровьем

Пошаговая инструкция

ШАГ 1. Меню “Анализ — Сокращение размерности — Факторный анализ …”. Открывается диалоговое окно “Факторный анализ”.

ШАГ 2. Из этого списка переменных выбрать необходимый массив, и перенести его в поле “Переменные”.

Если есть необходимость провести факторный анализ отдельно для двух переменных, например мужчин и женщин, то в поле “Переменная отбора наблюдений” вносится переменная “пол”. В данном
случае нет необходимости проводить такое деление.

ШАГ 3. Диалоговое окно “Описательные статистики— выбрать “КМО и критерий сферичности Бартлетта” для проведения тестов “КМО” и “Бартлетт”, проверяющих пригодность
данных для проведения факторного анализа.

ШАГ 4. Диалоговое окно “Описательные статистики— “Корреляционная матрица— “Коэффициенты— “Продолжить”.

ШАГ 5. Диалоговое окно “Извлечение— задать условия определения количества факторов. В диалоговом окне “Извлечение— выбрать метод “Главные компоненты. — “Матрица корреляций”
(Рисунок 10.2).

Рисунок 10.2 —  Матрица корреляций

Рисунок 10.2 — Матрица корреляций

ШАГ 6. Задать условие: собственное значение больше “1”. При данном условии программа определит факторы в количестве больше 1.

ШАГ 7. Вывести график собственных значений — “График собственных значений— “Продолжить”.

ШАГ 8. Выбор ротации матрицы коэффициентов: в главном диалоговом окне “Факторный анализ— диалоговое окно “Вращение— метод ротации “Варимакс— “Продолжить”.

ШАГ 9. Создание новых переменных: в диалоговом окне “Факторный анализ— диалоговое окно “Значения факторов— отметить команду “Сохранить как переменные— метод
расчета значений новых переменных “Регрессионная модель”. В итоге создаются новые переменные, которые можно будет использовать в дальнейшем анализе.

ШАГ 10. “ОК”.

Интерпретация результатов

  1. Величина КМО показывает приемлемую адекватность выборки для факторного анализа КМО = 0,512>0,5. Критерий Бартлетта (p<0,05), что говорит о целесообразности факторного анализа в
    силу коррелированности факторов.
  2. Мера адекватности и критерий Бартлетта
    Мера выборочной адекватности Кайзера—Мейера—Олкина ,512
    Критерий сферичности Бартлетта Приблиз. хи—квадрат 262,3
    ст.св. 45
    Знч. ,000

    Таблица 10.1 — Результаты теста КМО и Бартлетта

    близость к городу приемлемые цены близость водоема, леса уровень комфорта тишина, уединение хорошее питание наличие развлечений комфорт отдыха с детьми возможность лечения, ухода за здоровьем организация детск. отдыха
    Корреляция близость к городу 1,000 -,060 ,009 ,519 -,172 ,149 ,322 ,075 -,166 ,241
    приемлемые цены -,060 1,000 -,064 -,341 ,270 -,247 -,121 ,232 ,273 -,407
    близость водоема, леса ,009 -,064 1,000 -,056 ,017 -,083 ,107 ,114 ,027 ,030
    уровень комфорта ,519 -,341 -,056 1,000 -,113 ,384 ,070 ,008 -,125 ,256
    тишина, уединение -,172 ,270 ,017 -,113 1,000 ,084 -,167 -,060 ,989 -,129
    хорошее питани ,149 -,247 -,083 ,384 ,084 1,000 -,422 ,191 ,036 ,237
    наличие развлечений ,322 -,121 ,107 ,070 -,167 -,422 1,000 -,045 -,116 ,248
    комфорт отдыха с детьми ,075 ,232 ,114 ,008 -,060 ,191 -,045 1,000 -,053 ,202
    возможность лечения, ухода за здоровьем -,166 ,273 ,027 -,125 ,989 ,036 -,116 -,053 1,000 -,106
    организация детск. отдыха ,241 -,407 ,030 ,256 -,129 ,237 ,248 ,202 -,106 1,000

    Таблица 10.2 — Корреляционная матрица.

    Коэффициенты корреляции характеризуют плотность связи между переменными исходного массива.

  3. Выявление и извлечение необходимого количества факторов для создания упрощенной структуры
    Компонента Начальные собственные значения Суммы квадратов нагрузок вращения
    Всего % дисперсии Кумулятивный % Всего % дисперсии Кумулятивный %
    1 2,57 25,7 25,7 2,07 20,76 20,76
    2 1,79 17,95 43,66 1,84 18,47 39,23
    3 1,4 14,02 57,68 1,56 15,62 54,86
    4 1,23 12,29 69,97 1,34 13,42 68,28
    5 1,07 10,79 80,77 1,24 12,48 80,77
    6 ,87 8,69 89,47
    7 ,43 4,31 93,78
    8 ,34 3,43 97,21
    9 ,27 2,7 99,91
    10 ,008 ,08 100,0

    Метод выделения: Анализ главных компонент.

    Начальные собственные значения должны быть больше 1.

    Оптимальное число факторов — 5. Такая модель сохраняет 80,77% исходной информации, при этом число фактор сокращается в два раза.

    Рисунок 10.1 —  График собственных значений

    Рисунок 10.1 — График собственных значений

    График показывает соответствующие собственные значения в системе координат: с 5 по 6 факторы происходит перелом графика. Это подтверждает, что оптимальное количество факторов 5.

  4. На основании ротированной матрицы (таблица 10.5) компонентов в одну группу собираются переменные, которые наиболее тесно взаимосвязанные между собой (наиболее высокое значение коэффициента корреляции). В результате программа группирует переменные исходного массива и создает матрицу преобразования компонент (таблица 10.6)
    Компонента
    1 2 3 4 5
    близость к городу -,088 ,852 -,198 -,009 ,147
    приемлемые цены ,278 -,190 -,221 -,561 ,622
    близость водоема, леса ,074 -,240 -,210 ,664 ,215
    уровень комфорта -,062 ,793 ,241 ,093 -,148
    тишина, уединение ,988 -,074 ,082 -,040 -9,640E—6
    хорошее питание ,059 ,331 ,831 ,158 ,054
    наличие развлечений -,075 ,335 -,797 ,261 -,070
    комфорт отдыха с детьми -,086 ,078 ,179 ,221 ,874
    возможность лечения, ухода за здоровьем ,991 -,071 ,026 -,021 ,006
    организация детского отдыха -,084 ,400 ,087 ,659 -,004

    Таблица 10.5 — Матрица повернутых компонент

    Метод выделения: Анализ методом главных компонент.
    Метод вращения: Варимакс с нормализацией Кайзера.

    Компонента 1 2 3 4 5
    1 -,69 ,61 ,023 ,36 -,12
    2 ,55 ,48 ,64 ,19 ,03
    3 ,45 ,35 ,75 ,32 ,002
    4 -,101 -,008 ,000 ,14 ,98
    ,020 ,51 -,130 -,83 ,123

    Таблица 10.6 — Матрица преобразования компонент

    Метод выделения: Анализ методом главных компонент.
    Метод вращения: Варимакс с нормализацией Кайзера.

    Выделяем следующие факторы:
    Фактор 1 — тишина и уединение, уход за здоровьем
    Фактор 2 — близость к городу, уровень комфорта
    Фактор 3 — хорошее питание, наличие развлечений
    Фактор 4 — организация детского отдыха, близость водоем
    Фактор 5 — комфорт отдыха с детьми, приемлемые цен

  5. В базе данных автоматически переносятся новые переменные построенной факторной модели (Рисунок 10.2). В столбце “Метка” отображается номер компонента факторной модели.

    Рисунок 10.2 —  Фрагмент вкладки “Переменные”

    Рисунок 10.2 — Фрагмент вкладки “Переменные”

    Названия новых компонент необходимо занести в исходную базу данных в столбец “Метка” таблицы “Переменные”, компьютер автоматически вычисляет значения новых переменных.

    Суть новых переменных сводится к следующему: наибольшее отрицательное значение говорит о большей значимости переменной, и наоборот, наибольшее положительное значение говорит о наименьшей значимости переменной.

    Созданные переменные в дальнейшем могут использоваться для анализа, например для проведения кластерного анализа.

Для того, чтобы рассчитать факторный анализ используя статистически пакет SPSS необходимо сделать следующий шаги:

1. Внести значения переменных по которым необходимо рассчитать факторный анализ. Данные вносятся в таблицу Data Editor. (Например 8 переменных var1…var8)

2. Выбираем Analyze -> Data reduction -> Factor…

3. В появившемся окошке под переносим нужные нам переменные из правой части в левую (var1…var8)

4. нажимаем кнопку Extraction

4.1. В появившемся окне выбираем Principial components.

4.2. Отмечаем галочкой Scree plot

4.3. Нажимаем Continue

5. Затем нажимаем кнопку Rotation.

5.1. В поле Method из выпадающего списка выбираем Varimax

5.2. Нажимаем кнопку Continue

6юНажимаем кнопку Options

6.1. В поле Coefficient display format отмечаем галочкой Suppress absolute values less then 0,1

6.2. Нажимаем кнопку Continue

7. Смотрим результаты

19.1. Порядок выполнения факторного анализа

На первом шаге процедуры факторного анализа происходит стандартизация заданных значений переменных (z-преобразование);
затем при помощи стандартизированных значений рассчитывают корреляционные коэффициенты Пирсона между рассматриваемыми переменными.

Исходным элементом для дальнейших расчётов является корреляционная матрица. Для понимания отдельных шагов этих расчётов потребуются хорошие знания, прежде всего, в области операций над матрицами.
Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения
диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).

Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу.
Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки.
Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы,
наиболее часто употребляемым из которых является метод определения главных факторов (компонентов).

Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи,
поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является
ортогональное вращение по так называемому методу варимакса. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа.
Кроме того на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам.

Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения.
Таким образом для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Факторный анализ — это статистический инструмент, довольно часто используемый в психологии при создании многофакторных тестов, а также при систематизации и обобщении комплексных наблюдений.
Многочисленные варианты его использования включают конструирование тестов, выявление основных параметров личности и способностей, установление того, сколько отдельных психологических характеристик
(т.е. черт) измеряется набором тестов или заданиями теста.

Термин «факторный анализ» может относиться к двум довольно разным статистическим методикам:

  • Исследовательский факторный анализ (эксплораторный факторный анализ) — более старая и более простая методика.

  • Конфирматорный факторный анализ и его разновидности (известные как «анализ путей», «анализ латентных переменных» или «модели LJSREL») полезны во многих областях
    за пределами изучения индивидуальных различий и особенно популярны в социальной психологии. Авторы не всегда четко указывают, какой из видов факторного анализа использовался —
    исследовательский или конфирматорный. Если вы увидите термин «факторный анализ» в журнале, следует допустить, что имеется и виду исследовательский факторный анализ.

Часто при создании психологического теста важно, чтобы все задания шкалы измеряли одну (и только одну) психологическую переменную.
Коэффициент альфа Кронбаха может служить показателем надежности шкалы. Эта техника исходит из того,
что все задания в тесте формируют одну шкалу и коэффициент надежности, в сущности, проверяет, насколько это допущение обоснованно.

Однако рассмотрим более простой пример. В интересах науки планируете собрать следующие данные у случайно сформированной выборки, например, у 200 студентов:

• V 1 — вес тела (в кг);
• V 2 — степень невнятности речи (ранжируется по шкале от 1 до 5);
• V 3 — длина ноги (в см);
• V 4 — разговорчивость (ранжируется по шкале от 1 до 5);
• V 5 — длина руки (в см);
• V 6 — степень шатания при попытках пройти по прямой линии (ранжируется по шкале от 1 до 5).

Кажется вероятным, что V1 ,V3 и V5 будут варьировать совместно, поскольку крупные люди будут склонны иметь длинные руки и ноги и больше весить. Все эти три пункта измеряют некоторое
фундаментальное свойство индивидуумов вашей выборки: их размеры. Точно так же вероятно, что V2, V4 и V6 будут варьировать совместно, так как количество употребленного алкоголя,
вероятно, будет связано с четкостью речи, разговорчивостью и с осложнениями при попытках пройти по прямой линии. Таким образом, хотя мы собрали шесть фрагментарных данных,
эти переменные измеряют только 2 конструкта: размеры тела и степень опьянения. В факторном анализе вместо слова «конструкт» обычно используется слово «фактор», и далее мы будем следовать этой традиции.

Исследовательский факторный анализ, по существу, выполняет две функции:

  • Он показывает, сколько отдельных психологических конструктов (факторов) измеряется данным набором переменных. В приведенном выше примере такими двумя факторами являются размеры тела и степень опьянения.

  • Он показывает, какие именно конструкты измеряют использованные переменные. В приведенном выше примере было показано, что VI , V 3 и V 5 измеряют один фактор и V2, V4 и V6 измеряют другой, совершенно отличный фактор.

В некоторых формах факторного анализа дополнительно можно прокоррелировать факторы между собой, и затем вычислить для каждого испытуемого индивидуальную оценку по каждому фактору в целом («факторные оценки»).

Оценки по полным тестам (а не по его отдельным заданиям) также могут подвергаться факторному анализу — на самом деле именно так эта методика и используется. Факторный анализ в этом случае может показать, действительно ли тесты, которые, предположительно, измеряют один и тот же конструкт (например, шесть тестов, которые претендуют на измерение тревожности), продуцируют один фактор, или же в этом случае будут выделены несколько факторов (указывая на то, что тесты на самом деле измеряют несколько разных характеристик). Факторный анализ оценок, полученных на основе полных тестов, может быть чрезвычайно полезен для установления того, что именно измеряется группой тестов, поскольку многозначность языка допускает, что одному и тому же конструкту разными исследователями могут быть даны различные наименования. «Тревога» у одного автора может обозначать то же самое, что «нейротизм» — у другого или «негативный аффект» — у третьего. Число терминов, используемых в психологии индивидуальных различий, потенциально безгранично, и без факторного анализа нет надежного способа установить, действительно ли несколько шкал измеряют один и тот же базисный психологический феномен. Например, если в издательском каталоге указано, что имеются психологические средства измерения «нейротизма», «тревоги», «истерии», «силы Эго», «нервозности», «низкой самоактуализации» и «боязливости», кажется разумным задать вопрос: действительно ли это шесть отдельных понятий или это одна и та же характеристика, которой исследователи, имеющие разные теоретические воззрения, дали различные названия? Факторный анализ может точно ответить на этот вопрос, и поэтому он чрезвычайно полезен для упрощения структуры личности и способностей.

Возможности факторного анализа не ограничиваются анализом заданий или оценок теста. Можно факторизовать, например, показатели времени реакции, взятые из когнитивных тестов различного типа, чтобы определить, какие из них (если такие есть) связаны между собой. Возможен и иной подход. Предположим, что группу школьников, которые не имели специальной спортивной подготовки или спортивной практики, оценивали с точки зрения их успешности в соревнованиях по 30 видам спорта с помощью комплекса оценок, включавшего рейтинги тренеров, регистрацию времени, среднюю длину броска, процент отсутствия очков при игре в крикет, забитые голы и любые другие измерения показателей успешности, наиболее подходящие для каждого вида спорта. Единственное условие состоит в том, что каждый ребенок должен участвовать в каждом виде соревнования. Факторный анализ обнаружит много интересных фактов; например, он покажет, будут ли индивидуумы, успешные в одной игре с мячом, демонстрировать тенденцию к успешности во всех остальных играх, будут ли соревнования по бегу на длинные и короткие дистанции образовывать две различные группы (и какой вид соревнования будет входить в какую группу) и т.д. Таким образом, вместо того чтобы обсуждать происходящее в терминах успешности в 30 различных областях, будет возможно суммировать эту информацию, обсуждая ее в категориях шести основных спортивных способностей (или стольких способностей, сколько выявит факторный анализ).

Should you be doing Exploratory or Confirmatory Analysis?[]

While confirmatory factor analysis has been popular in recent years to test the degree of fit between a proposed structural model and the emergent structure of the data, the pendulum has swung back to favor exploratory analysis for a couple of key reasons. Firstly the results of confirmatory factor analysis are typically misinterpreted to support one structural solution over any other. This conclusion is particularly weak when only a few of the many possible structures were assessed. Secondly, replicating a structure through successive unconstrained exploratory procedures is considered much stronger evidence of structure than an unreplicated constrained confirmatory procedure. So unless you are absolutely sure that you should be doing Confirmatory factor analysis – Amos, stick with an exploratory procedure (explained here).
التحليل العاملى هو اسلوب لتقليل حجم البيانات من خلال تحدي مجموعة كبيرة من العبارات أو الاسئلة ثم البحث فى كيفية تقليلها وتلخيصها لمجموعة اصغر من العوامل أو المكونات من خلال البحث عن التكتلات أو المجموعات المرتبطة من المتغيرات ويتم ذلك من خلال مجموعة من الاساليب المختلفة للتحليل العاملى و هناك منهجان للتحليل العامل وهما 1- المنهج الاستطلاعى exploratory factor analysis والمنهج التوكيدى confirmatory factor analysis د ايهاب البراوى

Should you be doing Principal Components Analysis or Factor Analysis?[]

If your primary goal is to take scores from a large set of measured variables and reduce them to scores on a smaller set of composite variables that retain as much information from the original variables as possible – i.e. data reduction, then Principal Components Analysis (PCA) is the appropriate analysis. If however, your purpose is to model the structure of correlations among your variables (or to put it another way, arrive at a parsimonious representation of the associations among measured variables) then you should do Factor Analysis(FA). The distinction is subtle, but important. For this example we will assume that you (like most researchers) have chosen to do a PCA. The other advantage of PCA over FA is that none can say you are manipulating results is since you are analysing total variance (as PCA does) rather than just common variance (as FA does). There is also a technical advantage to PCA that means the mathematics don’t fail when the matrix is very large, and/or there are multicollinearity problems.

Do your data suit the analysis?[]

Assuming you do want to do an Exploratory PCA, there are a number of assumptions about the data that can be checked as part of the analysis, but there are two critical issues you need to consider before you continue. All your variables need to be continuous – things like gender and the like, can not be analyzed using PCA. That is not to say that SPSS doesn’t give you other options (see CAPTCA (categorical principal components analysis) — SPSS Categories), but categorical data is a problem for Exploratory PCA and FA. Dichotomous data (e.g. yes/no answers) may also be a problem, you should consider substituting your correlation matrix with a tetrachoric correlation matrix if most or all of your data is dichotomous. The second major issue is sample size. You need at least 50 cases or 4 cases per variable – whichever is greater. Though even these lower limits may not assure a replicable outcome. Ideally you should have more like 300 or 7 cases per – whichever is greater. If you want to replicate you results, then you would need twice this number and then randomly divide the data into 2 separate data sets.

[]

Once you’ve decided that an Exploratory PCA suits your purpose, and your data suits the analysis, you face only one big question – how many components will you extract? There are many different methods for extraction. SPSS gives you seven extraction options, yet all but one relate to Factor Analysis not PCA. In this example, that leaves us with what SPSS simply calls ‘Principal Components’ as our default option. Unfortunately SPSS also defaults to an eighth strongly criticized Kaiser rule (i.e. the retention of principal components with eigenvalues above 1). SPSS also offers a Scree Plot as a way of determining the number of components to extract, but this technique too has as drawn considerable criticism. In both the case of the Kaiser rule and the scree test, the nub of the criticism is that the results can not typically be replicated.
So what can you do? The answer is Parallel Analysis. It’s similar to the simple scree test, but instead of looking of an ‘elbow’ in the plot of ranked eigenvalues, you compare the unrotated (initial) eigenvalues to eigenvalues from a random sample with the same number of cases and variables as yours. Any eigenvalue greater than that which could be expected from an equivalent random data set are extracted. This technique has been shown to be superior in various simulation studies.
The problem is that SPSS is not pre-programmed to do Parallel Analysis, but fortunately you can use other computer programs for Parallel Analysis. One easy to use program is developed by Marley Watkins: MonteCarloPA.zip. This will download a zipped file that you can open on your computer. Unzip the file and click on the file MonteCarloPA.exe. Provide the following information: the number of variables you are analyzing, the number of subjects in your sample and the number of replications (specify 100). Then, click on calculate. Systematically, compare the first eigenvalue you obtained in SPSS with the corresponding first value generated in MonteCarloPA program. If your value is greater than the value from parallel analysis, you retain the factor; if it is smaller, you reject it.

Another way is to use SPSS syntax which is generously provided by Dr Brian P. O’Connor. You can download the “raw scores” version of the syntax from his website.
Open the downloaded syntax file and enter the name/location of the data file for analyses after «FILE =». If you specify «FILE = *», then the program will read the current, active SPSS data file. You can alternatively enter the name/location of a previously saved SPSS systemfile instead of «*». You can use the «/ VAR =» subcommand after «/ missing=omit» subcommand to select variables for the analyses.
The output of the Parallel Analysis lists all latent “roots” (principal components) in order, and tells you what their initial eigenvalue is (“Raw data”). The output also tells you what the average (“Mean”) and upper 95th percentile of eigenvalue of 100 random data sets with the same number of cases and variables as yours, is for each component. You are looking for “Raw data” eigenvalue greater than their corresponding (same line) 95th percentile value. These are the only emergent components/facotrs above random chance. Once you have done the Parallel Analysis you will know how many components/factors to extract.

Note for those using the Student Version of SPSS

The Student version of SPSS (as opposed to the Graduate Pack) won’t let you work with syntax as suggested in this section. While it is not as accurate as running parallel analysis on your data, Dr Albert Cota has provided tables for people to lookup appropriate ‘cut-offs’ for parallel analysis.

Conducting the analysis[]

Menu select ANALYSE>DATA REDUCTION>FACTOR

  • On the “Factor Analysis” window select the variables to be analysed and move them to the “Variables” box.
  • Select the “Descriptives” button. On the “Factor Analysis: Descriptives” window select at least “initial solution” and “KMO and Bartlett’s test of sphericity”. Click “Continue”.
  • Select the “Extraction” button. On the “Factor Analysis: Extraction” window the “Method” will default to “Principal components”. This is correct to conduct PCA, but if you’re doing FA you will need to change this to “Principal Axis Factoring”. The current window also defaults to providing the “Unrotated factor solution”. There is usually little need to ask for this as most people don’t interpret it. Of course the one exception to this is when you are dealing with a one-component/factor solution. The other important thing on this window is the “Extract” options. Select “Number of factors” and make this the same number as the Parallel Analysis suggested earlier. Click “Continue”.
  • Select the “Rotation” button. On the Factor Analysis: Rotation” window select “Promax” as the “Method”. Both “Promax” and “Direct Oblimin” are types of oblique rotations. The rest are froms of orthogonal rotation, with “Varimax” being the most common of these. Unless you have a clear theoretical reason for choosing an orthogonal rotation (i.e. forcing the component/factors to be uncorrelated), then stick to an oblique rotation. The reason “Promax” is suggested here is that intercorrelation between emergent components/factors is far less susceptible to manipulation of kappa (with Promax), than delta (with Oblimin). The rest of the defaults are generally fine. Click “Continue”.
  • Select the “Scores” button if you want to save component/factor scores (otherwise skip this point). On the Factor Analysis: Factor Scores” window select “Save as variables”, and change the “Method” to “Anderson-Rubin” which is the most mathematically accurate way to calculate the score within SPSS. Click “Continue”.
  • Select the “Options” button. On the Factor Analysis: Options” window it will help your interpretation if you select both “Sorted by size” and “Suppress absolute values less than”, and change this latter value to “.3”. Click “Continue”.
  • On the “Factor Analysis” window, click “OK” (unless you want to save the syntax, in which case click “Paste”).

Interpretation[]

  • If you have run a PCA, then ignore the fact the SPSS prints “Factor Analysis” at the top of the results.
  • The KMO statistic assesses one of the assumptions of Principle Components and Factor Analysis – namely whether there appears to be some underlying (latent) structure in the data (technically referred to as the Factorability of R). This is also referred to as Sampling Adequacy, or even lack of Sphericity. The KMO should be .6 or greater, otherwise any results you get may be unreliable (mere mathematical illusions). You will also note Bartlett’s Test of Sphericity which looks at the same issue in a different way. Despite the fact that it is often significant (p<.05, which is what you want), you should ignore it unless your sample is less than 5 cases per variable because it is notoriously overly sensitive, and likely to be significant with any substantial data set.
  • SPSS tells you how much of the variance is explained by each principle component, and even cumulates these percentages for you (“Total Variance Explained” table).
  • The “Pattern Matrix” is the most interpretable of the matrices in the output. Remember that PCA and FA are not inferential statistics, they are sophisticated descriptive statistics — there is no significance test. The adequacy of the solution is solely a function of the degree to which the “Pattern Matrix” makes sense (is interpretable). As a rule of thumb, the three highest loading items on each component/factor offer the best clue as to what the factorcomponent represents.
  • Take note of any items that load on more than one factor/component (known as complex or split loading).
  • Don’t forget to look at the “Component Correlation Matrix” near the bottom of the output. It will tell you how intercorrelated the emergent components/factors were.

Further Reading[]

  • Factor Analysis
  • SPSS and SAS programs for determining the number of components using parallel analysis and Velicer’s MAP test
  • Evaluating the Use of Exploratory Factor Analysis in Psychological Research

Факторный анализ

HR-Portal: Сообщество HR-Менеджеров

  • Главная
  • Лента событий
  • Форум
  • Блоги
  • Работа

Новости | Статьи | Образцы документов | Методики | Файлы | Словарь терминов

Реклама

HR-Инструменты Учебник по SPSS

Глава 19. Факторный анализ

    • Факторный анализ
    • 19.1 Порядок выполнения факторного анализа
    • 19.2 Пример из области социологии
    • 19.3 Пример из области психологии
    • 19.4 Задача вращения


В мире


© 2004-2021, HR-Portal: Сообщество HR-Менеджеров | Главная | Контакты | Рекламодателям |


Понравилась статья? Поделить с друзьями:
  • Строим из пеноблока своими руками пошаговая инструкция
  • Реформа управления государственной деревней 1837 1841 гг проводилась под руководством
  • Sunflower lecithin now инструкция по применению
  • Фарингоспрей инструкция по применению для детей
  • Лосьон ретасол инструкция по применению цена