Руководства к прогрессивным матрицам

УСТРОЙСТВО МАТРИЦ И ИХ
ИСПОЛЬЗОВАНИЕ……………………………………………………………………..3

ИНТЕЛЛЕКТУАЛЬНОЕ
РАЗВИТИЕ……………………………………………………………………………………………….5

ИНТЕЛЛЕКТУАЛЬНАЯ СПОСОБНОСТЬ И
ЭФФЕКТИВНОСТЬ………………………………………………..5

КОНСТРУКТНАЯ ВАЛИДНОСТЬ
И ИЗМЕРИТЕЛЬНАЯ
МОДЕЛЬ……………………………………………
6

ШИРОТА ПРАКТИЧЕСКОГО
ПРИМЕНЕНИЯ………………………………………………………………………………
7

СТАНДАРТИЗАЦИИ………………………………………………………………………………………………………………………..8

ИССЛЕДОВАНИЯ
НАДЕЖНОСТИ……………………………………………………………………………………………….11

(а)
внутренняя
согласованность……………………………………………………………………………………………….11

(б)
ретестовая
надежность…………………………………………………………………………………………………………13

ИССЛЕДОВАНИЯ
ВАЛИДНОСТИ………………………………………………………………………………………………..15

(А) ВАЛИДНОСТЬ
ПО
КРИТЕРИЮ………………………………………………………………………………………………………..
15

(В). ВАЛИДНОСТЬ
ФАКТОРНОГО
КОНСТРУКТА…………………………………………………………………………………….
19

НЕЙРОПСИХОЛОГИЧЕСКОЕ ПРИМЕНЕНИЕ И
ГИПОТЕЗА ВЕРБАЛИЗАЦИИ…………………….21

ВЛИЯНИЕ
ТРЕНИРОВКИ……………………………………………………………………………………………………………..25

ДРУГИЕ ВЛИЯНИЯ
СРЕДЫ………………………………………………………………………………………………………….27

СФЕРЫ
ПРИМЕНЕНИЯ…………………………………………………………………………………………………………………27

КОМПЬЮТЕРНЫЕ ВЕРСИИ
ТЕСТА……………………………………………………………………………………………28

ИНСТРУКЦИИ ДЛЯ ПИСЬМЕННОЙ (КАРАНДАШ—БУМАГА)

ФОРМЫ ПРОВЕДЕНИЯ
СПМ……………………………………………………………………………………………………….28

ИНДИВИДУАЛЬНОЕ
ТЕСТИРОВАНИЕ…………………………………………………………………………………………………..29

самостоятельное
и групповое
тестирование…………………………………………………………………………….29

Материалы……………………………………………………………………………………………………………………………….29

Условия
проведения
…………………………………………………………………………………………………………………..30

Процедура…………………………………………………………………………………………………………………………………30

Контроль за
выполнением…………………………………………………………………………………………………………3!

ЧТО НЕОБХОДИМО
ОТМЕЧАТЬ…………………………………………………………………………………………………31

ОЦЕНКА
РЕЗУЛЬТАТОВ……………………………………………………………………………………………………………….32

ПРЕДСТАВЛЕНИЕ
РЕЗУЛЬТАТОВ………………………………………………………………………………………………33

ОБЩИГ ПОКАЗАТЕЛИ ИНДИВИДУАЛЬНОЙ
ОЦЕНКИ………………………………………………………………………………33

необходимая
информация о
контексте……………………………………………………………………………………..35

представление
данных нейропсихологии некой
диагностики………………………………………………….36

представление
результатов для
целей
диагностики и
компенсации
ошибок мышлкния………..38

представление
результатов для
оценки
образовательных программ

И ДЛЯ ИССЛЕДОВАТЕЛЬСКИХ
ЦЕЛЕЙ………………………………………………………………………………………………….39

РОЛЬ
ПСИХОЛОГА……………………………………………………………………………………………………………………….39

ПРИЛОЖЕНИЕ……………………………………………………………………………………………………………………………….40

БИБЛИОГРАФИЯ…

…………………………….50

ПРЕДИСЛОВИЕ К ИЗДАНИЮ 1995 ГОДА

Чтобы помочь читателю
сориентироваться в изложенном ниже
материале, мы предлагаем здесь краткое
изложение содержания Общего Раздела
настоящего Руководства.

Сначала дается обзор
теоретических основ тестов Равена
«Прогрессивные Матрицы» и «Словарные
Шкалы». Эти тесты были разработаны
для исследовательской работы в области
генетических и средовых причин психических
нарушений. Они были предназначены для
измерения двух компонентов выделенного
Спирманом (Spearman)
фактора g,
а именно, продуктивную
и репродуктивную
способности. Продуктивная
способность включает способность к
осмысленному разрешению противоречий;
способность изобретать невербальные
по своей природе конструкты, помогающие
найти решение в сложных ситуациях.
Репродуктивная способность включает
знакомство с сохраняемыми в культуре
эксплицитными, вербализованными
знаниями.

Последующие разделы описывают
взаимосвязи между продуктивной и
репродуктивной способностями, фактором
g,
общим интеллектом и общей способностью.
Это делается по двум причинам. Во-первых,
потому что Прогрессивные Матрицы Равена
широко использовались для некорректного
практического применения и интерпретации
как инструмент для измерения «способности»,
тогда как на самом деле люди со сходными
оценками продуктивной или репродуктивной
способности могут существенно отличаться
между собой по другим своим способностям.
Во-вторых, потому, что тестовые измерения
— и продуктивная способность в частности
— часто совершенно неправильно используются
в исследовательской работе. Излишняя
обобщенность тестовых оценок приводила
ко множеству несправедливостей в
практике образовательного, социального
и профессионального отбора. Основной
причиной необоснованных выводов,
сделанных по результатам проведенных
исследований, является недопонимание
того факта, что продуктивная способность
включает целый набор разных перцептивных
и познавательных психических процессов,
надстраивающихся один над другим и
включающих как аффективные, так и волевые
компоненты. Строго говоря, продуктивная
способность не является полноценным
эквивалентом ни для «общей когнитивной
способности», ни для «способности
к решению задач».

Далее изложение касается вопросов
оценки тех аспектов окружающей среды,
которые влияют на продуктивную и
репродуктивную способности. Выясняется,
что гораздо больше известно о переменных,
влияющих на продуктивную способность,
и мало что — о подобного рода влияниях
на репродуктивную способность. Было
обнаружено удивительно большое увеличение
оценок продуктивной (но не репродуктивной)
способности у испытуемых одного и того
же возраста на протяжении последних 50
лет. Ранее даже не подозревали, что на
продуктивную способность оказывают
влияние такие факторы как, с одной
стороны, качество питания и гигиены и,
с другой — более демократическое
содержание детей дома и в школе. В
процессе рассмотрения этих данных
становится ясно, что то, что ранее
понималось как снижение продуктивной
способности с возрастом испытуемого,
правильнее представить как ее увеличение
вместе со смещением даты рождения.

Эти результаты имеют огромное
теоретическое и практическое значение.
Они показывают, что получаемые оценки
испытывают определенные влияния, что
этнические и другие различия в средних
оценках могут, в принципе, и изменяться
(но не за счет каких-то новомодных или
рядовых процессов), и что при практическом
использовании теста нужно сопоставлять
получаемые результаты с самыми
современными нормами, подходящими для
данного исследования по цели,
социально-экономическому и этническому
составу обследуемой группы. Они также
лишают достоверности выводы многих
исследований и смещают аргументы с
технических вопросов
конструирования теста на аргументы,
относящиеся к сфере социальной и
образовательной политики.

Поскольку приведенные ранее
данные показывают необходимость
рассматривать оценки ПМР и СШМХ в
контексте (i)
более широкой информации о способностях
тестируемых людей и (ii)
обсуждения возможных достоинств и
недостатков альтернативной образовательной,
социальной и профессиональной политики,
излагаемый далее материал более подробно
освещает вопросы тестирования и места
психолога в обществе. Высказываются
аргументы в пользу того, чтобы, с одной
стороны, психологические тесты были
более доступны для родителей, учителей
и менеджеров, предоставляя им инструментарий
для более углубленного понимания
талантов их детей, учеников и подчиненных,
и, с другой стороны, чтобы психологи
настаивали на больших инвестициях в
научно-исследовательские разработки,
необходимые для повышения эффективности
диагностики, и чтобы они значительно
лучше готовились к борьбе с политикой
применения их работ в образовательной
и социальной сферах.

Далее рассматриваются вопросы
идентификации дополнительной информации,
нужной для представления полученных
диагностических результатов и развивающих
программ, и дается обзор применения
тестов в обучении, в клинике и в
профессиональной сфере. Показано, что
для получения объективной оценки нужно
рассматривать результаты по ПМР и СШМХ
в более широком информационном контексте,
доступ к которому бывает достаточно
труден и который, вероятно, включает в
себя как новые представления о человеческих
способностях, так и новую психометрическую
модель. Доказывается упрощенность
традиционных моделей валидизации и
применения теста. Реальная сложность
окружающего мира требует от психологов,
работающих в этих областях, дальнейших
напряженных усилий для уяснения своей
новой роли. Обсуждается природа и
содержание данных, необходимых для
проведения более глубокой и полезной
практической диагностической работы
в образовании, в клинике и в сфере
профессиональной деятельности.

После этого общего теоретического
введения изложение смещается на
обсуждение более частных вопросов,
касающихся различных форм ПМР и СШМХ,
методов их конструирования, важности
«проблемного поля» при выборе
«правильного» ответа, роли циклической
последовательности предъявления,
использованной формы анализа отдельных
заданий теста и способов ее применения
для создания «одномерной» тестовой
шкалы. Содержится призыв, чтобы
пользователи проявляли осторожность
при выборе той формы теста, которая
наиболее подходит для решения стоящих
перед ними задач.

Во избежании ненужных
затруднений при пользовании ранее
опубликованными оглавлениями и для
разгрузки основного раздела текста,
обзор недавно опубликованных работ,
поддерживающих теоретический подход
и практическое применения ПМР, включен
в Приложение к изданию 1995 года.

Теоретические основы тестов Равена
«Прогрессивные Матрицы» и «Словарные
Шкалы»

Спирман (Spearman
1923, 1927) был первый кто отметил, что
результаты тестирования таких учебных
способностей как, например, способности
к арифметике, чтению и правописанию,
обнаруживают тенденцию к взаимной
корреляции на уровне от 0.7 до 0.8. Это
подтверждают и современные данные,
приведенные в Таблице ИПЗ ВАЛ1 в
Исследовательском
Приложении № 3.
Спирман
сделал вывод, что такие корреляции можно
объяснить наличием в основе умственных
способностей некоего единого, или общего
«фактора д» и предположил, что
различные тесты в разной степени
апеллируют к этой базовой способности.

Тесты Равена Прогрессивные
Матрицы
и Словарные
Шкалы
были разработаны
как инструменты для максимально простой
и непротиворечивой оценки двух
составляющих фактора д, обозначенных
Спирманом как продуктивная
способность
и
репродуктивная
способность.

Продуктивная умственная
деятельность включает в себя разрешение
сомнений, формирование нового видения
проблемы, выход за пределы имеющихся
данных с целью увидеть скрытое или
неочевидное, формирование (чаще в
невербальной форме) понятийных
конструктов, облегчающих осмысление
сложных проблем со многими взаимозависимыми
переменными. Именно эти способности
необходимы детям при усвоении ими в
форме «чувства языка» множества
неписаных языковых правил, или менеджерам
международного класса в процессе
принятия ими того или иного решения.

Репродуктивная умственная
деятельность включает заучивание,
воспоминание и воспроизведение
преимущественно вербального материала,
представляющего собой культурный запас
эксплицитного, зафиксированного в
языковой форме, знания.

Тесты Равена Прогрессивные
Матрицы
и Словарные
Шкалы
были разработаны
с перспективой на изучение вклада
генетических и средовых факторов в
природу этих двух способностей, а также
их личностных и социальных последствий.

Написав в 1927 году, что:

«Понимание
особой природы процессов выведения и
воспроизведения знания — в их резком
контрасте, в их повсеместном взаимодействии,
в их генетической взаимосвязи -означало
бы, что психология индивидуальных
способностей начинает обретать азы
мудрости», Спирман пришел к выводу,
что природа, происхождение и проявление
этих двух способностей имеют очень
существенные различия. Ни одна из них
не является «кристаллизованной»
формой другой, но они действительно
тесно взаимодействуют, поскольку и
восприятие и мышление в общем зависят
от сформированных конструктов, да и
способность оперировать информацией
часто зависит от способности найти
смысл в противоречивой части рассуждения.

Разрабатывая тесты, которые
были бы полезным инструментом для
идентификации генетических и средовых
причин интеллектуальных отклонений,
Дж.К.Равен (J.С.Raven,
1936) сознательно ставил перед собой
задачу создания таких тестов, которые
были бы теоретически обоснованы,
однозначно интерпретируемы, просты для
проведения и обработки, пригодны как
для лабораторных, так и для полевых
экспериментов, а также удобны для
массовых обследований, проводимых на
дому, в школах, на производстве и
сопряженных с временными ограничениями
.

УТОЧНЕНИЕ ОСНОВНЫХ ПОНЯТИЙ

Бесконечная путаница
возникает из-за близости и взаимной
подмены таких терминов как «Фактор
д», «Продуктивная Способность»,
«Репродуктивная Способность»,
«Общие Способности», «Общий
Интеллект», «Интеллект» и
«Способность Решать Задачи».
Ошибочное понимание взаимосвязей между
этими основными понятиями ведет к
неадекватному применению и ошибочной
интерпретации тестов. На последующих
страницах мы намереваемся прояснить
эти взаимосвязи, а также обсудить степень
обоснованности тех заключений, которые
могут быть сделаны по результатам
анализа тестовых данных.

Общие способности

Для начала следует указать,
что подмеченная Спирманом высокая
корреляция между теми способностями,
которые первоначально рассматривались
как различные, обычно значительно
снижается при выходе за пределы
традиционной «учебной» области
или даже при перемещении в другую
академическую сферу. Хотя мы не имеем
возможности сослаться здесь на конкретные
цифры (поскольку нет хороших измерительных
процедур для таких качеств, как инициатива,
лидерство, способность к эффективной
коммуникации, способность успокаивать
и ободрять других — для их оценки
потребовалась бы новая психометрическая
модель), но анализ индивидуальных
случаев, наблюдений и некоторых
исследований, проведенных на дому, в
школах или на производстве, предполагает,
что такая корреляция будет порядка 0.2.
(Многие индивидуальные случаи рассмотрены
в обзоре Равена 1984 года (Raven,
1984, также см. Taylor,
1976; Guilford, 1977; Hatch and Gardner, 1990; Raven, 1977; Raven,
Johnstone and Varley, 1985). Такая
слабая корреляция означает, что 96%
разброса переменных не перекрывается,
и что люди, получившие низкий результат
в одних областях, имеют хороший шанс
получить высокие оценки в других. Более
того, хотя тесты Общего Интеллекта и
Фактора g
имеют прогностическую валидность около
0.7 в рамках так называемой «учебной»
сферы, их прогностическая валидность
в области профессиональных достижений
не превышает, в целом, 0.3 (Cook,
1988; Hunter
and
Hunter,
1984), объясняя, таким образом, только
около 10% дисперсии1.
Эти данные наводят на мысль, что в то
время как «Фактор g»
действительно является очень полезным
конструктом для оценки одной важной,
хотя и ограниченной области человеческих
способностей, популярное понятие «Общие
Способности» — в сочетании с понятием
«Умственного Возраста», являющимся
центральным для коэффициента
интеллектуальности (IQ),
а также разнообразные образовательные
технологии и технологии отбора кадров,
которые ассоциируются со «Способностями»,
«Умственным возрастом» и IQ
— не имеют достаточной объяснительной
силы и не стоят того внимания, которое
уделяют им многие психологи, менеджеры,
педагоги и теоретики от образования.

Продуктивная и репродуктивная
способности

Продуктивная способность

Продуцирование знания — это процесс
выведения, или извлечения новых инсайтов
и новой информации из того, что уже было
воспринято или известно.

Для выделения любой проблемы
необходимо увидеть ее в определенном
контексте. Человек всегда изначально
настраивается на поиск определенного
«гештальта», на целостное восприятие
предъявленной информации. Таким образом,
он изначально обладает
схемой, которая
«предоставляет ему возможность
одновременно держать в голове несколько
вещей». Именно по этой причине не
совсем верно было бы утверждение, что
ПМР измеряют только способность держать
в уме несколько вещей одновременно.

Значимость мгновенного целостного
понимания как основы для дальнейшей
деятельности показана не только в
отношении визуального материала. Спирман
отметил, к примеру, что

1 Хотя
анализ генерализации валидности, который
корректирует данные с учетом ненадежности
критерия, позволяет пересмотреть эту
цифру и повысить ее до 0.5, необходимость
применения этого значения корреляции
не достаточно обоснована, и даже
корреляция 0.5 объясняет только 25%
дисперсии. непосредственное
воспроизведение прочитанного отрывка
является скорее сжатым осознанием его
сути, нежели воспоминанием любой из его
частей. Если содержание прочитанного
вызывает особый интерес, то может
возникнуть чувство его генерализации
и выхода за пределы
актуального контекста.

В своих исследованиях
природы ошибок, где Матрицы
Равена применялись
в сочетании с «кубиками Кооса» и
«Стик Тестом» (Stick
test)
Гольдштейна и Ширера, Мэстре (Maistriaux,
1959) пришел к похожим выводам: большинство
исходных ошибок — если они не корректировались
при помощи обратной связи — вызвано
неспособностью сосредоточится на
решаемой проблеме и доминированием
сиюминутных впечатлений. Позднее
появляются ошибки, связанные с
неспособностью анализировать и, еще
позже, синтезировать, полученную в
результате анализа информацию. И только
затем возникают ошибки, обусловленные
нежеланием сделать усилия, необходимые
для предварительного, ещё до начала
каких-либо реальных действий, анализа
и мысленного переструктурирования
материала. Многие люди не готовы к этому,
предпочитая манипулировать фрагментами
задания только на основе впечатления
о целом или сумме частей. При дальнейшем
изложении мы будем постоянно возвращаться
с вопросу о важности как ценностных,
так и волевых (усилие, упорство) компонентов
при осуществлении • мыслительной
реконструкции наглядной ситуации.

Придя к решению, что
представляет собой объект, на который
он смотрит, человек переходит к анализу
ситуации. Этот анализ может привести
его к выделению проблемы, в нашем случае
— это пространство внутри Матрицы,
которое должно быть
заполнено. Если люди не склонны действовать
аналитически, они предпочитают заполнять
пустое пространство путем репродукции
целого, а не выбирать фрагмент для
дополнения матрицы. Другими словами,
их задача ограничивается конструированием
целого, его опознанием. Из этого следует,
таким образом, что опознание »
проблемного целого» является
существенной предпосылкой аналитической
деятельности.

/•
Чтобы анализировать, субъект должен
быть способен воспринять больше, чем
полный

Гештальт. Он должен иметь гипотезы
(возможно невербальные) относительно
того, на какие части целого важно обращать
внимание. Анализ не предполагает
случайного поиска путем проб и ошибок.
Он означает изучение потенциальных
взаимосвязей, существование которых
предполагается на основе определенного
понимания целого. Необходимо иметь
также символические представления о
линиях, кругах, квадратах и треугольниках.
Как мы убедимся далее, это не значит,
что обязательно нужно знать слова для
их описания. Способность воспринимать
эти фигуры базируется на приобретенном
опыте и культурном научении. Большинство
же членов обществ с высоким уровнем
грамотности имеют богатый опыт обращения
с линиями, овалами и подобными фигурами,
приобретенный при разглядывании печатных
материалов. Поэтому различия в результатах
их деятельности должны быть отнесены
за счет других факторов.

Матрицы измеряют
способность выявлять
взаимосвязи. Это
потому, что сами «переменные»,
взаимосвязи между которыми выделяются,
не очевидны. Необходимым условием
опознания переменных является выделение
взаимосвязи. В «гудении», «жужжании»
и путанице исходных сенсорных данных
нужно увидеть или извлечь множество
переменных и взаимосвязей между ними.
Это то, что Спирман имел в виду когда
сказал, что восприятие переменной
мгновенно влечет за собой знание
взаимосвязи и наоборот.

Эти наблюдения объясняют
внутреннюю связь восприятия с символическим
мышлением. Они также объясняют, почему
в отдельных задачах на Матрицы
единственный
неправильный ответ, выбранный значительным
числом людей, является при ближайшем
рассмотрении правильной фигурой
неправильного размера. Эта ошибки не
могут быть прощены в силу «простой
невнимательности», поскольку в этом
случае Характеристические Кривые (см.
далее) для этих заданий пересекли бы
прочие. Напротив, пункты, в которых
допущены ошибки такого рода, правомерно
занимают свое место на шкале. Это
указывает на важность точного
восприятия целого и внимания
к деталям, а также опровергает тех, кто
уверяет, что исходный «Гештальт»
матриц дает испытуемому ложную установку.
Без Гештальта, без восприятия целого,
испытуемый не смог бы ничего увидеть,
а уж тем более
проанализировать. Далее, символические
ассоциации, служащие фундаментом
восприятия, более важны, чем сырые
сенсорные данные. Нас же больше интересует
не умение видеть сходства и различия,
а способность к выявлению конструктов,
которые обеспечивают возможность
такого видения.

Заявления, что Матрицы
измеряют способность
удерживать в голове одновременно
несколько переменных, дают неверную
ориентировку. Это можно проиллюстрировать
работами Якобса и Вандевентера (Jacobs
and
Vandeventer,
1968; 1972), которые опубликовали один из
лучших на сегодняшний день анализ
процессов концептуализации, используемых
для решения задач. Среди прочих их
выводов высказывается предположение,
что решение более трудных заданий
требует большего числа одновременных
умственных действий. К сожалению, набор
тестовых заданий, построенных на этих
принципах, не поддается шкальному
упорядочиванию (в терминах Item
Response
Theory
(IRT)
— Теории Выбора Ответов). Хорнке (Hornke,
1984) также установил, что трудность
отдельных заданий нельзя предсказать
исходя из правил их построения, С другой
стороны, как показано в Приложении,
помещенном в конце
данного раздела Руководства,
Фодегель-Матцен
(Vodegel-Matzen)
удалось, используя концептуальную схему
Карпернтера и др. (Carpenter,
Just
and
Shell,
1990), сконструировать набор заданий,
трудность которых можно было предсказать
на основе этих правил. Она также
обнаружила, что те испытуемые, которые
получили более высокие оценки, тратили
больше времени на рассматривание матриц
перед принятием решения. Это наводит
на предположение, что лучшие из выполнявших
тест способны удерживать в краткосрочной
памяти больше информации. Впрочем,
возможно они просто затрачивают больше
усилий при решении заданий теста.

Более точная формулировка
гласит, что Матрицы
измеряют способность
формировать конструкты высокого уровня,
которые облегчают осмысление сложных
ситуаций или событий.
Суть
этого утверждения можно проиллюстрировать
исследованиями Пиаже по сохранению
объема: это не «способность удерживать
в голове одновременно параметры длины,
высоты и ширины», по которым можно
вычислить объем, а собственно понятие
объема. Это самостоятельное целостное
понятие позволяет объединить три
размерности, а также позволяет, при
необходимости, провести разложение по
данным трем размерностям.

Продуктивная деятельность
требует, чтобы перцептивные процессы
носили скорее активный, нежели
аналитический или репродуктивный
характер. Это включает проблематизацию
— обнаружение неясностей в знакомом — а
также решение задачи и получение
удовлетворения от того, что определенное
решение согласуется со всеми
данными, доступными
на текущий момент.

Такие процессы часто носят
невербальный характер, завися от вспышек
внезапного озарения, слишком быстрых
для фиксации в языковых единицах. Хорошей
иллюстрацией этому может служить работа
Бродбента и Эстона (Broadbent
and
Aston,
1978), которые обнаружили, что способность
управлять компьютерной имитационной
моделью британской экономики не связана
со способностью отвечать на вопросы о
ней, сформулированные в языковой форме.
Они показали, что хотя вербальная логика
не способна предоставить средства
обращения с системами, в которой так
много сложных, взаимодействующих и
охваченных обратными связями контуров,
некоторые люди все-таки
научаются управлять
ими. Коле (Coles,
1986) также показал, что люди обычно не
способны вербализовать логику сложных
моральных правил, которыми они
руководствуются в своем поведении.

Репродуктивная способность

Как мы уже видели, Прогрессивные
Матрицы
были
сконструированы прежде всего для
измерения продуктивной
способности,
а сам
способ измерения хотя и зависит
существенно от овладения символами и
конструктами, позволяет получать такие
результаты, которые максимально
малочувствительны к межличностным
и групповым различиям в степени
знакомства с культурно-специфическими
символами.

Напротив, Словарная
Шкала Милл Хилл
была
разработана для выявления различий
людей в знании и способности воспроизведения
культурного запаса вербальных понятий.
Успешность решения многих задач, особенно
тех, которые включены в учебные экзамены,
зависит от знания этого набора идей и
легкости обращения с ними. Следует,
однако, проявлять осторожность и
различать между способностью понимать
идею и способностью к ее передаче.
Продуктивная способность позволяет
нам сформировать понимание. Для перевода
этого понимания в слова необходима
легкость вербализации.

Дальнейшее развитие идеи о существовании
продуктивной и репродуктивной способностей

Хотя приведенные до сих пор
данные подтверждают истинность выводов
Спирмана, основная полемика развернулась
вокруг факторно-аналитической модели,
которая наилучшим образом подходит для
описанного паттерна корреляций между
тестами, и относительно того, существует
ли общий фактор, определяющий умственные
способности, как альтернатива идее
накопления шаблонов, адекватных решению
задач определенных типов. В частности,
Перкинс и Саломан (Perkins
and
Saloman,
1989) опубликовали обширный обзор из
которого следует, что действительно
существует такой общий фактор для
способности к рассуждению. Кроме того,
было проведено множество исследований
где предпринимались попытки связать
«фактор д» с «ментальной скоростью»
или «энергией» (см. обзор Kranzler
and
Jensen,
1989). Приложение,
сум­мирующее
исследования последних лет в этой
области, включено в Руководство издания
1995 года.

Значительно меньше попыток
было предпринято для проверки утверждения
Спирмана и доказательства различной
природы продуктивной и репродуктивной
способностей. Одно из не­многих
исследований в этой области уже было
упомянуто (Broadbent
and
Aston,
1978). В этой работе Бродбент и Эстон
утверждали, что вербальная логика
способна одновременно опериро­вать
только с двумя наборами понятий и не
может решать сложные проблемы, включающие
множество взаимодействующих переменных
и реципрокных связей. Они стремились
показать, что способность отвечать на
вербальные вопросы касающиеся сложных
систем не связана со способностью
управлять такими системами. Хотя
вербальное инструктирование могло
обеспе­чить определенный эффект, оно
вовсе не обязательно развивало способность
управлять таки­ми системами. Эти
результаты идут в одном русле с заключениям
о роли языка при решении за­дач ПМР и
относительно влияния языковых инструкций.

Ограничения, связанные
с применением
Матриц

Продуктивная деятельность
сопряжена с преодолением трудностей и
требует определенных усилий. Но люди,
в целом, не склонны развивать,
совершенствовать и демон­стрировать
свои способности за исключением тех
случаев, когда деятельность, в которую
они вовлечены, является для них значимой.
Следовательно, чтобы достаточно надежно
оценить вы­сшие проявления продуктивной
способности, необходимо разработать
такие измерительные процедуры, с помощью
которых ее можно будет идентифицировать
непосредственно в процес­се выполнения
людьми значимых для них задач, В этом
пункте можно согласиться со Стерн-бергом
(Sternberg,
1985, 1986), подчеркивающим существование
разных «типов» интеллекта. К
сожаление, работа Стернберга:

а) не предлагает концептуальных подходов
к пониманию психологической природы
познавате­льной деятельности. Мы
утверждаем, что она неизменна, несмотря
на разнообразие прояв­лений в процессе
достижения разных целей;

б) признает только академический,
практический и социальный интеллект,
тогда как мы предпо-

лагаем, что существует множество
различных видов деятельности, которые
могут быть зна­чимы для людей и для
успешной реализации которых люди могут
применять свои продуктив­ные и
репродуктивные способности;

в) имеет дело преимущественно с
репродуктивной, нежели продуктивной
способностью. Чтобы

исследовать поведение,
нацеленное на открытие причинных связей
или закономерностей, необходимо найти
пути оценки именно
тех процессов, которые нужны для
порождения
зна­ний
в данных конкретных областях;

г) не было предложено средств распознания
высших уровней невербальной продуктивной

способности, которая вносит существенный
вклад в выполнение квалифицированной
практической деятельности.

Эти комментарии не являются
критикой работы Стернберга, которую мы
рассматриваем как шаг в верном направлении;
они лишь указывают на потенциальные
области для будущих ис­следований.
Без таких исследований, нужных для
преодоления ограниченности сферы
применения Матриц, на
основании тестовых данных будут и дальше
делаться ошибочные за­ключения.

Продуктивная способность
и «Фактор
g«

Мы уже отметили, что
продуктивная способность концептуально
отлична от фактора д. Хотя последний
термин используется более широко,
похоже, он менее полезен. Представ­ляемый
как общий элемент, задействованный во
«всех» тестах, он предстает в обличье
важного свойства, независимо от того,
восхваляют его или критикуют. Использование
этого термина при­вело даже некоторых
людей к утверждению, что поскольку тесты
с высокими нагрузками на этот фактор
обнаруживают сильную взаимную корреляцию,
то они просто измеряют «одно и то же»
и, следовательно, являются взаимозаменяемыми.
Насколько ложно такое утверждение легко
ви­деть на примере: вес и рост коррелируют
между собой не в меньшей степени, чем
учебные спо­собности, но очевидно,
что рост и вес не являются «одним и
тем же». Наконец, приписывание слишком
большой объяснительной силы терминам
«фактор g»
или «общие способности» обус­ловлено
ещё и тем, что слишком большое число
людей интуитивно считает достаточным,
если их приятелей можно расклассифицировать
на «умных/смышленых» или «глупых/тупых».
Соответ­ственно, термин «продуктивная
способность» дает впечатление о более
ограниченной сфере применения.

Продуктивная способность и «Интеллект»

Сам по себе тест
Прогрессивных Матриц
никогда не предназначался
для измерения «фактора g»,
а тем более «Общего Интеллекта».
Тем не менее, как показано в исследованиях,
суммированных в следующих Разделах
настоящего Руководства,
факторно-аналитические
ис­следования вновь и вновь демонстрируют,
что Прогрессивные
Матрицы —
одна из
лучших из доступных одиночных методик
для измерения g.

Последнее утверждение
может, однако, служить источником
серьезных ошибок в интерп­ретации,
отчасти потому, что «фактор д» часто
понимается как синоним общих академических
способностей. Но
«академические» способности
операционально определяются при помощи
тес­тов, которые оценивают скорее
способность воспроизводить фактическую
информацию, нежели тестов, оценивающих
такие вещи как критическое мышление,
способность формировать сужде­ния,
а также стремление и способность искать
и подбирать доказательства. Для оценки
«акаде­мических» способностей
в более узком смысле наивысшую
прогностическую валидность имеет
Словарная Шкала
— тест, оценивающий репродуктивные
способности. То
же вывод может быть сделан и на основании
работ, где проводили корреляцию между
Матрицами и
Словарными Шкалами,
с одной стороны, и полномерными тестами
«Интеллекта» -с другой. Корреляции
с ПМР достигали значений в диапазоне
от 0.6 до 0.8, тогда как со СШМХ -от 0.8 до
0.95. Это позволяет предположить, что
полные тесты «Интеллекта» измеряют
преиму­щественно репродуктивную
способность. Коэффициенты
корреляции между показателями СШМХ и
ПМР внутри возрастных групп достигали
значений 0.5 — 0.6.

Эти результаты имеют
серьезное практическое значение.
Во-первых они показывают, что люди,
способные генерировать и проверять
новые творческие идеи, инсайты, часто
испытывают трудности при переводе своих
открытий в словесную форму. Таким
образом, коллективная ра­бота не
является единственным условием для
достижения «прорывов» в понимании,
поскольку критерии, используемые для
продвижения ученых по академической
лестнице, недостаточно ориентированы
на продвижение именно тех, кто лучше
других способен генерировать новые
идеи. Во-вторых, наша система образования
в целом недостаточно делает для поощрения
и продвижения тех, кто наиболее способен
генерировать новые идеи и осознавать
суть происходящих социальных процессов.
Если Прогрессивные
Матрицы
используются,
как это часто делается, для отбора
учащихся на образовательные программы
для «одаренных», то отобранные в
итоге студенты не обязательно покажут
блестящие результаты, если эти програм­мы
будут придерживаться традиционных
учебных установок. Для воспитания и
развития в уча­щихся таких способностей
потребуется определенного рода
«многопрофильная» программа
раз­вития талантов. Наконец, такие
результаты означают, что поскольку (как
заметил Спирман) даже различные виды
когнитивных способностей не очень
сильно коррелируют между собой, то более
корректное исследование сможет, вероятно,
обнаружить широкий диапазон ранее не
рас­познанных оригинальных талантов.

Общий Интеллект и Фактор
g

Спирман никогда не
подразумевал, что фактор g
включает в себя все способности,
необ­ходимые для интеллектуальной
деятельности, и тем более не предполагал,
что термины g
или «Интеллект» могут быть
использованы вместо термина «способности»,
или наоборот. Общий Ин­теллект с
действительно требует способности
понимать смысл новых ситуаций и
способности вспоминать релевантную
информацию, но он также нуждается в
таких качествах как формирование
суждений и хранение достаточного
количества специальной информации. Для
практических целей понятие Общего
Интеллекта, наполненное весьма
разнородными система­ми знаний,
мотивационными диспозициями и
способностями, не представляется
особенно по­лезным. Разные люди решают
поставленные перед ними задачи различными
способами, поэто­му интегральный
индекс их способностей не дает каких-то
особо ценных знаний, пригодных для v*
практического использования. Мы скорее
должны задаться вопросом; «В какие
виды деятельно­сти люди склонны
спонтанно включаться и какие компоненты
компетентности — включая продуктивную
способность — они демонстрируют в
процессе выполнения этих деятельностей?»

Продуктивная способность и Способность
к Решению Задач

Мы уже убедились, что
продуктивная способность включает в
себя значительно больше, чем просто
способность к решению задач. Эффективная
познавательная деятельность требует
идентификации проблемы, переформулирования
всего проблемного поля {а не только
самой задачи), а также мониторинг пробных
решений с точки зрения соответствия их
всей имеющейся
информации. Вопреки этому, существует
значительное число программ, ставящих
своей целью обучение студентов
«стратегиям» решения Матриц
для улучшения их
«способности к решению задач» (или
даже развития «интеллекта» или
«фактора g»).
ПМР иногда используют также в качестве
зависимой переменной для оценки
эффективности других программ,
направленных на развитие «способности
к решению задач». К сожалению, за
исключение работы Фоерштайна (Feuerstein),
многие из этих работ были начаты при
отсутствии адекватного понимания
природы продуктивной способности, а
особенно ее связей с восприятием и
концептуализацией. Даже ра- бота
Фоерштайна в области исследований
развития продуктивной способности
страдает недо­статочной обоснованностью.

Постановка проблемы и ее решение — это
трудная деятельность, требующая
постоянного контроля. Она включает в
себя такие вещи, как внезапные пробуждения
по ночам с вопросом о беспокоящих тебя
смутных чувствах на задворках сознания
и последующие попытки перевести их в
центр внимания, чтобы определить их
причины и следствия. Она включает
использование этих неясных ощущений
для инициации основанного на интуиции
процесса «экспериментально­го
взаимодействия со средой», или
«переговоров с проблемой» для
получения дополнительной информации
о природе проблемной ситуации. Она
включает в себя использование переживаний,
возникающих при первоначальных попытках
разобраться в проблеме, чтобы видоизменить
само понимания ситуации и применяемых
для решения стратегий. Необходимо
использовать отточенные навыки контроля
внимания, а также те навыки и схемы
мыслительной деятельности, которые
позволяют быстро «проскакивать»
стандартные варианты действий в
кон­кретных обстоятельствах.
Деятельность по решению проблем включает
также обеспечение доступа и использование
уникальной информации, получаемой
непосредственно от других специалистов.
Наконец, она включает в себя и
экстраординарные обязательность,
упорство и настойчивость.

Ясно, что никто не включится
в такие нагрузочные и самомотивированные
виды деятельности, а тем более не будет
их совершенствовать и развивать, если
не будет высоко це­нить задачу, над
решением которой работает. Именно
необходимость затрачивать усилия при
решении задач привела Спирмана и других
исследователей к связи «фактора д»
с «ментальной энергией», а в работе
Мэстрё» этот факт определяет общую
основу как энергетических, так и
цен­ностных компонент и коррелят.
Важно также отметить, что, согласно
нашим наблюдениям, ког­нитивная
деятельность не
является сугубо
когнитивной, но в существенной степени
опирается также на аффективный и волевой
компоненты. Стоит приостановиться и
задуматься над следу­ющим: должны ли
мы при оценке когнитивной способности
первым делом выявить виды деяте­льности,
которые интересуют выполняющего их
человека, и лишь после этого
изучать когнитив­ное
поведение, которое он демонстрирует в
процессе реализации этих деятельностей.
Весьма вероятно, что этом случае
обнаружиться гораздо больше, чем принято
думать, людей, вовлече­нных в процессе
своей повседневной жизни в
познавательно-творческие процессы
высокого уровня.

Приведенные выше комментарии
отнюдь не означают, как в этом стремятся
убедить нас ряд авторов (Greeno,
1989; Braun,
Collins
and
Dugurd,
1989 и другие), что решение задач требует
использования разных когнитивных
процессов для достижения различных
целей. Медь ведь не становится чем-то
иным, когда соединяется с другими
химическими элементами, как бы различ­но
не выглядели или не вели себя вещества,
полученные в результате такого соединения.
Смысл этих комментариев состоит в том,
что если кто-то желает оценить «способность
к реше­нию задач» (включая и
способность к идентификации проблемной
ситуации), то выполнить одно из двух:

а) либо следовать заложенной в ПМР
стратегии и стремиться оценить базовые
способности -например, способность
использовать чувства, развертывать
понятия, направлять и удержи­вать
внимание, контролировать восприятие,
проверять умозаключения, проявлять
настойчи­вость — на материале решения
такой задачи, которая принимается
большинством людей;

б) либо использовать двустадийную
процедуру, первая часть которой посвящена
выявлению того, что именно является
значимым для людей, а вторая — какие из
процессов, нужных для обеспечения
эффективного решения задач, они фактически
используют в процессе реализа­ции
данных видов деятельности.

До настоящего времени никто не попытался
использовать второй подход, и более
того -«просмотрели» даже саму
возможность пойти таким путем. Два
психолога — Пиаже и Мэстрё, бо­льше
других сделавшие в этой области,
исследовали процесс решения по отношению
к состав-

ленному психологом набору
заданий, а не в отношении деятельности,
являющейся значимой для самих обследуемых.
Мэстрё, однако, провел два выдающихся
исследования, напрямую свя­занных с
развернутым выше тезисом. Первое было
посвящено детальному изучению стратегий,
используемых людьми для решения
Прогрессивных Матриц, Кубиков Коса и
заданий Стик-теста (Stick
Test)
Гольдштейна-Ширера. Было установлено,
что основной причиной совершаемых
ис­пытуемыми ошибок было нежелание
тратить умственную энергию на решение
абстрактных задач. Во втором исследовании
оценивалась взаимосвязь между тестовыми
оценками по ПМР и субъективной ценностью
интеллектуальной (в отличие от
практической) деятельности. В результате
использования метода табуляции выявилась
на удивление высокая корреляция меж­ду
оценками по ПМР и субъективной ценностью
процесса осмышления и развития системы
знаний о деятельностях, событиях и
используемых средствах.

Продуктивная способность, Общий
Интеллект, Общая Способность

и Компетентность

Как мы уже видели, понятия «Общая
Способность» или «Интеллект» не
обладают той объ­яснительной силой,
которую им приписывают психологи,
менеджеры или педагоги. ПМР и СШМХ в
совокупности объясняют лишь 10% (сторонники
генерализации валидности сказали бы
25%) всей вариативности профессиональных
достижений. Задача поиска источников
и оценива­ния 90% оставшейся дисперсии,
даже если она определяется факторами
среды, есть тема, с которой психологи
обычно до сих пор не склонны были
связываться.

Автор настоящего руководства
исследовал природу высших форм
компетентности (таких как лидерство,
инициатива, способность эффективно
организовать совместную деятельность
людей и т.п..), развитие таких качеств в
домашних условиях, в школах, на рабочих
местах, воз­можные методы их оценки,
а также их последствия для людей —
носителей этих качеств, для организаций,
в которых они работают, и для общества
в целом (Raven,
1980, 1984, 1985, 1991).

Выяснилось, что все качества
такого рода — как, например, способность
к решению задач — могут быть определены
как мотивационные
диспозиции.
Как таковые
они являются ценност­ными образованиями
и имеют сложную психологическую природу.
Каждое из них требует приме­нения
широкого диапазона компетентностей
высокого уровня — склонности и способности
пред­видеть будущие проблемы и находить
пути их преодоления; эмоциональной
сензитивности и эмоциональной регуляции;
способности получать помощь от других
людей; настойчивости и т.д. Дополняя и
компенсируя друг друга, эти компоненты
компетентности работают на обеспечение
эффективного поведения. Если мы хотим
найти способы их оценки, то первым делом
необходи­мо создать ценностно-ориентированную,
внутренне гетерогенную модель измерения.

Другой вывод, который
необходимо сделать на основании данной
работы, заключается в следующем: как
показало наше обсуждение проблемы
«решения задач» дальнейшие
исследова­ния формирования знаний,
решения задач и продуктивной способности
должны проводится в рамках той же
концепции фундаментальных ценностей.
В дополнение к работам автора (Raven,
1977, 1982), целый ряд исследователей (Sigel,
1986; Miller,
Kohn
and
Schooler,
1978, 1982; Maistriaux,
1959; Jaques,
1976; Tharp
et
al,
1984; Gallimore,
1985; McGillicuddyDeLisi,
1985; и дру­гие) ясно показали, что
когнитивные способности и, особенно,
когнитивное развитие неразрывно связаны
с ценностями. Правильно понятая работа
Стернберга и Гарднера (Sternberg,
Gardner)
подталкивает к тому же выводу. Дальнейшей
задачей является принятие основанной
на ценностях модели измерения и отказ
от требования использовать
ценностно-независимые, «объективные»
методы.

Эта установка имеет и важное практическое
применение в области реформы образова­ния,
отбора управленческих кадров, процессов
руководства, размещения и профессионального
развития персонала, а также организации
деятельности структур социального
управления. Во всех этих областях
повышенное внимание к репродуктивной
способности должно быть смещено

11 не просто
на развитие и использование продуктивной
способности, но также и на все
вышеупо­мянутые виды компетентности.

ПРОДУКТИВНАЯ И РЕПРОДУКТИВНАЯ
СПОСОБНОСТЬ, НАСЛЕДСТВЕННОСТЬ И СРЕДА

Принято считать, что используя
термины «интеллект» и «фактор
g»,
психологи предполага­ют врожденность
и неизменность этих характеристик.
Действительно, такие допущения были
включены в бертовское (Burt,
1957) определение «интеллекта» как
«врожденной общей когнитив­ной
способности». В противоположность
этому, Дж,К.Рааен (J.С.Raven)
ставил целью своего ис­следования
выделение средовых,
а так же генетических
причин умственных отклонений. В сво­их
работах (например, Raven,
1959) Дж.К.Равен настойчиво протестовал
против введения допу­щения о врожденности
в определение интеллекта. В качестве
первостепенной он ставил перед собой
задачу разработки тестов, которые были
бы теоретически обоснованы и легко
интерпре­тируемы, и оценки которых
минимально зависели бы от различий в
образовании и жизненном опыте среди
представителей западного общества.
Второй его задачей было использование
этих тестов, чтобы попытаться выделить
специфический вклад генетических и
средовых источников вариативности
тестовых оценок, особенно у людей,
принадлежащих к сходным социо-экономи-ческим
группам или у детей из одной и той же
семьи. Дальнейшие разделы настоящего
Руково­дства
проиллюстрируют
успешность такого подхода. Но прежде
чем перейти к ним, имеет смысл обсудить
важные, но непростые для понимания
влияния среды на врожденные характе­ристики.

ВЛИЯНИЕ СРЕДЫ НА НАСЛЕДУЕМЫЕ ХАРАКТЕРИСТИКИ

Вероятно наиболее важным
для понимания является тот факт, что
степень выраженности врожденных качеств
всегда может
быть видоизменена под воздействием
определенных факто­ров среды. Если,
например, выращивать в различных условиях
продукты скрещивания разных сортов
пшеницы и измерять их высоту или
урожайность, то ранговый порядок оценок
будет меняться в зависимости от выбора
критерия. Некоторые сорта будут проявлять
себя «лучше» в одних условиях,
другие — в иных. Более того, все сорта
могут быть выше или ниже, более или менее
урожайны в одних определенных условиях,
нежели в иных. Даже корреляции между
раз­мерами и урожайностью значимо
варьируют в зависимости от условий
среды. Очевидно, что среда оказывает
существенное влияние как на индивидуальные
переменные, так и на взаимосвязи между
ними. Однако, многие различия между
видами в одних и тех же условиях, а также
характер изменчивости, проявляющейся
в различных условиях среды, определяются
фактором наследственности. Впрочем,
наследственность не предполагает
отсутствие изменчи­вости. Как это
следует из вышеприведенной краткой
иллюстрации, а также более подробного
обсуждения того же вопроса Ангоффом
(Angoff,
1988), когда дело касается характеристик
чело­века не следует даже задаваться
вопросом, играет ли
среда существенную
роль, а нужно ис­кать ответ на вопрос,
какой из аспектов
среды влияет на
реализацию врожденных характерис­тик.

Важной практический вывод
из настоящего обсуждения состоит в том,
что тестовые пока­затели не
могут
не зависеть от
влияния культуры. Существует потребность
в тестовой методике, которая могла бы
показывать больше, чем тот очевидный
факт, что знания и умения людей зависят
от опыта, приобретаемого ими дома, в
школе, на рабочих местах и в обществен­ных
организациях. Безусловно, способность
оперировать с задачами, поставленными
в Матри­цах, зависит
от степени знакомства с точками, углами
и линиями, а также от привычки проявлять
настойчивость при осмыслении абстрактных
конструкций. Практически каждый
представитель общества с высоким уровнем
грамотности приобретает опыт такого
рода деятельности с такими

12 понятиями.
Однако, хотя Дж.К.Равен был достаточно
проницателен, чтобы анализировать
тес­товые показатели ПМР с учетом
ценностного контекста (см. Psychological
Principles,
1966), ока­залось, что
различия в субъективном отношении людей
к работе с абстракциями сказывается на
тестовых оценках даже больше, чем он
предполагал. Напротив, их зависимость
от других факторов, таких как уровень
образования или домашняя обстановка,
оказалась значительно ни­же, чем
считалось ранее.

ВЛИЯНИЕ СРЕДЫ НА РЕЗУЛЬТАТЫ В ТЕСТАХ
ПМР И СШМХ

Наилучшую иллюстрацию
влияния среды на тестовые показатели
ПМР дает работа Флин-на (Flynn,
1984, 1987), которая показала, что во многих
частях света тестовые оценки (наряду с
другими измерениями вербального и
невербального мышления) повышаются
примерно на одно стандартное отклонение
за поколение. Отсюда следует, что, будучи
оценены в соответствии с современными
нормами, примерно 50% наших дедушек и
бабушек в Америке получили бы реко­мендации
о направлении в специальные учебные
заведения для лиц с трудностями в
обучении. Бувье (Bouvier,
1969), Торндайк (Thorndike,
1977) и Шайе {Shaie,
1983) показали, что многие дру­гие
способности также развиваются, но не в
той же степени. С другой стороны,
репродуктивная
способность, измеряемая
Словарной Шкалой Милл Хилл и другими
словарными тестами (как англоязычными,
так и разработанными для других языковых
культур), остается практически не­изменной,
а словесная беглость постоянно и значимо
падает. Такие различия в тенденциях
под­держивают точку зрения Спирмана,
что продуктивная и репродуктивная
способности имеют раз­ные средовые
и генетические корни.

Неудивительно, что полученные
Флинном данные приводят его к постановке
вопроса о конструктной валидности ПМР
и других интеллектуальных тестов.
Упрощая, его точка зрения звучит следующим
образом: «наши предки не могли быть
настолько глупы».
Хотя его результаты и выводы сильно
поколебали позиции приверженцев широкого
использования тес­тов интеллекта,
наиболее важный их эффект был связан с
опровержением той чрезмерной
объ­яснительной силы, которую многие
психологи и представители общественности
приписывали понятиям Общие Способности,
Интеллект и Фактор g.
Работа Флинна подтверждает достоверность
того, что уже было сказано о (а) значимой,
но не доминирующей, роли, которую играет
продуктивная способность в творчестве,
решении задач, а также в отношении
широкого диапазона различных видов
компетентности; и (6) наследственности
и изменчивости продуктивной способности,
репродуктивной способности и
психологических характеристик в це­лом.

Обнаруженное Флинном
повышение тестовых норм может быть
отнесено только за счет действия средовых
факторов. Но что это за факторы? Как
утверждал Йенсен {Jensen,
1969, 1980), никто пока не представил
убедительных доказательств, что
какой-либо аспект процесса воспитания,
обучения или материальных условий жизни
сочетается с изменениями интеллекту­альных
способностей, достигающими целого
стандартного отклонения. Не достигали
такого значительного успеха и попытки
повысить интеллект при помощи специальных
образователь­ных программ или лучших
систем воспитания. Шпитц (Spitz,
1986) утверждает, что лишь сравни­тельно
небольшое количество таких программ
вообще достигло хоть какого-нибудь
реального улучшения.

Приведенные далее в настоящем
Руководстве данные
показывают, что сходные тестовые нормы
по ПМР имеют страны и сообщества с весьма
различными образовательными системами,
практикой дошкольного воспитания и
доступностью телевидения, Отсюда
следует, что отмеченное Флинном
значительное повышение норм с течением
времени не может быть объяснено за счет
такого рода переменных. Прирост оценок
по ПМР идет параллельно с увели­чением
роста людей и их атлетических возможностей
за тот же период. Изложенные в
Исследо­вательском
Приложении № 4
работы
позволяют предположить, что вероятной
причиной и того, и другого прироста
является улучшение питания, здравоохранения
и гигиены. Данные Бувье

13 (Bouvier,
1969) показывают, что
именно показатели групп с низким
социо-экономическим стату­сом выросли
наиболее значимо.

Что данные Флинна показывают
очень четко, так это возможность
воздействия на такие общеизвестные и
доказанные этнические различия (Shuey,
1966), которые некоторые люди — по­добно
психологам и членам общественных
организаций — полагают неизменными.
Фактически, современные нормы для
практически всех этнических групп
Америки соответствуют британским нормам
за период с 1938 по 1979 год. Эти результаты
наглядно подчеркивают важность
рассмотрения индивидуальных данных по
ПМР или другим «Интеллектуальным
Тестам» в кон­тексте информации о
ценностях, мотивациях и компетентностях
тестируемого субъекта.

Данные Флинна и других исследователей
свидетельствуют, что вариативность
тестовых оценок сохраняется стабильной
или лишь незначительно изменяется со
временем. Сегодня лю­ди отличаются
друг от друга по своим способностям не
в больше, чем 40 — 50 лет назад; увеличились
лишь средние показатели. Это дает
основание предположить, что факторы,
кото­рые ответственны за повышение
средних нормативных оценок, отличны от
тех, которые влияют на вариативность
внутри социо-экономических групп или
внутрисемейную вариативность. Будь это
одни и те же факторы, разброс оценок
закономерно уменьшался бы. Другими
словами, дан­ные Флинна не умаляют
значения наследственности.

Данные Флинна подчеркивают необходимость
использования современных норм.
Исполь­зование устаревших норм влечет
за собой серьезные ошибки в оценке
индивидуальных показа­телей и порождает
существенные просчеты в исследовании.
К примеру, при оценке эффективности
некой развивающей программы обнаруживается,
что экспериментальная группа показала
в ПМР результаты выше опубликованных
норм, на основании чего делается вывод,
что нововведение «работает». На
самом же деле, правильное объяснение
более скромно — экс­периментальная
группа принадлежит к более молодой
возрастной когорте, нежели та, которая
использовалась при создании норм.
Подобным же образом эти данные проясняют,
что резуль­таты типа представленных
на Рисунке 1, которые привлекались для
демонстрации снижения продуктивной
способности после 25-летнего возраста,
фактически показывают рост полученных
на взрослых тестовых оценок в соответствии
с датой рождения. Из подобного рода
результатов следует, что разработчики
и издатели тестов должны поддерживать
нормы на самом современ­ном уровне,
а пользователи тестов — аккуратно
проверять дату сбора нормативных данных,
ко­торые они собираются использовать.
Кроме того, пользователи тестов должны
быть готовы к то­му, что им придется
в будущем платить больше за тестовые
материалы для покрытия расходов на
более частое обновление норм.

Сделанный Флинном обзор подчеркивает
также, что нужно воздерживаться от
слишком частого редактирования или
изменения тестов. Очень немногие тесты
сохранились в том же самом виде, как они
выглядели 50 или более лет назад {если,
конечно, они еще находятся в упо­треблении),
так что очень немногие тесты могут
предоставить убедительное подтверждение
то­го феномена, что с течением времени
тестовые оценки значимо растут, а не
остаются неизмен­ными или, тем более,
не понижаются. Исследователи должны
сопротивляться искушению экспе­риментировать
с ПМР ради сиюминутных преимуществ,
чтобы предоставить возможность
како­му-нибудь последователю Флинна
провести аналогичное сравнение где-нибудь
в 2035 году.

Наконец, стоит отметить, что усталость,
плохое самочувствие и стресс оказывают
значи­тельный неблагоприятный эффект
на скорость аккуратной работы (оценки
теста ПМР с ограни­чением времени),
несколько меньшее влияют на интеллектуальную
продуктивность (оценки тес­та ПМР без
ограничения времени) и, в наименьшей
степени — на выполнение словарных тестон.
В свою очередь, тренировка и практика
оказывают максимальное положительное
влияние на скорость аккуратной работы
и минимальное — на вербальную способность.
Хотя существуют об­стоятельства, в
которых было бы важно оценить эффективность
аккуратной работы людей в условиях
ограничения времени, наиболее общепринятым
требованием к тесту является оценка
самой способности.

14 ПРОДУКТИВНАЯ
СПОСОБНОСТЬ, ВОСПИТАНИЕ И ОБРАЗОВАНИЕ.

Многие исследования
(например, Raven,
1980; Chan,
1981; Miller,
Kohn
and
Scholter,
1985; McGillicudy-DeLisi
et
al,
1987; Sigel
and
Kelly,
1988) показали, что у детей развитие
продуктивной способности протекает
наиболее благоприятно, если родители
вовлекают их в совместную мыс­лительную
деятельность. Другими словами, родители,
добивающиеся наибольшего эффекта,
вместе со своими детьми пытаются найти
смысл в сложных ситуациях, демонстрируют
им способы использование эмоций или
предчувствий для регуляции исследовательской
деятельно­сти, привлекают детей к
разрешению ценностных конфликтов и к
учету долговременных соци­альных
последствий своих действий. Все это
приводит к тому, что родители передают
детям со­бственное понимание механизмов
работы общества и своей роли в нем. Дети,
таким образом, получают представление
о мыслительном процессе, который
концептуален в своей основе и который
связывает мысль и действие. Помимо всего
прочего, такие родители более склонны
также относиться к своим детям с
уважением и понимать, что они должны
заслужить
не толь-/ ко требовать) уважение своих
детей. Это заставляет их включиться в
циклический процесс, в

I
котором они открывают
актуальную компетентность своих детей,
получают дополнительный импульс чтобы
поместить их в ситуации, требующие
компетентности более высокого уровня,
где дети получали бы возможность
упражнять и развивать такого рода
компетентности. Такие роди­тели более
склонны читать своим детям истории,
затрагивающие моральные проблемы, чтобы
дети сопереживали различным персонажам
и, таким образом, формировали собственную
мора-

льную
позицию. На важность такого чтения для
формирования у детей моральных установок
и умения рассуждать по аналогии настаивали
в своих работах Jackson
(1986) и Vitz
(1990).

Равен (Raven,
1980, 1989) и Выготский (Vygotsky,
1956, 1981) обнаружили, что вышеопи­санное
является частью более общего процесса,
посредством которого добросовестные
и чуткие родители создают среду для
мотивов, зарождающихся талантов и
проблем своих детей и таким образом
способствуют развитию уникального для
данного ребенка набора компетентно-стей
высокого уровня. Как показал Пломин
(Plomin,
1987, 1988), в этом как раз и состоит один из
способов усиления средовых различий
для детей внутри одной семьи, которые,
накладываясь на вариативность врожденных
характеристик, оказывают значительное
влияние на их развитие. Как отметили
Скарр и др. (Scarr
et
al,
1981), похожий результат получается, когда
дети сами выбирают себе различные
условия среды. Очевидно, что если мы
хотим идентифицировать те генетические
и средовые переменные, которые влияют
на психическое развитие, то нам нужно
будет разработать более сложную модель
данного процесса.

Постоянно отмечается
существование взаимосвязи между учебными
стратегиями и разви­тием продуктивной
способности (смотри, например, Hess
and
Shipman,
1965; Brandis
and
Bernstein,
1974). Учителя и другие специалисты
признают, что трудно согласовать
ценностно-ориентированную направленность
предметных стратегий с желанием создавать
якобы свободные от ценностных установок
оптимальные условия для «когнитивного
развития». Одна из основных проблем
многих родителей, учителей, менеджеров
и политиков заключается в недо­статке
компетентности, необходимой для
взаимодействия с независимыми, думающими
детьми или подчиненными, которые задают
вопросы, вникают в работу организации
и устройства об­щества и действуют
независимо. Учителя, способствующие
развитию таких качеств, создают тем
самым серьезные проблемы для родителей,
других учителей и менеджеров. Другая
пробле­ма, подробно описанная автором,
а также Миллером с соавторами (Miller,
Kohn
and
Schooler,
1985, 1986), заключается в том, что когнитивное
развитие происходит более эффективно,
если дети реализуют деятельность,
мотивированную их собственным
любопытством. Такие виды де­ятельности
создают непредвиденные проблемы, решение
которых опирается на продуктивную
способность и подпитывает её. При
некоторых обстоятельствах, однако,
такие виды деятельно­сти могут иметь
и опасные последствия. Связи между
«когнитивным развитием» и ценностями
и порождаемые ими дилеммы более подробно
рассмотрены Равеном в его работе 1987
года (Raven,
1987), а общие проблемы, которые ставит
перед образовательной системой ценностно-

15 ориентированная
природа компетентности (включая и
продуктивную способность), освещены им
в работах 1977, 1989, 1990, 1991 годов.

Многие авторы (Stallings
and
Kaskowitz,
1974; Nickerson
et
at,
1985; Miller,
Kohn
and
Schooler
(1985, 1986); Raven,
Johnstone
and
Varley,
1985) исследовали развитие продуктивной
способности в школах, хотя далеко не
все они пользовались для этого ПМР.
Сталлингс с коллегами обнаружил, что
по крайней мере некоторые формы
«открытого» или «прогрессивного»
обучения способствуют развитию
продуктивной способности. Миллер и
Равен с коллегами установили, что и
учебная самостоятельность (т.е. принятие
учениками ответственности за свое
образование и за поступки), и включение
в более сложную учебную деятельность
(например, работа в рамках проекта или
исследования) стимулируют циклическое
развитие познавательной способности.
Больший акцент на самоконтроле и развитии
нового взгляда на вещи благоприятствует
формированию компетентности учащихся,
которая, в свою очередь, повышает их
желание в большей мере контролировать
собственную жизнь и подкрепляет
готовность учи­теля доверять
способностям учеников.

Важно отметить одно
обстоятельство, которое некоторые могут
интерпретировать как не­благоприятный
результат такого рода работы.
Образовательная практика, способствующая
раз­витию продуктивной способности,
снижает тестовые
оценки по традиционным тестам чтения,
письма и арифметических навыков
(Stallings
and
Kaskowitz,
1974; Sigel,
1986). Однако, такие тес­ты, используемые
для измерения «учебной» компетентности,
нацелены скорее на исследование
репродуктивных, нежели
проактивных компонентов этих способностей.
Математические тесты, к примеру, не
оценивают способности использовать
математику для осмысления новых пробле-м,
для ситуации общения или для обобщения
доказательств. Тесты навыка чтения не
чувствительны к контекстному мышлению,
а письменные тесты не оценивают
способность эф­фективно передавать
свои мысли при помощи таких средств как
аллюзии, косвенные намеки или способность
обращаться к чувствам читателя. Равен
(1991) приводит много примеров того, как
совершенно неадекватные стратегические
решения принимались на основе исследований,
в которых использовались тесты с «низким
потолком». Исследования, проведенные
непосредственно на рабочем месте (Kohn
and
Schooler,
1978, 1982; Jaques,
1976; Lempert,
1986, 1990), обращают внимание на важность
такой работы, которая требует способностей
для при­нятия важных решений, высокой
ответственности и умения контролировать
и решать мораль­ные дилеммы.

Экспериментальные попытки создания
благоприятных условий для развития
продуктивной способности

Эксплицитное обучение
стратегиям, которые считаются необходимыми
для решения мат­ричных задач, оказывает
впечатляющее влияние на тестовые оценки
(см. Budoff et al,
1964; Budoff and Gorman, 1976; Wortman, 1968; Jacobs, 1977;
Feuerstein, 1979; Haywood et al, 1982). Однако
совсем не очевидно, что такая тренировка
значимо улучшает продуктивную способность.
Джакобс и Вандервентер (Jacobs
and
Vandeventer,
1971) даже обнаружили, что овладение
заученными стратегиями решения матриц
одного типа не обязательно улучшает
спо­собности работать с другими их
типами. Гутке (Guthke,
1982, 1984, 1986) и Эндрих (Andrich,
1991) показали, что специальная тренировка
и практика фактически не влияют ни на
скорость работы конкретного индивида,
ни предельный для него уровень сложности
выполняемых зада­ний. Было также
установлено (Alderton
and
Larson,
1990; Baltes
and
Lindenberger,
1988; Dickstein
and
Ayers,
1973; Difon,
1980), что тестовые показатели характеризуются
стабильностью даже не­смотря на
тренировку.

Работы Фойерштайна
(Feuerstein,
1979, 1980, 1988, 1990) заслуживают более детального
обсуждения. Его программы Инструментального
Обогащения (FIE)
вклинивались в процесс ког­нитивного
развития на значительно более ранней
стадии, чем это делали выше цитированные
авторы. В этих программах участников
поощряли обращать внимание и разыскивать
линии, углы

16 и
треугольники. Их стимулировали искать
сходства и различия и приходить к
пониманию того, что мир скорее упорядочен,
чем случаен. Подчеркивалась важность
убежденности, что выбран­ное решение
согласуется со всеми известными на
данный момент обстоятельствами.

К сожалению, как было детально
проанализировано Шпитцем (Spitz,1986),
результаты оценки программ FIE,
равно как программы Хидштарта (Headstart)
и других программ когнитив­ного
обогащения {см. Raven,
1980), часто оставляют желать лучшего.
Например, не является достаточно
убедительным основное требование
Фойерштайна — чтобы те, кто прошел полный
курс обучения по его программе, даже
много лет спустя получали более высокие
ПМР баллы, нежели их сверстники (при
условии исключения эффекта тренировки
путем использования новых тестовых
заданий).

Даже если отвлечься от
возможных недостатков при организации
исследований по оценке программ
обогащения, остается недостаточно
понятным, какое влияние тренировка
оказывает на разные подгруппы в рамках
одной возрастной когорты. Будут ли все
действовать одинаково успешно? Если
нет, то насколько сохранится ранговый
порядок оценок при повторных тестиро­ваниях?
Будет ли повышение
оценок (Потенциал
Обучаемости,
согласно
определению некото­рых авторов,
например, Wortman,
1968) одинаковым для всех, или же оно будет
больше для на­ходящихся у нижнего
конца шкалы?

Учитывая эти очевидные
проблемы с FIE,
представляется интересным тот факт,
что Фойерштайн и его коллеги вынуждены
были отказаться от своих программ в
пользу Опосредо­ванного
Обучения
(Feuerstein
et
al.,
1988, 1990). Этот термин указывает на
совокупность видов деятельности,
аналогичных тем, которыми пользуются
родители, добившиеся наибольших успехов
в развитии у своих детей продуктивной
способности. Особый акцент делается на
отборе, структурировании, объединении
и установлении временных, пространственных
и при­чинно-следственных связей. Особо
важное значение приписывается пяти
видам деятельности Первая — опосредование
интенциональности —
вовлекает ребенка в
процесс постановки целей и планирования
действий по их достижению. Вторая
опосредованная деятельность —
трансцен­дентность,
предполагает организацию
условий, помогающих ребенку развить
способность формировать новые
потребности. Третья
включает в себя опосредование процессов
констру­ирования значений, формирования
символов и схем. Содержанием четвертой
является опосре­дование процесса
имитации, чтобы
ребенок обращал внимание на людей,
демонстрирующих компетентности высокого
уровня (и таким образом обучался
соответствующему поведению). Пя­тая
состоит из опосредованных рефлексий
на результаты действий и развитие у
ребенка чувст­ва самостоятельности,
уверенности в своем праве задавать
вопросы и т.п. Направление рабо­ты,
выбранное в итоге Фойерштайном,
представляется вполне оправданным,
постольку такое изменение приоритетов:
(i)
поддерживает его изначальное настойчивое
требование, чтобы учи­теля изменили
стратегии преподавания,
вместо того, чтобы
полагаться на имеющийся методический
арсенал; (и) хорошо согласуется с
суммированными выше практическими
выводами из результатов исследований
детского развития; (Hi)
поддерживает основной вывод, сделанный
в обзоре (Savell
et
al,
1986), содержащем результаты оценки
различных FIE
про­грамм. Там было отмечено, что хотя
многие из FIE
программ имели незначительный эффект,
от­дельные их варианты показали в
итоге существенное повышение ПМР баллов.
Причем программы, оказавшие максимальный
эффект — это как раз те, которые подчеркивают
роль Опо­средованного Обучения.

Пределы Эффективности Программ
Активного Обучения

Подчеркивая важную роль,
которую отдельные родители и учителя
могут сыграть для создании благоприятных
условий развития продуктивной способности,
нужно отметить, что бо­льшинство
попыток внедрить
такого рода деятельность в школу
натолкнулось на невозмо­жность
изменить поведение учителей (см. НМ1,
1980; Farley,
1981; Raven
et
al,
1985). Попытки изменить поведение родителей
постигла та же участь (Raven,
1980). Почти наверняка именно в

17 этом
состоит причина, что попытки оценить
эффективность программ активного
обучения (см., например, Bock
et
al,
1977; Spitz,
1986) — подобных «Мозговому Старту»
(Headstart)
или «К Новым Вершинам» (Follow-Through)
— показали их недостаточную успешность.
Как выяснилось, непосредственные ведущие
этих программ не делали того, что должны
были делать. Если Фойерштайн смог
заставить ведущих изменить свое
поведение, то это и привело к тем
положительным эффектам, которые лишь
немногие кроме него смогли достичь. К
сожалению, наша собственная работа
показывает, что безуспешные попытки
многих родителей и учителей применять
более эффективные стратегии обучения
обусловлены не только недостатком
знаний, понимания или компетентности.
Они определяются также недостаточными
возможностями окружающей среды,
принижением ценности умения задавать
вопросы, неспособностью руково­дить
самостоятельно мыслящими и задающими
вопросы детьми, недостатком методик,
помога­ющих учителю определить мотивы
учащихся и отследить развитие их талантов
и, наконец, об­щей неспособность
системы образования создавать необходимые
условия, которые способствовали бы
достижению разнообразных и значимых
для ребенка целей (см. Raven,
1991).

Одна существенная оговорка, касающаяся
«обучения» решению задач в школах,
заключа­ется в следующем: по причинам,
рассмотренным выше, такое обучение
ориентированно скорее на инструментальный
подход и не будет оказывать влияния на
развитие мотивации и сензитив-ности,
нужных для облегчения идентификации и
решении учащимися значимых для них
задач. Безуспешность осуществляемых
до сих пор попыток внедрить методы
творческого решения задач во все сферы
образования значительно затрудняет
формирование таких учебных планов, где
решение задач составляло бы одну из
центральных учебных целей.

НЕКОТОРЫЕ ИТОГИ

Имея перед глазами обзор
материалов, демонстрирующих важность
некоторых разви­вающих и образовательных
детских программ для создания благоприятных
условий формирования продуктивной
способности, мы приходим к выводу, что
роль среды здесь менее значительна. Но
ни один из указанных выше психологических
или образовательных процессов не влияет
настолько, чтобы объяснить доказанное
Флинном повышение оценок ПМР от поколе­ния
к поколению. Более того, ни один из видов
деятельности, описанных в опубликованных
на сегодняшний день исследованиях, не
может значимо снизить внутригрупповую
или внутрисе­мейную вариативность
тестовых баллов. Причем внутрисемейная
вариативность покрывает до двух третей
общей вариативности тестовых баллов.
Похоже на то, что средовые факторы,
кото­рые в наибольшей степени влияют
на продуктивную способность, имеют не
психологическую и не образовательную
природу и, по-видимому, они оказывают
незначительный эффект на ее на­следуемость.
(Последнее удивительное доказательство,
подтверждающее наследуемость не­ожиданно
широкого спектра человеческих
характеристик- включая и показатели по
ПМР — при­шло из Миннесоты и построено
на основе материалов близнецового
исследования, проведенно­го Бушардом
и соавторами (Bouchard
et
al,
1990).

ЭТНИЧЕСКИЕ И СОЦИО-ЭКОНОМИЧЕСКИЕ
АСПЕКТЫ

ПРОБЛЕМЫ

Тест Прогрессивных
Матриц
был разработан
для такого измерения продуктивной
способности, который минимизировал бы
влияние различий в уровне знаний
тестируемых на ре­зультат оценки. Уже
самые первые результаты показали, что
многие люди, живущие в общес­твах с
низким уровнем грамотности, в частности,
в Африке, не имеют привычки смотреть и
обра-

18 щать
внимание на круги, квадраты, треугольники
или линии, которые задают проблемные
ситуации в ПМР. Еще более существенно
то, что они не имели привычки думать в
двумерном плане и рассуждать в категориях
вертикалей и горизонталей, привычных
при чтении и счете. Да­же фотографии
людей не распознавались ими как
изображения людей (смотри Price-Williams,
1962; Silvey,
1972). Другие исследования (например,
Ombredane
and
Robaye,
1953; Vernon,
1966; Majumdarand
Nundi,
1972) показали, что при отсутствии
соответствующей стимуляции развитие
логического мышления происходит в
латентной форме или оно развивается в
более позднем возрасте.

Учитывая тот факт, что существуют
культуры, в которых настоящий тест
просто не работа­ет, мы должны
рассмотреть возможность, что разница
в тестовых оценках, полученных
предста­вителями разных этнических
групп в рамках западного общества, может
быть объяснена аналогичным образом.

Многочисленные данные
относительно причин различий между
этническими группами в обществах с
традиционно высоким уровнем грамотности
представлены в Исследовательских
Приложениях
к настоящему
Руководству. Тем
не менее, будет полезно суммировать и
здесь эти результаты, особенно потому,
что нередко утверждается «культурная
независимость» теста Прогрессивных
Матриц.
Мы предоставим
здесь столько доказательств, сколько
нужно чтобы продемонстрировать, когда
такое утверждение оправданно, а когда
— нет.

Один из наиболее впечатляющих результатов
заключается в том, что несмотря на
удиви­тельное повышение с течением
времени суммарных оценок, обнаружена
очень высокая степень сходства между
нормами, полученными в различных
культурах в одно и то же время, К примеру,
нормы, полученные в 1980 году в Великобритании,
Восточной и Западной Германии,
Чехослова­кии, Австралии, Новой
Зеландии, в городах континентального
Китая, а также у представителей белого
населения США, очень похожи как по
средним значениям, так и по величине
дисперсии.

Однако, некоторые этнические
группы демонстрируют значительное
отставание от этих международных норм.
Они включают жителей Бразилии, Ирландии,
Пуэрто-Рико, а также пред­ставителей
черного и коренного населения Америки.
Оуэн (Owen,
1992) показал, что согласно данным по Южной
Африке имеются огромные различия в
показателях между чернокожими и белыми
(на уровне 3 Стандартных Отклонений), и
между мулатами и белыми (на уровне 1,5
Стандартных Отклонений), но не между
индейцами и белыми. Крайне низкие нормы
были выяв­лены в исследовании,
проведенном в изолированном горном
районе Перу. Во всех странах мира нормы
для детей из менее привилегированных
социо-экономических групп и из сельской
местности были ниже, чем у остальных.
Особенный интерес представляют различия
между бе­льгийцами, говорящими
голландском и французском языках,
которые оставались практически
постоянными с 1957 по 1968 год.

Наиболее частое объяснение
этих различий заключается в том, что
данный тест не вызывает интереса людей,
выросших в неблагоприятной среде, и
требует от них мыслительных усилий, к
которым они не привыкли. Однако, трудно
согласовать такое объяснение с широким
диапазоном разброса тестовых оценок у
людей, выходцев из самых различных сред
и классов, а также членов большинства
семей. Еще более важно, что данное
объяснение не справляется с тем фактом,
что тестовая шкала остается той же самой
(то есть сохраняет ранговый порядок
сложности отдельных пунктов) для людей
— выходцев из совершенно разных культур.
И хотя су­ществуют незначительные
различия между шкалами, полученными в
Великобритании, Новой Зеландии, Австралии
и Чехословакии, средняя корреляция
между сложностью отдельных пун­ктов,
рассчитанных независимо в каждой из
этих стран, составляет 0.99. Внутри
Великобрита­нии и Соединенных Штатов
корреляция между сложностью пунктов,
рассчитанных независимо для разных
социо-экономических и этнических групп,
варьирует в пределах от 0.98 до 1.0. Оуэн
(Owen,
1992) представил похожие результаты в
отношении черных, мулатов и белых из
Южной Африки. Таким образом, тест сходным
образом работает во всех этнических и
культурных груп­пах. Если бы это было
не так, то пункты теста не демонстрировали
бы инвариантности индексов

19 сложности.
Более того, было обнаружено, что тест
имеет одинаковую прогностическую
валид-ность для ряда критериев внутри
каждой из этих групп. Таким образом,
даже в самом общем смысле не может быть
справедливым утверждение, что тест
предлагает «непривычный стиль
мышления» для людей из любой из этих
групп. Однако, нужно добавить, что
существует множе­ство индивидуумов,
чьи тестовые оценки не отражают реального
уровня их способностей.

Как мы уже отмечали, наиболее
вероятное объяснение факта изменения
норм с течением времени заключается в
улучшении питания, уровня благосостояния
и гигиены. Факт, что в США различия в
тестовых оценках по ПМР для разных
социо-экономических и этнических групп
изменяются параллельно с различиями в
весе детей при рождении, детской
смертности и ран­ней детской
заболеваемости, свидетельствует о
сходных источниках этих различий.
Результаты многих других исследований
(Baird
and
Scott,
1953; Scott
et
al,
1956; Vernon,
1969; Benton
and
Roberts,
1988; Eysenck
and
Eysenck,
1991) подтверждают эту гипотезу: качество
питания связано с весом при рождении,
детской смертностью, оценками по ПМР,
и с ростом как внутри социо-экономических
групп, так и между ними. При этом
использование в системе питания людей
вита­минов усиливает продуктивную
(но не репродуктивную) способность,
измеряемую с помощью ПМР или других
тестов. Впрочем, важно отметить, что
проблема состоит не просто в исключе­нии
влияния неблагоприятных факторов. Не
только люди маленького роста становятся
выше в результате процессов акселерации,
но и высокие люди тоже. Тем не менее,
хотя гипотеза каче­ства питания дает
разумное объяснение многим этническим
различиям, в том числе стремите­льно
сглаживающимся различиям между жителями
США — американцами европейского и
латиноамериканского происхождения,
хотя она и может объяснить сохранение
многих различий вопреки повышению
средних оценок по всем группам, но она
не в состоянии объяснить сохра­няющееся
в течение нескольких лет различия между
голландско- и франкоговорящими
бельгий­цами. Скорее всего это
конкретное различие следует приписать
влиянию различий в практике воспитания
детей.

Различия между оценками,
полученными детьми из различных
социо-экономических групп, значительно
меньше, чем у их родителей. Генетические
процессы склонны приближать крайние
характеристики к среднему по популяции
при переходе от родителей к детям.
Однако, с психологической точки зрения
больший интерес представляет тот факт,
что некий трудно объяс­нимый социальный
процесс селекции и распределения как
бы рассортировывает детей для
вос­произведения основных различий
между взрослыми социо-экономическими
группами. Этот про­цесс действует в
обществах с широким разнообразием
социо-экономических структур.
Фирковска-Манкевич с коллегами
(Firkowska-Mankiewicz
et
al.,
1982) предоставили впечатля­ющую
демонстрацию его работы в пригородах
Варшавы, где проживают люди с сильно
различ­ающимся социо-экономическим
статусом. Однако, этот процесс может
быть ускорен или замед­лен посредством
определенных социальных или образовательных
мероприятий. К примеру, Хоуп (Норе, 1985)
показал, что американцам требуется 34
года, чтобы достичь той степени свя­зи
между профессиональным статусом и
Интеллектом, которой шотландцы достигают
за 6 — то есть примерно ко времени, когда
ребенку исполняется 11 лет. В обоих
странах около 60% соци­альной мобильности,
в конечном итоге, статистически
высчитывается по оценкам «Интеллекта».

Похожие социальные процессы
наблюдаются и вне интеллектуальной
сферы. В 1959 году Кон (Kohn)
продемонстрировал факт, что люди,
принадлежащие различным профессиональным
группам, исповедуют совершенно разные
ценности. Так называемый «средний
класс» склонен подчеркивать значение
оригинальности, ответственности и
инициативы, тогда как представите­ли
«рабочего класса» более заинтересованы
в послушании, обучении и наличии четких
правил.

2
В своей книге Хоуп
показал, что около 60% случаев изменения
социального статуса — как вверх, так и
вниз — мож­но было предсказать на
основе детских оценок теста интеллекта
(но не их учебных достижений), на основе
учитель­ских оценок креативности
(отрицательная
корреляция), настойчивости
и ряда других прогностических признаков.
К одиннадцати годам школьная система
Шотландии уже отсортировывала детей в
соответствии с прицелом на их будущий
социальный статус. В отличии от Шотландии,
школьная система США слишком демократична
и подвер­жена постоянным инновациям,
так что прогнозы, сделанные на основе
тепа интеллекта у американского ребенка,
лишь к 40 годам достигали 60% соответствия
интеллекта и социального статуса.
(Примечания редактора).

20 Кон полагал,
что эти различия являются результатом
профессионального опыта, но автор
про­демонстрировал широкий разброс
систем ценностей у детей, выросших в
сходном окружении, а также то, что система
ценностей в юношеском возрасте в большей
мере определяется группой, в которую
индивид войдет в будущем, нежели той,
которой он принадлежит по рождению
{смот­ри также Kohn,
1977; Kohn
and
Schooler,
1978, 1982; Miller,
Kohn
and
Schooler,
1985, 1986), Kohn,
Slomcszynski
and
Schoenbach
(1986) представили впечатляющую демонстрацию
работы процес­са социального
распределения среди взрослых. Но наиболее
удивительными остаются резуль­таты,
которые были получены Кинси (Kinsey)
в 1948 году. Сексуальное поведение и
социальные установки подростков в
большей мере определяются группой в
которую они войдут,
нежели той из которой
они вышли. Трудно понять, как это могло
бы произойти путем обсуждения, явного
обучения или моделирования в какой либо
форме. Похоже, имеет место некий важный,
хотя и трудный для понимания социальный
процесс, в результате которого люди
стремятся работать с теми, кто обладает
интеллектуальными способностями их
уровня, а также разделяет их соци­альные
и профессиональные ценности.

Последствия этого процесса,
однако, далеко не удовлетворительны.
Хоуп (Норе, 1984), Наттгенс (Nuttgens,
1988), Хоган (Hogan,
1990) и сам автор (Raven
and
Dolphin,
1978; Raven,
1984) продемонстрировали в своих работах,
что из числа тех кто продвинулся по
службе на вли­ятельные должности,
значительную долю составляют люди,
которые, судя по их вкладу в эффе­ктивность
функционирования их организаций и
общества в целом, не могут быть
охарактеризованы иначе, чем некомпетентные.
Решение этой проблемы потребует
разработки лучших систем оценивания
ценностно-ориентированных мотивационных
диспозиций.

Итак, в данном разделе
обсуждались исследования этнических
различий в оценках ПМР. Флинн показал,
что (а) общая тенденция изменения оценок
с течением времени опровергает
предположение о наследуемости этнических
различий; (б) эти временные изменения
не связаны с изменениями деятельности
{измеренной, например, числом
зарегистрированных па­тентов). Недавно,
(1989, 1991) Флинн обнаружил, что впечатляющие
академические и профес­сиональные
достижения американцев азиатского
происхождения не могут быть отнесены
за счет их более высокой продуктивной
способности. Они скорее обусловлены их
преимуществом в других способностях и
мотивациях. Это подтверждает результаты
ранней работы Макклелан-да (McClelland,
1961), что различные успехи в образовательной
и профессиональной сфере представителей
разных культур обусловлены главным
образом их ценностными установками и
способностью формировать и развивать
в себе множество взаимодополняющих
видов компете­нтности для эффективного
достижения значимых для них целей.

Вытекающие из данного обсуждения
практические выводы для социальной и
образовате­льной политики будут
рассмотрены ниже (см. раздел «Социальные
и Психологические Аспекты Применения
Тестов Интеллекта».

СОЗРЕВАНИЕ ПРОДУКТИВНОЙ СПОСОБНОСТИ

Было бы поучительно начать обсуждение
этой проблемы с привлечения внимания
читате­лей к следующему неразрешенному
пока противоречию.

На основе качественных наблюдений
процесса развития способностей,
необходимых для решения входящих в тест
ПМР заданий, Дж.К.Равен и другие
предположили, что умственное развитие
напоминает скорее «скачки форели в
потоке жизни», чем последовательное
ровное продвижение вверх по ступенькам
лестницы. Как бы удобна ни была последняя
гипотеза для ко­личественного
оценивания или статистических вычислений,
она, похоже, мало отвечает реаль­ности
психической жизни ребенка, который
совершает множество повторных попыток
преодо­леть интеллектуальное
затруднение до тех пор, пока внезапно
с легкостью не разрешает его, после чего
без труда переходит к следующей проблеме.
Эта гипотеза подкрепляется анализом

21 решения
отдельных заданий. Она предполагает,
что необходимые для решения заданий
спосо­бности формируют целый континуум
качественно различных способностей,
которые встра­иваются и накладываются
на смежные способности, но каждая из
них, психологически говоря, является
отдельной, «самостоятельной
способностью».

Однако, рисунки ИП4.С1 и
ИП4.С2 из Исследовательского
Приложения № 4,
которые
отображают трудности отдельных тестовых
заданий по данным Эндрича и Довс (Andrich
and
Dawes),
использовавших схему анализа Раша
(Rasch),
показывают постепенное нарастание
трудности заданий. Там нет ни следа
эффекта «скачков и плато», которые
предполагаются гипо­тезой «прыжков
форели». В противоположность тому,
что утверждал Дж.К.Равен, оказывается
возможным так сконструировать тестовые
задания, чтобы они в точности соответствовали
за­данной степени трудности. Также,
наклоны Характеристических Кривых
Заданий (обсуждаемые подробнее ниже и
представленные на рисунках ИП1.1, ИП1.10
из Исследовательского
Приложения № 1
и ЦПМ2,
ЦПМ5 из Руководства к
Цветным Прогрессивным Матрицам)
пока­зывают, что
способности, необходимые для решения
определенного тестового задания,
законо­мерным образом согласованы с
теми способностями, которые требуются
для решения предыду­щих и последующих
заданий. Это указывает, что по мере
улучшения способности решать любое из
тестовых заданий, то же происходит и со
способностями решать соседние задания;
таким образом, не существует резких
скачков в успешности решения.

Кажущееся противоречие между этими
двумя системами наблюдений заключается
в раз­ных уровнях анализа и
концептуализации, используемых в
исследованиях, особенно в отношении
возрастного контроля.

Изучение норм {см., к примеру,
Таблицу СПМ IV)
показывает, что 10% детей семи с поло­виной
лет достигают более высоких тестовых
показателей, нежели 10% пятнадцатилетних.
Во­сьмилетние демонстрируют практически
все уровни, состояния, формы и стадии
развития продуктивной способности,
измеряемые данным тестом. Эти наблюдения
ставят под сомнение положения, связывающие
развитие продуктивной способности с
опытом, и, еще в большей сте­пени,
положения, связыващие интеллектуальное
развитие со стадиями, которые сами
опреде­ляются через возраст. Адекватная
проверка гипотезы «прыжков форели»
не может быть прове­дена методом
грубых возрастных срезов, но требует
лонгитюдного исследования развития
продуктивной способности у отдельных
детей.

Хотя соответствующее
лонгитюдное исследование и было
опубликовано Вилсоном (Wilson,
1983) (который также показал, что однояйцевые
близнецы имеют одинаковый характер­ный
паттерн опережений и задержек в развитии),
стоит отметить, что доказательства, на
поиск которых нацелены такого рода
исследования, выглядят не столь уж
очевидными. Ребенок мо­жет не справиться
с решением сложных заданий одного типа,
и в то же время управляться с бо­лее
легкими заданиями следующего типа. Это
тот случай, когда «менее способный»
ребенок мо­жет быть в состоянии решить
только простейшие перцептивные задания,
а затем «перескочить» на решение
простейших заданий на аналогии, не
будучи в состоянии решить промежуточные
за­дания, Другими словами, монотонное
возрастание сложности тестовых пунктов,
проиллюстриро­ванное на рисунках
ИП4.С1, ИП4.С2, может быть результатом
того, что разные дети на каждом типе
заданий показывают способности разного
уровня. Эти графики совершенно не
обязательно должны говорить нам о том,
в каком порядке конкретный ребенок
будет справляться с задани­ями, так
что гипотеза «прыжков форели» не
может быть признана опровергнутой. К
сожалению, возможно, что возраст
действительно оказывает
влияние на порог трудности для каждого
типа заданий. Эта гипотеза на самом деле
подтверждается данными, представленными
на рисунках ИП1.6 и ИП1.8. Тенденция к
бимодальности указывает на созревание
различных способностей, и отмечается
возрастающая прогрессия в отношении
обоих пиков
с увеличением возраста.

Гипотеза «прыжков форели»
получила свое подтверждение в двух
исследованиях, прове­денных Эндричем
и Стайлзом (Andrich
and
Styles).
В первом они обнаружили, что обучение
не д-елает детей способными работать с
более трудными заданиями; оно только
снижает количество

22 ошибок,
допускаемых до того, как они сталкиваются
с барьером трудности, которого не могут
преодолеть. В другом исследовании
(Andrich
and
Styles,
1993) детальный анализ показал весомые
данные о периодах возрастного ускорения.

Установление различий между самыми
первыми заданиями на обнаружение
«гештальта» и последующими более
сложными заданиями на «аналогии»
— независимо от того, используется ли
метод наблюдения или факторный анализ
— может быть полезным для каких-то
конкретных целей, но не имеет большого
смысла для доказательства того, что
продуктивная способность охватывает,
вероятно, целый веер психологически
разных способностей, а способность
разви­вать каждую из них полностью
зависит от наличия уже развитых ранее
способностей, включен­ных в ту же
единую цепь.

Дж.К.Равен выделял по крайней мере пять
качественно различных периодов развития
ин­теллектуальной способности:

1. Сперва
дети способны лишь различать идентичные
фигуры от различных фигур, а по­зднее
— сходные фигуры от несхожих.

2. Некоторое
время спустя они становятся способны
оценивать ориентацию фигуры в от­ношении
самих себя или других объектов, находящихся
в перцептивном поле.

3. Далее, они
обретают способность сравнивать
аналогичные изменения воспринимаемых
свойств объектов и принимают ее на
вооружение как логический метод
рассуждения.

4. Следом
за этим, они становятся способны
анализировать воспринимаемое целое
через выделение основных его элементов
или свойств, а также понимать различие
между тем, что да­но, и тем, что они
сами додумывают.

5. Наконец,
они приобретают способность воспринимать
две или более дискретных фигу­ры как
формирующих нечто целое, или организованную
индивидуальную сущность.

Дж.К.Равен следующим образом связывал
эти периоды развития с возрастом ребенка:

К моменту достижения
детьми возраста 3-х лет
они,
получив планшетную форму теста, обычно
могут вставить один из подвижных
фрагментов в прорезь матрицы. Сначала
лю­бой фрагмент, который входит в
прорезь, доставляет им удовольствие и
дети будут многократно пробовать по
очереди разные варианты, каждый раз
удивляясь, что любой фрагмент подходит
к вырезанной части, или что впадина была
сделана для того, чтобы удерживать
вкладываемые фрагменты. Некоторые дети
успешно дополняют рисунок в первых двух
или трех матрицах Серии А и оставляют
правильный фрагмент в нужной позиции.

К возрасту 4-х лет ребенок
обычно замечает, что один из фрагментов
выглядит также, как рисунок сверху от
него. Сначала значение имеет только
сходство рисунка, а действительный
размер или ориентация элементов рисунка
не кажутся существенными. Ребенок будет
часто до­полнять рисунок, состоящий
из горизонтальных линий, похожими
вертикальными линиями и вес­ти себя
так, как будто он полностью удовлетворен
результатом, даже после того как увидит
за­вершенную композицию. На следующей
стадии развития, внимание обращается
уже и на раз­мер, и на ориентацию, и
ребенок обычно учитывает их, делая
первый выбор фрагмента для за­вершения
рисунка матрицы. Научение
на основе попыток
размещения фрагмента в прорезе рисунка
проявится на более поздних стадиях
развития. Начиная с этой стадии и далее,
«пробы и

Смотри раздел об Анализе Пунктов, где
обсуждается неадекватность последней
процедуры для анализа мощности

тестон.

Например, кососимметричные
по отношению к наблюдателю или объектам
в его перцептивном поле фигуры (см.
задание Abl
1 из ЦПМ) труднее дополнять до целого,
чем те же фигуры вертикальной или
горизонтальной ориента­ции. Важность
ориентации в развитии восприятия
принимали во внимание многие исследователи
(Piaget,
1947; Ghent,
1961). Решение пяти из десяти заданий,
отвергаемых на первой стадии, требует
восприятия наклонной ориен­тации,
без которого они были бы решены путем
формирования относительно простого
Гештальта.

23 ошибки»
используются ребенком как основной
метод работы. Он нуждается лишь в
инструкции, чтобы, по возможности,
попытаться выбрать правильный фрагмент
с первой пробы.

К возрасту 5-ти лет дети
иногда удовлетворяются результатом
своих действий, если помещенный в прорезь
фрагмент дополняет рисунок только в
одном направлении. Позднее они начинают
выбирать фрагменты, которые дополняют
рисунок в двух направлениях одновремен­но.
«Умные» дети могут начать спонтанно
манипулировать тестовыми материалами
для развле­чения. Поместив в прорезь
нужный фрагмент, такие дети иногда
сознательно удаляют его толь­ко для
того, чтобы проверить как будут в ней
смотреться другие варианты.

К возрасту 6-ти лет дети
часто выбирают фигуры, которые правильно
дополняют рисунок даже тогда {как в
задании А8), когда искомая фигура (№2),
не похожа ни на одну из час­тей
дополняемого рисунка. Начиная с этой
стадии развития, независимо от возраста,
«неумные» дети, начинают допускать
ошибки. Их усилия направляются на
повторение части данного рисунка и на
принятие этой стратегии в качестве
стандартного метода работы. Даже когда
расположение фрагмента в прорези
выглядит как очевидно ошибочный ответ,
такие дети часто удовлетворяются
достигнутым результатом.

К возрасту 7-ми лет дети
обычно уже способны воспринять дискретные
объекты (такие как на матрицах Серии
АЬ) как пространственно организованное
целое, но, бесспорно, испыты­вают
трудности при анализе составляющих их
компонентов. Если не выбирается фрагмент,
ко­торый повторяет одну из трех частей
рисунка, то может быть выбран фрагмент
на основе це­лого рисунка,
включая как изображенную,
так и требуемую часть. Например, в
качестве ответа на задание АЬ4 может
быть выбран фрагмент № 2. Способность
выбрать часть, дополняющую дискретный
рисунок до целого, развивается, похоже,
несколько позже. Любопытно, что некото­рые
дети при выполнении теста в планшетной
форме удовлетворяются выбором целого
квад­рата или круга, вместо того, чтобы
подставить недостающий четвертый угол
квадрата или квадрант круга. Выяснилось,
что на их суждения почти не оказывает
влияние, предлагается ли им тест в
планшетной или буклетной форме.

К возрасту 8-ми лет трудности
возникают преимущественно к концу Серии
В. Наводящие примеры, предназначенные
для тренировки в метода рассуждения,
похоже, не оказывают ребенку помощи в
решении этих заданий. Вместо выбора
соответствующей всем требованиям
фигуры, восьмилетний ребенок обычно
повторяет одну из фигур из уже
представленных на матрице и принимает
эту стратегию работы как приемлемую.
Если, например, ребенок выбирает вариант
№ 5 в качестве правильного ответа на
задание В8, его ответы на последующие
задания будут иметь тенденцию к выбору
фрагмента, повторяющего фигуру,
находящуюся сбоку или сверху от
пропущенной.

Те дети в возрасте семи с
половиной или восьми лет, которые поняли
идею соответствия для дополнения матрицы
фигурой, оказываются способны решать
многие задания из набора Стандартных
Прогрессивных. Матриц
тем
же способом, как и взрослые. По-видимому,
до тех пор пока данная способность
находится в процессе становления,
задания в конце Серии В кажутся детям
практически бессмысленными, но те же
самые задания становятся самоочевидными
для тех, у кого данная способность уже
сформировалась. Это доказывает особую
трудность конструирования заданий,
занимающих промежуточное положение
между такими, которые успешно решаются
с помощью выбора фигуры для дополнения
группы дискретных фигур, понимаемых
как пространственно связанное целое,
и теми, в которых необходимо сравнить
две фигуры и логически вывести форму
четвертой фигуры исходя из существенных
признаков третьей. Для зрелого интеллекта
эти два вида заданий представляются
очень похожими и, очевидно, решаются с
помощью более менее сходного способа
рассуждений. Для ребенка они явно
различаются и, похоже, требуют использования
разных психических процессов. Это может
объяснить бимодальность распределения
нормативных данных (смотри графики в
Исследовательском
Приложении № 1),
а
также

24 причины
того, что в некоторых исследованиях,
особенно проведенных на детях, СПМ,
выявляют «k»
фактор, который обычно не проявляется
в исследованиях, проведенных на взрослых.

Фактический возраст, в котором впервые
проявляется способность ребенка
рассуждать по аналогии, является менее
важным, нежели развивающаяся у него на
этой основе собственно способность к
абстрактному мышлению.

С 10 пет и
далее,
ответы испытуемых,
получающих высокие, средние и низкие
тестовые оценки, начинают все сильнее
отличаться друг от друга. Когда дети не
способны выполнить задание, они стремятся
повторять то, что они уже восприняли и
усвоили. Во-вторых, они склонны делать
ошибки в выборе ориентации и воспроизведении
соответствия. Кроме того, они склонны
менее адекватно схватывать перцептивное
поле и, наконец, часто прибегают к
спорному выбору в зависимости от близости
фигуры к заполняемому пробелу в матрице
или, в более редких случаях, от ее близости
к ним самим.

«СНИЖЕНИЕ»
ПРОДУКТИВНОЙ СПОСОБНОСТИ В ЗРЕЛОМ
ВОЗРАСТЕ

Одно время считалось, что
продуктивная способность начинает
снижаться в возрасте более 25 лет. Данные,
которые можно было бы интерпретировать
как подтверждение этого заключения,
были опубликованы в ранних редакциях
настоящего Руководства и подтверждены
-для более высоких средних оценок — в
недавних исследованиях Дельтура
(Deltour,
1984) во Франции и Чанга с коллегами (Zhang
et
ai,
1989) в Китае. Данные стандартизации СПМ
1992 года, показывающие «снижение»
начиная с 35-летнего возраста, представлены
на рисунке О1.

Однако когда на графике
одновременно нанесены как современные,
так и более ранние данные как функция
даты рождения, а не только возраста
(Рисунок О2), то оказывается, что
распределение баллов по популяции 1922
года рождения в обоих исследованиях
остается практически неизменным,
несмотря на то, что в одном случае
хронологический возраст испытуемых
равен 20 годам, а в другом — 70. Обнаруживается
отчетливое и устойчивоеповышение
тестовых оценок с датой рождения,
независимо от даты тестирования и
50-летнего различия в возрасте респондентов.

С целью разрешить все еще остающиеся
сомнения относительно адекватности
выборки в обоих упомянутых исследованиях,
данные третьего исследования, проведенного
примерно в промежутке между ними, были
наложены на наши собственные результаты
на рисунке ОЗ.

На рисунке О4 данные по китайскому
городскому населению наложены на
британские данные. Очевидно, что китайская
популяция отстает примерно на 20 лет.
Эти данные

представляют особый интерес, поскольку
таблица ИП4 СПМ2 показывает, что нормы
для китайских школьников, протестированных
в тот же год, что и взрослые, похожи на
нормы, полученные для их британских
сверстников. Возникает вопрос о причине
такого отставания у взрослых — в частности,
обусловлено ли оно такими факторами
как питание и образование.

Рисунок О1 может породить
и другие ошибочные представления. Одно
из ограничений Матриц
как инструмента
измерения продуктивной способности
заключается в том, что они ставят
проблемы, не задевающие ценностей, на
которые ориентируются испытуемые, и не
позволяют им использовать сложные
невербальные конструкты, привлекаемые
для решения значимых для них задач.
Отсюда следует, что плато в развитии,
которое казалось бы наблюдается на
протяжении юношеского возраста, может
являться артефактом измерения. В случаях,
когда продуктивная способность измерялась
с учетом видов деятельности, представляющих
значимость для конкретного испытуемого,
то, как показывают результаты многих
исследований (Jaques,
1961, 1964, 1976; Kohn
and
Schooller,
1978; Lempert,
1986), при соответствующих условиях среды
обнаруживается явное улучшение
продуктивной способности в течение
всей жизни.

РЕПРОДУКТИВНАЯ СПОСОБНОСТЬ, ВОЗРАСТ
И ДАТА

РОЖДЕНИЯ

Рисунок О5 отображает оценки
по Словарной Шкале
Милл Хилл,
полученные
при срезовом тестировании популяции
взрослых в процессе стандартизации
шкалы в 1992 году. Очевидно, что хотя
продуктивная способность имеет тенденцию
к снижению с возрастом, репродуктивная
способность повышается, за исключением
самых отсталых. Это было подтверждено
Делтором (Deltour,
1984), использовавшим французскую версию
СШМХ, а также Бувье (Bouvter,
1969) и Шайе (Schaie,
1983,1986), применявшими другие тесты.

Рис.О5. Репродуктивная способность и
возраст

Данные как Бувье, так и Шайе показывают,
что хотя большинство способностей,
включая такие как способность решать
административные задачи, проворство
при выполнении ручных заданий и
атлетические способности, улучшаются
с течением времени, способность к
рассуждению, независимо от того,
измеряется ли она вербальными или
невербальными

28

тестами, улучшается в наибольшей степени,
а словарные — в наименьшей. Лишь некоторые
способности, такие как вербальная
беглость, демонстрируют ухудшение с
течением времени.

На рисунке Об сравниваются данные 1992
года с более ранними. Можно убедиться,
что 50-ый процентиль практически не
изменился с 1947 по 1992 годы. 90-ый и 95-ый
процентили для 1992 года оказываются
ниже, чем прежде, но повышаются у людей
старше 60 лет. 5-ый и 10-ый процентили
оказываются явно выше по отношению к
прошлому их уровню для всех возрастов,
причем, чем больше возраст, тем больше
это повышение.

Перегруппировка данных в соответствии
с датой рождения не обнаруживает
существенных тенденций. Однако можно
увидеть, что тестовые баллы людей,
рожденных в 1922 году — кому было,
соответственно, 25 лет при первом
тестировании и 70 при втором -определенно
улучшались во всех случаях, за исключением
5-ого процентиля, хотя и не так сильно,
как следовало бы ожидать на основании
графика на рисунке Об. Максимальным
было улучшение у тех, кто изначально
имел высокие оценки.

Данные эти переворачивают с ног на
голову вопрос, который с такой
настойчивостью ставил Флинн. Загадкой
является то, почему когда столько
различных способностей, включая
физический рост и атлетические
способности, увеличиваются столь
значительно, такого не наблюдается для
репродуктивной способности.

Здесь мы можем повторить, что было бы
значительно труднее установить истинность
этих выводов, если бы данный тест в
практически неизменном виде не
использовался в самых разных исследованиях,
проведенных во многих странах в течение
длительного периода времени. Поэтому,
для исследователей крайне важно
противостоять соблазну создавать новые
модификации известных тестов, которые
может быть и лучше отвечают целям их
конкретных исследований, но закрывают
возможность включать получаемые с их
помощью результаты в международный
банк данных для сравнительных исследований.

29

СОЦИАЛЬНЫЕ И ПСИХОЛОГИЧЕСКИЕ АСПЕКТЫ
ПРИМЕНЕНИЯ

ТЕСТОВ ИНТЕЛЛЕКТА

Вопросы этнической принадлежности и
равенства, поднятые в связи с разработкой
критериев направления на специальное
обучение в США, неожиданно вовлекли
психологов в оппозиционную политическую
активность. Все больше и больше психологов
требовалось для участия в такого рода
исследованиях, и все больше усилий
направлялось на разработку эффективных
и предоставляющих равные возможности
программ обучения, а также программ
повышения профессиональной квалификации
и отбора персонала, Для иллюстрации
этого процесса, мы можем отметить, что
одно из направлений деятельности,
приобретающее особое значение в
обезвреживании минного поля этнической
принадлежности, включает разработку
образовательных программ, которые
выявляют, развивают и обеспечивают
признание все большему числу разнообразных
талантов у все большего числа учащихся.
Эта работа включает в себя прояснение
природы тех компетентностей, которые
следует развивать, механизмов их
формирования, а также методов их оценки.
Определенно, что это является задачей
для психологов. К сожалению, это одна
из тех задач, которую мало кто из
психологов готов поставить перед собой,
хотя придается особое значение извлечению
исследовательских приоритетов из
прикладных проблем и существует большая
готовность поддерживать тех, кто желает
и способен путешествовать в непознанное
для развития принципиально нового
взгляда на вещи и для конструирования
средств поиска новых решений, пусть на
первый взгляд и уводящих немного в
сторону, но влияющих на актуальные
социально-политические проблемы.

Эти исследования по сути
своей более фундаментальны и важны, чем
может показаться после прочтения
предыдущего параграфа, Приведенное в
начале настоящего раздела Руководства
обсуждение проблем
природы продуктивной способности, её
отношения к Общим Способностям,
ограничений при использовании Матриц,
а также природы,
развития и оценки других видов
компетентности, имеет самое серьезное
практическое значение при применении
критериев оценки качественных особенностей
людей, а также образовательных программ
и программ повышения квалификации
персонала. Качество оценки или измерения
не определяется (как пытается нас убедить
Объединенный Комитет по разработке
Стандартов Педагогической Оценки (Joint
Committee
on
Standards
for
Educational
Evaluation,
1981)) точностью информации, полученной
относительно одной или двух переменных.
Оно заключается, скорее, в содержательности
этих переменных, т.е.
в убедительности представления ими
хотя бы грубого контура всех важнейших
характеристик обследуемого индивида
или всех важнейших результатов
образовательной программы, программы
повышения квалификации персонала или
развития организации. Было бы неправильным
использовать термин «объективная»
для такой оценки конкретного испытуемого,
когда зарегистрированы только те
способности, которые характеризуют его
не с лучшей стороны, и не представлен
список его актуальных и потенциальных
достоинств и преимуществ. Подобным же
образом, нельзя признать справедливой
такую оценку образовательных программ
и программ повышения квалификации
персонала, в которой отсутствует учет
их достоинств и недостатков, объясняемый
их «неуловимостью и трудностью для
измерения», или тем, что они «не
оказывают влияния» на результаты
измерений, полученных посредством
надежных и доступных тестов.

Из этих наблюдений следует,
что различия между людьми и между
программами нужно проводить преимущественно
по их достоинствам и отличительным
характеристикам, вместо того чтобы
ориентироваться на тестовые оценки,
отражающие лишь небольшое число внутренне
непротиворечивых переменных. Они также
предполагают, что при планировании
проведения оценочных исследований
нужно посвящать столько же времени
анализу и измерению средовых
переменных (например,
условиям образовательного процесса
или процесса развития, в их конкретном
воплощении дома, в школе или на
производстве), сколько и разработке
проблем измерения результата. Наиболее
важная цель оценочных исследований

30 такого
рода заключается не в том, чтобы выяснить,
«работает» или нет программа, а в
том, чтобы определить способы
ее работы, а также
почему не
работают те факторы, которые могли бы
работать.

Здесь не место для более
детального рассмотрения этих вопросов
или для развертывания широкой картины
их практического применения чтобы
показать, как психологи определяют свою
роль а обществе и как они планируют
исследования, которые могут быть
социально востребованы. Те, кому это
интересно, могут обратится к работам
Равена (Raven,
1985, 1989, 1991)5.

Имеется, однако, еще одна
прикладная область, которую стоит
упомянуть. Мы уже видели, что более
эффективное «взращивание»
продуктивной способности часто включает
в себя изменение дисциплинарных
стратегий, а это, в свою очередь, ставит
проблемы, требующие от родителей,
учителей и менеджеров высокой
управленческой компетентности. Это
только один пример ценностно значимых
последствий, которые всплывают на
поверхность сразу, стоит лишь только
предпринять попытку ввести в действие
образовательные программы, способствующие
развитию компетентности высокого
уровня. Для идентификации таких скрытых
барьеров, препятствующих внедрению
эффективных образовательных программ,
большую пользу может оказать применение
средств организационной психологии к
анализу деятельности служб социального
обеспечения. Как только это будет
сделано, то на удивление быстро обнаружится
(Raven,
I989),
что для решения этих проблем будет нужно
развивать новые формы бюрократии и
демократии, а также новые ожидания у
работников социальных служб и политиков.
Эти социальные задачи очень важны для
роли, которую психологи, как они полагают,
играют в обществе, и образа этой роли,
который они создают в глазах общественности.

Приведенные примеры
иллюстрируют ту полемическую
политизированную деятельность, в которую
психологи втянули себя в процессе
отстаивания ценностных установок,
всплывших на поверхность в
связи с отбором детей
на программы Специального Обучения. Но
это только верхушка айсберга проблем,
с которыми психологи в самом скором
времени вынуждены будут иметь дело. К
сожалению, большинство академических
ученых, включая и психологов, не достаточно
готовы к этому. Другими словами,
большинство психологов сами испытывают
недостаток тех видов компетентности,
которые наиболее важны для эффективного
выполнения их собственной работы.
Следовательно, те, кто отвечает за
подготовку психологов на младших курсах
университетов, должны пересмотреть
свою деятельность и поставить на первое
место задачу формирования таких
личностных черт, ожиданий и компетентностей,
которые в будущем будут крайне нужны
психологам.

Обрисовав обширный круг задач, ожидающих
психологов, нам следует упомянуть об
одной, которой они могут недосчитаться
в ближайшем будущем.

Многие психологи верят, что тестирование
является исключительно их сферой
деятельности.

Однако, если внимательно изучить те
сферы, в которых тестирование находит
свое основное применение — а именно,
руководство, развитие и размещение
детей, учащихся и персонала — то можно
обнаружить, что львиная доля работы
выполняется друзьями, родителями,
учителями и менеджерами. Работы должно
быть сделано так много, причем работы
повседневной, что у психолога нет никакой
возможности выполнить ее самостоятельно.
Более того, значительная доля работы,
которую непсихологи делают в этих
областях, составляет существенную часть
их собственной работы. Одним из важнейших
признаков, отличающих более успешных
родителей, учителей и менеджеров от
менее успешных, является то, что они
думают о мотивах и зарождающихся талантах
своих детей, учащихся или подчиненных,
изобретают индивидуализированные
программы их развития, создают

Некоторые из них опубликованы в журналах,
которые не имеют широкого международного
распространения. Тем не менее, автор
будет рад переслать копии тем, кому
трудно получить их иным способом.

31 развивающую
среду, перераспределяют их таким образом,
который способствовал бы повышению
внутренней мотивации к развитию этих
талантов, а также предоставляют гарантии,
что развивающиеся способности будут
использованы и вознаграждены. Они
отслеживают результаты своих воздействий
для оценки правильности ответной реакции
учеников, детей или практикантов,
предпринимают корректирующие действия
по мере необходимости, а также находят
пути, чтобы гарантировать развиваемым
мотивам и талантам признание всеми
заинтересованными лицами. (Данные,
подтверждающие эти утверждения, можно
найти в работах Raven,
1980, 1984 и Raven,
Johnstone
and
Variey,
1985).

Другими словами, поскольку в этой области
должно быть сделано так много, что
психологи принципиально не могут сделать
больше какой-то небольшой её части,
эффективное выполнение всей оставшейся
работы и реализация других ролей зависит
от тех, кто так или иначе связан с
выполнением насущных задач диагностики,
руководства, размещения или развития.

Из вышеизложенного следует, что роль
психологов заключается в развитии
соответствующих знаний и разработке
методических приемов, доступных другим
профессиональным группам. Психологи
должны будут также обеспечивать
специальную научную поддержку в тех
ситуациях, когда возникающие проблемы
слишком сложны для тех, кто сталкивается
с ними непосредственно и по роду службы
обязан их решать. Это не значит, однако,
что психологи должны держать свои
концепции и тесты при себе. В процессе
тщательного обследования компетентный
психолог легко сможет выявить тех, кто
был обучен ответам на любой конкретный
тест. В любом случае, неправильно будет
полагаться только на защиту теста от
доступа потенциальных обследуемых как
на гарантию против получения ненадежных
результатов, поскольку всегда были и
будут «учебные» конторы, помогающие
сделать карьеру тем, кто готов платить
за такую помощь. Проблемы, возникающие
в связи с широким распространением
тестов, наилучшим образом решаются все
же через профессионализм специалистов,
а не посредством усложнения защиты
теста.В любом случае ограничение может
оказаться деструктивным за счет того,
что ведет к созданию консультационных
и диагностических агентств, из которых
не все будут комплектоваться
профессиональными психологами. До тех
пор, пока профессионалы будут стараться
лишить такие агентства возможности
использовать научные версии тестов,
они будут вынуждены использовать
методики более низкого качества.
Поскольку нет оснований требовать от
широкой публики, чтобы они были способны
отличать хорошие тесты от плохих, то
такая политика ограничений будет
отрицательно сказываться на профессиональном
сообществе в целом.

Сами психологи, сдерживая
процесс расширения сфер применения
тестирования, непреднамеренно вносят
свой вклад в усиление тенденции к
социальной дисфункции. Поскольку
психологи не разрабатывают необходимые
концепции и измерительные средства,
многие таланты остаются нераспознанными
в школах, а некомпетентные, руководствующиеся
исключительно эгоистическими мотивами
люди, выдвигаются на влиятельные позиции
в обществе. Все это вносит определенный
вклад узаконивание существующего
социального порядка, при котором огромная
разница в доходах оправдывается разницей
в «способностях». Кроме того, оценки
образовательных программ, которые
претендуют на объективность только
потому, что строятся на основе
стандартизированных тестов, не могут
зафиксировать всех тех результатов,
которые лежат за пределами узкого и
привычного диапазона легко измеримых
эффектов. Вследствие этого общество
продолжает использовать неэффективные
(а, на самом деле, личностно и социально
опасные) программы, игнорируя те, которые
имеют больший потенциал. Более детальное
и полное обсуждение данного вопроса
можно найти в книге Равена: «Трагическая
Иллюзия: Тестирование в Образовании»
(Raven,
1991).

КАК ПРЕДСТАВЛЯТЬ РЕЗУЛЬТАТЫ: ТРЕБОВАНИЯ
К КОНТЕКСТУАЛЬНОЙ ИНФОРМАЦИИ

Психологи несут ответственность за то,
чтобы их клиенты имели представление
об ограниченности информации, которая
может быть получена в результате
тестирования, а также о ее возможном
социальном использовании.

Чтобы проиллюстрировать,
что под этим подразумевается, мы приведем
лишь некоторые соображения, более
подробно освещенные в заключительных
параграфах Исследовательских
Приложений № 3 и № 4.
Представленные
в этих Приложениях
материалы показывают,
что при оценке целесообразности
направления на специальные и углубленные
программы обучения в США, ответственные
за это лица должны выбирать соответствующие
отборочные нормы с учетом возможных
социальных последствий такого выбора.
Например, если специальное обучение
рассматривается как благо, поскольку
от этого выигрывают как отобранные
«слабые» дети, так и их одноклассники
(хотя бы потому, что обычные классы
становятся меньше), то можно увеличить
число детей, отбираемых на эти программы,
используя национальные (а не локальные
или этнические) нормы. Напротив, если
рассматривать специальное обучение
как нечто плохое, в силу того, что на
детях ставится «ярлык неполноценных»
и они лишаются базовых знаний, которые
могут им понадобиться при будущих
тестированиях, то процент детей,
отбираемых на эти программы, может быть
уменьшен путем использования локальных,
этнических норм. Обе процедуры могут
быть аналогичным образом использованы
для максимизации или минимизации потока
федеральных бюджетных средств,
направляемых в заинтересованные школьные
округа.

Более фундаментальные вопросы касаются
использования терминов «способности»,
«общие способности» и «умственный
возраст». Социальные последствия от
поддержки одномерной модели «Способностей»
заключается в воспроизведении социального
порядка, при котором многие таланты не
развиваются и не используются, а грубое
неравенство в доходах и качестве жизни
смиренно принимается как данность.

Мы подчеркиваем важность,
чтобы психологи обсуждали такие вопросы
со своими клиентами, не только из-за
возможных социальных последствий от
отсутствия такого обсуждения, но и из-за
необходимости создания между ними
доверительной атмосферы, в которой
будет проще обосновать необходимость
исследований, нужных для разработки
средств внедрения индивидуализированных,
ориентированных на множественность
талантов, программ в сфере образования,
размещения и профессионального развития
персонала, и которая дала бы психологам
возможность выносить более содержательные
и объективные суждения о способностях
и талантах людей. Вопрос, следовательно,
не в гражданской ответственности
психологов за обсуждение этого широкого
круга вопросов с клиентами, а в том, что
для них важно поступать так, если они
претендуют на компетентное поведение
профессионалов-психологов,
(Более полное обсуждение
этих вопросов можно найти в работах
Равена [Raven,
1989, 1991, 1991]).

Что касается собственных
ограничений ПМР и СШМХ, то пользователи
должны понимать; (i)
ограниченную объяснительную силу самого
конструкта «интеллект»; (И) диапазон
применимости понятий «продуктивная»
и «репродуктивная» способность; и
(Ш) роль среды в развитии, проявлении и
реализации этих качеств. Чтобы избежать
излишних обобщений и тенденции придавать
чрезмерный вес малым различиям в на
шкале балльных показателей, мы настоятельно
рекомендуем, чтобы результаты тестирования
представлялись в категориях восьми
широких, вербально сформулированных
групп (например, «суперинтеллектуал»),
описанных в каждом Разделе Руководства,
или, в крайнем случае,
в виде процентильных групп.

В Исследовательском
Приложении № 3
мы
специально предостерегаем от представления
результатов в терминах IQ.
Это понятие поощряет необоснованную
веру в единство и объяснительную силу
Интеллекта как конструкта и в стабильность
и неизменность тестовых оценок. Оно
создает ложное впечатление точности и
поощряет пользователей проводить
необоснованно четкие различия. Оно
поддерживает также понятие Умственный
Возраст (понятие, которое самим своим
постоянным использованием предполагает,
что Умственный Возраст является
всеобъемлющей характеристикой,
затрагивающей все аспекты психических
способностей) и поощряет предубеждение,
что люди более сходны с теми, кто
соответствует им по умственному возрасту,
чем со своими хронологическими
ровесниками. Это привело к использованию
таких ошибочных практик как группировка
детей в соответствии с их умственным
возрастом, вместо попыток создать почву
для роста тех разнообразных талантов
и способностей, которые обнаруживаются
у людей сходного хронологического
возраста. Наконец, разброс значений IQ
питает веру в то, что человеческие
способности следуют, или должны следовать,
нормальному гауссову закону распределения.
Это допущение не подкрепляется
эмпирическими данными, но ведет к таким
сомнительным практикам, как аппроксимация
нормативных данных кривой Гаусса с
целью определить точные процентили на
хвостах распределения, где протестировано
малое количество людей. (См. Исследовательское
Приложение №3
и работу
[Raven,
1989]). Эта техника может привести к
абсурдным результатам. Один и тот же
ребенок, отвечавший на один и тот же
тест и оцененный в соответствии с одной
и той же нормативной выборкой, может
получить IQ
= 47, если результаты обрабатывались при
одной системе статистических допущений,
и IQ
= 60, если при обработке нормативных
данных была принята другая система
допущений (Dockrell,
1979). Сходным образом, при оценке достижений
и измерении познавательных способностей
использование IQ
ведет к несправедливой для определенных
этнических групп практике, такой как
намеренная ориентация на гауссово
распределение, а не на какие-то варианты
распределения типа «кривой научения»
(Mastery
Learning)
(Raven,
1989, 1991).

Независимо от того, запрашивают ли
пользователи ПРМ и СШМХ какую-либо
информацию кроме полученных баллов,
такая дополнительная информация
необходима. Отчеты о тестировании должны
уточнять, имел ли испытуемый какие-то
особые возможности для развития
оцениваемых способностей, в каких видах
специального обучения он участвовал,
а также любые другие обстоятельства,
которые могут исказить полученные
оценки. Например, у тестируемого могут
быть развиты такие формы продуктивной
и репродуктивной способности, к которым
не были чувствительны использованные
тесты.

Матрицы не
дают преимущества тем, кто использует
свои способности для разработки новых
типов невербальных стратегий. Такие
стратегии, необходимые, например, при
игре в шахматы, разработке математической
теории или управлении сложными
организациями, позволяют людям решать
задачи, которые не могут быть решены
другим путем. Это ограничение присуще,
конечно, большинству тестов, оценки
которых накапливают ошибки от получаемой
неспециалистами случайной информации,.

Если обобщить сказанное, то мы настоятельно
рекомендуем психологам анализировать

показатели продуктивной и репродуктивной
способности в контексте информации о
других

компетентностях высокого уровня и
мотивационных диспозициях испытуемого.
Дж.К.Равен

предлагал собирать такого рода информацию
с помощью клинического интервью или,
что более

i
подходит молодым людям,
при помощи метода контролируемой
проекции. Автор настоящего

• руководства предлагает
использовать Интервью Поведенческих
Событий (McClelland,
1978),

интерпретируемое в соответствии со
схемой, представленной в книге
«Компетентность в

современном мире» (Raven,
1984). В настоящее время ведется работа
по разработке (1) бланка

регистрации информации, полученной в
ходе таких интервью и путем наблюдений,
а также (2)

над созданием компьютеризированных
методик, которые позволили бы выявить
ценности

испытуемых и компетентности, которые
они демонстрируют в значимых для них
видах

деятельности.

34 В книгах
Равена «Компетентность в современном
мире» (1984) и «Трагическая иллюзия»
(1991) детально обсуждается положение,
что информацию о проявлении компетентностей
высокого уровня необходимо рассматривать
в контексте данных о том, связана ли
ситуация наблюдения с ценностями
тестируемого человека и побуждает ли
она его к демонстрации присущих ему
видов компетентности. Такая информация
может были получена при помощи различных
версий Эдинбургских
Опросников.

ДИАГНОСТИКА ОШИБОК МЫШЛЕНИЯ

Время от времени психологи
пытаются использовать ПМР и СШМХ для
выявления информации о когнитивном
стиле и природе ошибок, допускаемых при
решении задач. Хотя они и не разрабатывались
для этой цели, с помощью ПМР и, особенно,
СШМХ можно получить
некоторую полезную информацию на этот
счет.

В Матрицах
ошибочные ответы на
каждое задание не отбирались специально,
чтобы запутать испытуемого или чтобы
выявить информацию о типе ошибок,
совершаемых испытуемым. Тем не менее,
особенность совершаемых ошибок может
иногда указать на то, что именно вызывает
трудности у данного человека и, в какой-то
степени, почему возникают эти затруднения.
Таким образом, обнаруженные у индивида
ошибки могут подсказать, какие еще
дополнительные тесты следует выбрать
для более аккуратной диагностики его
интеллектуальных проблем. Сравнительные
исследования ошибочно выбранных фигур
(в частности, Van
Dam,
1973) показывают, что быпо бы полезно
привлечь сюда:

а) Гештальт-тест, предназначенный
для оценки степени способности
испытуемого воспринимать дискретные
части как единое целое, безотносительно
к его способности к рациональным
умозаключениям;

б) Тест Блоковых Конструкций,
предназначенный для оценки ориентации
с минимальными требованиями к продуктивной
способности;

в) Тест Сортировки, состоящий из простых,
четко определенных объектов, разработанный
для

оценки гибкости в мыслительном поле
как одного из видов деятельности,
существенного для достижения успеха.

Работа Мэстрё (1957) иллюстрирует эффективное
использование (а) и (б) в связи с ПМР, и в
настоящее время возобновляется начатая
Дж.К.Равеном работа с Тестом Сортировки.

Некоторые психологи интервьюировали
своих испытуемых с целью выявить, как
они воспринимают задания и используемые
ими стратегии. Существует необходимость
синтезировать работы такого рода, так
что авторы были бы рады контактам с
исследователями, заинтересованными в
работе в этой области.

Для того, чтобы более
систематически исследовать стратегии
и стили решения задач, а также природу
допускаемых ошибок, были предприняты
усилия для разработки компьютерной
версии Матриц, которая
давала бы возможность модифицировать
каждую конкретную матрицу для каждого
респондента таким образом, чтобы
определить, что именно делает ее более
или менее трудной для решения. Ожидается,
что это позволит достичь нового уровня
понимания когнитивных процессов, стилей
и природы ошибок, которое не может быть
сформировано на основе вербальных
опросов испытуемых, поскольку сам опрос
обязательно интерферирует с преимущественно
невербальным процессом решения задачи.

Что же касается СШМХ, то
существует его «Краткая Форма», в
которой респондентов просят как
определить значение каждого слова, так
и использовать его в предложении.
Качественная классификация использования
слов представлена в Разделе 5В настоящего
Руководства.

ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ ПМР И СШМХ

Хотя Прогрессивные
Матрицы
Равена и
Словарные Шкалы были
разработаны в первую очередь как
теоретически обоснованные исследовательские
инструменты и использовались более чем
в 2000 опубликованных работах, они находят
также широкое применение в образовательной,
клинической и трудовой деятельности.
Ниже будут рассматриваться общие вопросы
их валидности, а данные о валидности
данных тестов в этих конкретных сферах
будут представлены в дальнейших Разделах
настоящего Руководства.

Индексы конвенциональной
валидности сталкиваются с рядом
трудностей. Представьте, к примеру,
природу профессиональной компетентности.
Конвенциональные «исследования
валидности» коррелируют определенные
показатели профессиональной квалификации
с оценками теста способностей, например
ПМР, и обычно выявляют положительную
корреляцию. Впрочем, это больше относится
к профессиональной квалификации, нежели
к умственным способностям. Исследования,
базирующиеся на методологии «критического
случая» для идентификации поведенческих
характеристик, отличающих более
эффективных работников от менее
эффективных (будь то строители, операторы
машин, водители автобусов, врачи или
служащие общественных учреждений),
обычно приводят к заключению, что
представители этих двух групп отличаются
друг от друга многими другими качествами
помимо уровня развития продуктивной
способности. Они отличаются по способности
брать на себя инициативу, общаться и
работать в коллективе (обзор такого
рода исследований смотри в работе
[Raven,
1984]). Эти исследования также показывают,
что ни один из членов группы высокоэффективных
профессионалов не включен во все виды
деятельности и не обладает всеми видами
компетентности высокого уровня, которые
различают две эти группы. Напротив,
любая профессиональная группа включает
в себя, и обязана включать, людей, которые
обладают весьма различными структурами
мотивации и компетентности. Любая группа
выдающихся профессионалов будет включать
в себя некое количество людей, сильная
сторона которых заключается в понимании
механизмов работы организации и того,
что должно быть сделано, если дела идут
не лучшим образом, определенное число
тех, чей талант заключается в определении
видов деятельности, которые должны быть
выполнены, а также тех, кто способен
принимать на себя ответственность за
внедрение в практику новых идей.

Из вышесказанного следуют три вывода.
Во-первых, похоже что успех в любой
конкретной профессиональной группе
больше зависит от мотивационных
диспозиций, чем от самой по себе
продуктивной способности. Во-вторых,
продуктивная способность, хотя и в
разных ее проявлениях, необходима
человеку для эффективного выполнения
любой профессиональной деятельности.
И наконец, разные люди внутри одной и
той же группы могут достигать успеха
самыми разнообразными способами и,
поэтому, они обладают весьма различными
кластерами внутренне мотивированных
компетентностей.

Реальные возможности любого
человека и последствия его действий в
значительной степени зависят от того,
что делают другие. Гарднер (Gardner,
1987) также заметил, что интеллект и
предприимчивость «распределяются»
в большей степени под влиянием культуры,
нежели как индивидуальные
характеристики, а способность генерировать
новое знание и открывать новые способы
действия зависит от числа людей, вносящих
свой очень разный вклад в напряженность
групповой деятельности.

В свете этих наблюдений
ставится ясно, что, во-первых, как
подчеркивает и Мессик (Messick,
1989), задача определения валидности теста
является куда более сложной, чем полагает
большинство людей, и, во-вторых, что
способы использования теста в процедурах
отбора и расстановки людей должны быть
более утончёнными, чем принято считать.
Представляется также, что лучшее, что
можно ожидать от традиционных групповых
корреляционных исследований (в отличие
от хорошо структурированных этнографических
исследований) — это достаточно низкие
корреляции между тестовыми оценками и
теми

36 качествами
людей, которые так или иначе требуются
во многих реальных ситуациях. Не
существует такой единой способности,
которая была бы тесно связана с множеством
различных типов высоко квалифицированных
практических действий.

Те выводы, к которым мы пришли в результате
обсуждения сферы профессиональной
деятельности, в равной степени применимы
также и в образовании, и в области
клинической психологии.

Таким образом, хотя ПМР и
СШМХ действительно выявляют два очень
важных типа интересов и способностей,
а их комбинированное использование
позволяет получить значимый индекс
фактора g,
предоставляемая ими информация нуждается
в дополнении. Поскольку установлено,
что индивид может обладать различными
альтернативными талантами, необходимыми
в профессиональной или образовательной
группе, то относительно низкие оценки
по ПМР или СШМХ могут иметь для него
незначительные последствия. Напротив,
хотя многие роли могут выполняться
только людьми с высоким уровнем
продуктивной и/или репродуктивной
способностей, исключительно высокие
оценки этих способностей могут оказаться
менее существенным фактом, чем такие
свойства как готовность и способность
мотивировать людей к определенной
деятельности, отсеивать из поступающей
информации интересные идеи и внедрять
их в практику, работать скорее на благо
организации, нежели ради личного
продвижения, и прочие. Следовательно,
важно провести различение между нижним
порогом способностей и способностями,
необходимыми для эффективного выполнения
различных аспектов определенной работы.

Психологи мало продвинулись
в разработке методов осмысления и оценки
талантов, помимо тех, которые задействованы
в ПМР и СШМХ. Мы рекомендуем применение
этих тестов потому, что (а) их результаты
имеют ясную и недвусмысленную
интерпретацию; (б) их использование
поможет внести вклад в общий банк данных
и, таким образом достичь более глубокого
понимания вопросов, обсуждаемых в
настоящем разделе Руководства;
и (с) использованные
как индексы двух относительно независимых
способностей в рамках того, что обычно
рассматривалось как целостное когнитивное
образование, они будут стимулировать
разработку теоретических подходов к
выявлению, развитию и оценки множественности
талантов.

ПРИМЕНЕНИЕ ПМР И СШМХ В ОБРАЗОВАНИИ

Хотя главный выигрыш от применения ПМР
и СШМХ в сфере образования лежит в
контексте диагностики множественных
талантов, мы сначала рассмотрим более
традиционное использование данных
тестов.

Сразу нужно отметить, что ПМР и СШМХ,
использованные в сочетании, позволяют
наиболее быстрым и «дешевым»
способом получать самую значимую и
полезную информацию из того, чего можно
добиться при применении громоздких
многофакторных тестов интеллекта .
Поэтому многие учителя и другие
специалисты используют эти тесты в
своей повседневной деятельности. Они
также широко используются психологами
образования и диагностами после
проведения многофакторных интеллектуальных
тестов, с целью получения более точной
информации, которая помогает в
интерпретации противоречивых субшкальных
оценок и в идентификации причин
возникающих у ребенка проблем.

Более специфическое, исследовательское
применение этих тестов в процедурах
отбора состоит в быстрой предварительной
селекции для уменьшения числа более
детальных

6
Вполне убедительное
доказательство этого утверждения было
фактически представлено выше. Однако
Матараццо (Matarazzo,
1990) сделал более полный обзор данной
проблемы. Кратко говоря, большинство
субтестов из громозд­ких многофакторных
тестов «Интеллекта» либо настолько
высоко коррелируют между собой, что
подрывает доверие в их заявленной
независимости, либо демонстрируют
недостаточную надежность, валидность
и различительную мощность, чтобы их
можно было использовать для диагностической,
консультационной или коррекционной
работы.

37 диагностических
процедур, необходимых для определения
обоснованности направления ребенка на
специальные, в том числе и углубленные,
программы обучения. ПМР использовались
также в качестве одного из альтернативных
критериев для включения
ребенка в образовательные программы
для одаренных, наряду
с такими критериями
как академические достижения,
исполнительское музыкальное мастерство,
атлетическая подготовка, степень
артистизма и лидерский потенциал. При
таком использовании ПМР обеспечивают
включение а программы для одаренных
тех детей, которые обладают несомненными
способностями, но, кроме того, отличаются
от имеющих высокие школьном оценки
большей склонностью задавать вопросы,
наблюдать и делать собственные выводы
и меньшим желанием выучивать материал,
заданный преподавателями,. Такие
программы имеют то преимущество, что
они еще больше, чем «ускоренные
академические» программы, стимулируют
экспериментирование учителей с подходами,
ориентированными на множественность
талантов, и в этом русле способствуют
разработке способов идентификации,
поощрения и признания различных типов
одаренности. Если как
элемент батареи тестов в процедуре
отбора используется также и СШМХ, то
можно достичь более широкого признания
факта, что люди, которые лучше других
способны генерировать новые «озарения»,
не обязательно так же успешны в выражении
своих идей в словах (и наоборот). В свою
очередь, это может поощрить школьные
учреждения меньше фиксироваться на
формировании вербальных навыков и с
больше способствовать развитию и
признанию других способностей. Как
показали в своих работах Хоуп (Норе,
1985), Натдженс {Nuttgens,
1988), Хомский (Chomsky,
1987), Шон (Schon,
1987), Хоган (Hogan,
1990) и Равен (Raven,
1984, 1993), использование показателей
академической успешности в качестве
основного критерия при отборе старшего
административного персонала ведет к
выдвижению на влиятельные посты
непропорционально большого числа людей,
чьи основные таланты состоят в способности
оказать благоприятное впечатление на
аудиторию своими речами.

ПМР нашли также применение в диагностике
и лечении различных форм дизлексии.
Некоторые из детей, испытывающих
серьезные трудности при выполнении
школьных заданий, получают высокие
баллы либо по ПМР, либо по СШМХ, либо по
обоим тестам. Реакции педагогов на таких
детей весьма разнообразны: некоторые
ищут возможности для решения их проблем
в самой школьной работе, другие стараются
найти способы помочь таким детям через
развитие других талантов, демонстрируя
им доверие и поддержку.

Более широкий вывод из этого
последнего наблюдения состоит в том,
что психологи должны сфокусировать
свои усилия на противостоянии удушающей
практике чисто академической оценкой
талантов, которые могли бы быть реализованы
и признаны в школах. Хотя точка зрения,
что детей не следует наказывать за
неспособность читать, писать или считать,
находит все более широкое признание, в
большинстве случаев остается непоколебимым
мнение, что традиционные формы «учебной
способности» имеют исключительную
важность. Существует множество причин
оспорить это мнение. То, что проходят в
школах как «научное» знание, обычно
устаревает к тому моменту, когда его
начинают преподавать, бесполезно для
решения насущных проблем и забывается
к тому времени, когда в нем возникает
необходимость (Goodlad,
1984; Raven,
1977). Кроме того, количество потраченных
на «академическое» образование
лет не позволяет сделать достоверного
прогноза относительно будущей
профессиональной деятельности (Hunter
and
Hunter,
1984; Taylor
et
al,
1963; Berg,
1973; Jepson,
1951; Hoyt,
1965). Похоже, что в поиске путей преодоления
диэлексии проблема состоит не столько
в том, чтобы разработать диагностические
и коррекционные приемы, которые несомненно
нужны учителям для обучения чтению, и
даже не в том, чтобы отыскать способы,
посредством которых наиболее «умные»
дизлексики смогли бы продемонстрировать
свои учебные достижения, а в разработке
понятий, средств и социальных условий,
необходимых для внедрения образовательных
программ, ориентированных на множественность
талантов.

КЛИНИЧЕСКОЕ ПРИМЕНЕНИЕ

Клинические расстройства обычно
выявляются и диагностируются на основании
внешних проявлений индивидуальных
функций, либо снижения ранее зафиксированного
уровня способностей. При том, что
общепринятые психометрические показатели
надежности и аалидности ПМР и СШМХ у
здоровых людей весьма высоки, у больных
следует ожидать значительную
несогласованность результатов. В
большинстве случаев не наблюдается
устойчивого снижения продуктивной или
репродуктивной способности, хотя обе
они могут быть нарушены при некоторых
заболеваний. Низкие и противоречивые
результаты выполнения тестов могут
быть обусловлены и другими факторами
— низкой мотивацией и отсутствием
интереса к предлагаемым заданиям.

Наиболее выраженные и устойчивые
нарушения наблюдаются в случаях
церебральной дисфункции. ЦПМ, в частности,
широко используется для выявления
врожденной или обусловленной травмой
задержки психического развития, а также
на популяции старшего возраста для
выявления лиц, страдающих старческой
деменцией. На взрослой популяции ПМР
могут использоваться для контроля за
степенью выраженности функциональных
отклонений, а также за процессами их
восстановления или ухудшения. СШМХ в
форме «Шкалы Определений» является
важным инструментом для выявления и
анализа специфики вербальных дисфункций
(например, при афазиях).

Нарушение нормального функционирования
свойственно также тем, кто страдает от
последствий алкогольной или лекарственной
интоксикации. Улучшение индивидуального
функционального состояния может быть
оценено с помощью серийного тестирования,
а некоторые исследователи используют
анализ ошибок по отдельным заданиям с
целью обнаружения структуры неправильных
ответов.

Более детальный обзор по
использованию ПМР и их модификаций в
качестве нейропсихологической
диагностической методики можно найти
в Исследовательском
Приложении №3
издания
1990 года.

Значительный объем работы был проделан
в свое время при помощи СПМ и СШМХ для
описания и исследования умственных
отклонений у больных шизофренией.
Поскольку у таких больных нарушения
мышления являются клиническим симптомом,
а вербальные абберации -очень частое
явление, то комбинация данных тестов
хорошо подходит для подобных исследований.
Разрушение сложных мыслительных
процессов и доминирование свободных
ассоциаций — достаточная причина для
ухудшения решения заданий СПМ. Похожее
имеет место и для СШМХ: выбор неадекватных
синонимов на основании сходства,
рифмуемости или других иррелевантных
признаков может указывать на трудности
мышления или речевого выражения.

Менее очевидным и часто упускаемым из
виду при серьезных отклонениях является
нарушение функций, обусловленное
эмоциональными и мотивационными
факторами. Высокий уровень тревожности
и/или депрессивное состояние могут
оказывать негативный эффект на успешность
выполнения теста; поэтому крайне важно
распознать эти симптомы у лиц, перенесших
травму головного мозга или находящихся
в острой фазе шизофренического процесса.
Проявления тревоги или депрессии могут
различным образом напоминать симптомы
функциональных и органических психозов.
Высокая тревожность может выражаться
в сомнениях, ограничивающих мыслительные
процессы, в блокировании решения очевидно
простых задач, а также в неспособности
осуществлять мысленные вращения.
Тревожный испытуемый часто торопиться
и некритично выбирает первый попавшийся
ответ вместо того, чтобы сначала изучить
всю доступную информацию. Внимательный
психолог должен учитывать влияние
тревоги и депрессии на выполнение теста
и остерегаться соблазна сходу заключить,
что наблюдаемые нарушения деятельности
обусловлены более серьезными причинами.

39 Больные,
страдающие замедленными депрессивными
реакциями, из-за замедленного темпа
мышления обычно менее успешны при
выполнении тестов с ограничением времени
и настроены скорее на простые ответы,
нежели на преодоление трудностей.
Словесная беглость также часто снижается,
что выражается в неравномерности ответов
при выполнении СШМХ.

В дополнение к клиническим индикаторам,
при интерпретации результатов теста
(в частности, при обследовании
правонарушителей) должны приниматься
во внимание мотивационные факторы.
Нельзя призывать к оценке способностей,
если тесты выведены за рамки повседневной
жизни. Для многих клинических больных
психологическое тестирование
представляется маловажным, неприятным
и тревожащим мероприятием в их привычном
расписании жизни. Когда боль, сомнения,
депрессия, тревога или сама задача
выживания занимают все мысли пациента,
ему вряд ли удастся сосредоточить своё
внимание на решении совершенно
искусственных задач.

Из вышесказанного следует, что для
проверки валидности результатов
клиницисты должны не только проявлять
осторожность при использовании полученных
оценок и нормативных данных, но и
учитывать таблицы ожидаемых распределений
оценок по субшкалам.

ПРИМЕНЕНИЕ В ПРОФЕССИОНАЛЬНОЙ СФЕРЕ

Существует несколько основных проблем,
связанных с определением тестовой
валидности в профессиональной сфере:

(а) Проблемы,
связанные с критерием успешности.
Качества, необходимые
для «хорошего» выполнения работы,
зависят от критериев, принятых для
оценки успешности ее выполнения.
Различные качества требуются, например,
для обеспечения быстрого служебного
роста в организации, для обеспечения
выживания этой организации при введении
на рынок новых продуктов, для обеспечения
ее роста посредством финансовых
и/или политических манипуляций, или
для обеспечения выживания общества в
целом. Люди, способные обойти других в
завоевании доверия со стороны начальства,
совсем не обязательно будут столь же
успешны в раскрытии энергетического
потенциала и талантов своих подчиненных
и, на самом деле, они сами часто
выдвигаются за счет концентрации
своих умственных способностей на
создание видимости «высокоэффективной
работы» их подразделения — за счет
сокращения персонала, сокращения
времени работ, разрушения сети
контактов, необходимых для развития
организации в целом, увольнения
несогласных с их методами работы и тех,
кто может оспорить их собственные
взгляды или конкурировать с ними за их
место. (Hogan,
1990; Hogan et al, 1990; Chomsky, 1987; Nuttgens, 1988; Raven, 1984;
Raven and Dolphin, 1978)

(б) Проблемы,
вытекающие из использования неадекватных
описаний и средств анализа работ.
Виды
действий, необходимые для эффективного
выполнения работы, могут отличаться
от тех, которые обозначены в ее описании,
и, поэтому, они могут быть упущены из
виду в процессе оценки достоверности
процедур отбора персонала. (Fivars
and Gosner, 1966; McClelland and Dailey, 1973; Klemp, Munger and
Spencer, 1977; Raven, 1984; Spencer and Spencer, 1993; Taylor and
Barren, 1963).

(в) Проблемы,
возникшие из-за использования в прошлом
неадекватных процедур отбора.
Люди,
способные лучше других выполнять
определенную работу, могут (вольно
или невольно) оказаться исключенными
из числа принятых на это рабочее место.
Если такое происходит, то становится
невозможным продемонстрировать важность
необходимых для данной работы качеств
{Berg,
1973; Holland
and
Richards,
1965; Hope,
1984; McClelland,
1961; Raven,
1984; Taylor,
Smith
and
Ghiselin,
1963).

40 (г)
Проблемы, порождаемые
принципиальной невозможностью
найти субъекта деятельности, приведшей
к определенным результатам. В
большинстве
организаций крайне трудно приписать
наблюдаемые результаты действий
какому-либо конкретному человеку или
группе лиц (смотри Day
and
Klein,
1987), особенно если условия постоянно
меняются, а последствия тех или иных
действий могут обнаруживаться годы
спустя. Это создает большие трудности
в получении точной информации о
людях, чья работа безусловно идет на
благо организации, а также в проведении
различий между теми, кто способствует
успеху организации, и теми, кто
способен только производить хорошее
впечатление, а затем ухитряется покинуть
организацию до того, как его ошибки
будут обнаружены.

(д) Внешние
ограничения.
Структура
организации и определенные ожидания
со стороны окружающих могут создавать
людям препятствия для совершения
ими действий, необходимых для
эффективного выполнения работы.

(е) Изменения
с течением времени.
Люди
по-разному выполняют одну и ту же работу
в различное время суток или в разные
периоды своей жизни. Они могут, к примеру,
выполнять рутинные действия в одно
время дня и творческие задачи — в
другое. Они могут разрабатывать
технологические новинки в начале
своей карьеры и участвовать в
политических процессах, контролирующих
финансирование таких инноваций, в
более поздние периоды своей жизни.

(ж)
Эффективность как
качество культуры.
Эффективное
выполнение любой профессиональной
деятельности часто требует участия
широкого круга людей с очень разными
способностями, как непосредственно
вовлеченных в выполнение этой работы,
так и косвенно связанных сданной работой
в рамках той же организации. Предприимчивость,
в частности, есть скорее культурная,
нежели личностная характеристика.
(Gardner,
1987; McClelland,
1961; Raven,
1984; Roberts,
1968; Rogers,
1962/83; Taylor,
Smith
and
Ghiselin,
1963).

Несмотря на указанные
трудности, было установлено, что оценки
по ПМР и СШМХ, в отличие от многих других
тестов, действительно связаны с
управленческой эффективностью, а именно:
с текучестью кадров и финансовым
оборотом, с прибыльностью фирмы и с её
способностью выживать во время финансовых
или иных кризисов. Оба теста предсказывают
разные способы оказания влияния на эти
процессы. Способность находить новые
способы мышления и действия — то, что
Кетон (Kirton,
1980) назвал «Инновацией» — лучше
предсказывается с помощью ПМР, тогда
как способность к адаптации лучше
предсказывается СШМХ. Для одной группы
менеджеров (например, социальных
работников) важнее словесная беглость,
но для многих других более значима
способность находить выход в новых или
затруднительных ситуациях. Качества,
необходимые для решения каждой конкретной
задачи, в значительной степени зависят
от преобладающих обстоятельств.
Репродуктивное поведение часто хорошо
работает при неизменных условиях, но
во время «больших перемен» (как
например, в периоды войн или быстрых и
глубоких экономических преобразований)
воспроизведение традиционных способов
действия может оказаться губительным.
Вот почему для социальных служб так
важно нанимать и выдвигать людей,
обладающих различными способностями
и мотивами. К сожалению, людям с
определенным набором способностей и
системой ценностей бывает обычно крайне
трудно понять, не говоря уже о том, чтобы
оценить, тех, кто имеет другие взгляды
или способности.

Хотя мы посвятили большую
часть времени обсуждению вопросов
отбора менеджеров и трудностям такой
работы, связанным с достоверностью
тестовых показателей, это отнюдь не
единственная область, в которой данные
тесты показали свою полезность. Как
будет видно из Раздела
7
и Исследовательского
Приложения № 4,
эти
тесты были валидизированны в самых
различных условиях и на многих
профессиональных группах. Обобщая
полученные данные методами мета-анализа
и анализа генерализованной валидности,
исследователи (Ghiselli,
1966;

41 Hunter
and
Hunter,
1984) пришли к выводу, что
тесты интеллектуальных способностей
предсказывают профессиональные
достижения для восьми широких классов
рабочих специальностей: управленцев,
клерков, продавцов, водителей транспорта,
работников сферы обслуживания, моряков,
сотрудников служб охраны порядка и
индустриальных рабочих.

Хотя, как мы видели,
прогностическая валидность успеха в
профессиональной сфере является
сравнительно низкой для ПМР и СШМХ (в
абсолютных величинах, но не в сравнении
с другими тестами), Кендрик и Фандер
(Kendrick
and
Funder,
1988) показали, что использование небольшого
числа независимых тестов с такой
прогностической валидностью, или похожих
тестов в процедуре последовательного
принятия решения, может иметь накопительный
эффект, ведущий к огромной финансовой
прибыли. Более того, использование таких
тестов в сочетании с методами
Диагностического Центра (Assessment
Centre)
или с Интервью Жизненных Событий
{Behavioural
Event
Interviewing)
позволяет специалистам, работающим с
персоналом, сконцентрировать свое
внимание на качествах, которые не могут
быть напрямую оценены с помощью доступных
на данный момент формальных инструментов.

Еще более оптимистичный вывод об
использовании ПМР и СШМХ при отборе
персонала можно сделать, если, отвлекаясь
от задачи валидизации теста в рамках
определенной профессиональной группы,
включить эту проблему в более широкую
перспективу.

Жаку (Jaques,
1976, 1989) утверждал, что многие виды
компетентности, имеющие, как показывает
анализ критических случаев (наподобие
тех, которые приведены книге Равена
«Компетентность в современном мире»),
решающее значение для эффективного
выполнения широкого круга профессиональных
задач, сильно зависят от той разновидности
«когнитивных способностей, которая
измеряется Матрицами»
(т.е. вкупе с эмоциональными
и волевыми компонентами). Эти компетентности
включают в себя способность сформировать
собственное понимание механизмов работы
своей организации и своей роли в ней, в
том числе и способность взять на себя
инициативу; способность понимать
принципы работы экономических и
политических систем и способность
включаться в их работу на благо собственной
организации; способность выявлять
мотивы и таланты подчиненных, а также
способы их наилучшего размещения с
точки зрения развития тех талантов и
усиления тех мотивов, которые полезны
организации.

Жаку приходит к выводу, что высокий
уровень когнитивных способностей
является критическим условием эффективного
выполнения тех видов деятельности, о
которых шла речь выше. Если он прав, то
ПМР должны лучше показывать себя при
прогнозировании способности получить
и сохранить работу, требующую высокого
уровня профессионализма, нежели при
прогнозировании достижений в рамках
любой конкретной профессиональной
группы. Данные в поддержку этого
предположения можно найти в целом ряде
работ, а наиболее яркие и убедительные
из них приведены в работе Хоупа (Норе,
1985), который установил, что в США и
Великобритании две трети социальной
мобильности (перемещений вверх или вниз
по социальной лестнице) могли быть
предсказаны на основании тестовых
показателей общего интеллекта 11-летних
детей.

Если Жаку прав, утверждая,
что когнитивные способности наиболее
тесно связаны с уровнем получаемой и
сохраняемой работы, то из это вовсе не
следует, что люди, получившие самые
высокие тестовые баллы, будут наилучшими
исполнителями любой работы. Должен 4
существовать некий оптимальный для
данной деятельности диапазон оценок.
Исследование, выявляющее и описывающее
подобный эффект, было проведено
Дж.К.Равеном и его коллегами (Crichton
Royal,
1957) на выборке радиоинженеров. Вывод,
что взаимосвязь между способностью и
успешностью является криволинейной,
не противоречит утверждению Хантера о
том, что во всех профессиональных группах
эти связи являются линейными. Эти два
утверждения могут быть согласованы,
если вспомнить проблему критериев. В
исследовании Равена результат состоял
не в том, что служащие с высокими
показателями выполняли работу хуже —
на самом деле, эти люди часто сами
оставляли службу.

42 Хорошей
иллюстрацией взаимного перекрытия
качеств, измеряемых тестами, и тех,
которые в действительности требуются
для эффективного выполнения определенных
видов деятельности, является одно
неопубликованное исследование, показавшее
возможность прогноза успешности в
компьютерном программировании на основе
данных по ППМ, полученных по процедуре
без ограничения времени. Обе задачи
требуют высокой настойчивости, изобретения
способов решения задач, внимания к
деталям, а также желания и способности
все тщательно проверить, прежде чем
совершить очередное действие.

Из нашего обсуждения следует, что
эффективное развитие и размещение
человеческих ресурсов зависит от степени
развития организационной психологии
и оценочных систем. Необходимы новые
способы мышления и новые языки описания
взаимодействия этих двух сфер. Авторы
будет рад контактам с любыми специалистами,
работающими в этих областях.

ИСТОРИЯ СОЗДАНИЯ ПРОГРЕССИВНЫХ МАТРИЦ
РАВЕНА

Прогрессивные Матрицы
Раввна
могут быть
определены как «тесты наблюдательности
и ясности мышления». Каждая задача
на общей Шкале является «родительницей»,
или «источником» определенной
системы мышления, а порядок, в котором
эти задачи предъявляются, обеспечивает
обучение данному методу работы.

ТРИ ФОРМЫ МАТРИЦ

Первой формой теста
Прогрессивных Матриц
были так называемые
Стандартные серии. Они разрабатывались
с целью охватить весь диапазон развития
данной способности — от маленьких детей
и испытуемых с интеллектуальной
недостаточностью до самых успешных
взрослых и престарелых. Эти серии
впоследствии были расширены, чтобы
обеспечить возможность более тщательного
анализа способностей, относящихся к
нижнему или верхнему концам диапазона.
Для этой цели были созданы Цветные
Прогрессивные Матрицы
(ЦПМ)
и Продвинутые
Прогрессивные Матрицы
(ППМ).
Первые охватывают оценки нижнего
квартиля полного диапазона способности,
а вторые — верхнего. Все вместе эти тесты
позволяют решить большую часть возникающих
проблем.

Шкала Стандартных
Прогрессивных Матриц
разделена
на пять серий по двенадцать задач в
каждой. Каждая серия начинается с задачи,
которая является более-менее самоочевидной,
и строится так, что каждая последующая
задача учитывает сделанное раньше, но
с постоянно увеличивающейся сложностью.

Серия A: Использован принцип установления
взаимосвязи в структуре матриц. Здесь
задание заключается в дополнении
недостающей части основного изображения
одним из приведенных в каждой таблице
фрагментов. Выполнение задания требует
от обследуемого тщательного анализа
структуры основного изображения и
обнаружения этих же особенностей в
одном из нескольких фрагментов. Затем
происходит слияние фрагмента, его
сравнение с окружением основной части
таблицы. Серия А — диагностирует
способность к дифференциации основных
элементов структуры и раскрытию связей
между ними, идентификации недостающих
частей фигуры и сличению ее с представленными
образцами.

Серия В: Построена по принципу аналогии
между парами фигур. Обследуемый должен
найти принцип, соответствен но которому
построена в каждом отдельном случае
фигура и, исходя из этого, подобрать
недостающий фрагмент. При этом важно
определить ось симметрии, соответственно
которой расположены фигуры в основном
образце. В серии В оценивается способность
к аналогии.

Серия C: Содержит сложные изменения
фигур в соответствии с принципом их
непрерывного развития, обогащения по
вертикали и горизонтали, построена по
принципу прогрессивных изменений в
фигурах матриц. Эти фигуры в пределах
одной матрицы все больше усложняются,
происходит как бы непрерывное их
развитие. Обогащение фигур новыми
элементами подчиняется четкому принципу,
обнаружив который, можно подобрать
недостающую фигуру. Серия С — диагностирует
способность выявлять сложные изменения
закономерностей непрерывного развития,
обогащения по вертикали и горизонтали.

Серия D: Составлена по принципу перестановки
фигур в матрице по горизонтальному и
вертикальному направлениям. Обследуемый
должен найти эту перегруппировку,
происходящую в горизонтальном и
вертикальном положениях.

Серия D — оценивает способность к
пространственной перестановке фигур
в матрице по горизонтальному и
вертикальному направлениям.

Серия Е: Наиболее сложная, основана на
принципе разложения фигур основного
изображения на элементы. Недостающие
фигуры можно найти, поняв принцип анализа
и синтеза фигур. Процесс решения заданий
заключается в анализе фигур основного
изображения и последующей сборке
недостающей фигуры по частям. Серия Е
— выявляет способность к аналитико-синтетической
мыслительной деятельности.

Эта процедура предоставляет испытуемому
пять возможностей, чтобы познакомится
с проблемным полем и методом мышления,
необходимым для решения задач. Таким
образом, стандартная процедура проведения
теста включает встроенную тренинг-программу
и позволяет оценить способность к
научению через опыт, или «потенциал
обучаемости». Циклическая структура
также дает возможность оценить
устойчивость интеллектуальной
деятельности испытуемого в ходе
реализации пяти последовательных
мыслительных стратегий. Длительность
теста также была тщательно подобрана,
так чтобы она позволяла оценить
максимальные способности испытуемого
к когерентному восприятию и обоснованным
суждениям, но не вызывала чрезмерного
утомления и не делала процедуру излишне
громоздкой.

Цветные Прогрессивные
Матрицы
(ЦПМ),

Серия А: Обследуемый должен дополнить
недостающую часть изображения. Считается,
что при работе с матрицами этой серии
реализуются следующие основные
мыслительные процессы:

• дифференциация основных элементов
структуры и раскрытие связей между
ними.

• идентификация недостающей части
структуры и сличение ее с представленными
образцами.

Серия АВ: Процесс решения заданий этой
серии заключается в анализе фигур
основного изображения и последующей
сборки недостающей фигуры
(аналитико-синтетическая мыслительная
деятельность).

Серия В: При работе с матрицами
этой серии испытуемый находит аналогии
между двумя парами фигур. Он раскрывает
этот принцип путем постепенной
дифференциации элементов.где дополнительная

Серия АЬ помещена между Сериями А и В,
разработана для более точной оценки
интеллектуальных процессов у маленьких
детей, умственно отсталых людей и лиц
пожилого возраста. Цветной фон матриц

привлекает внимание,
вызывает спонтанный интерес к тесту и
устраняет необходимость давать слишком
подробные вербальные инструкции.

Успешность решения Серии
А зависит от способности испытуемого
дополнять непрерывные структуры, которые
по мере усложнения заданий в серии
изменяются сначала в одном, а потом в
двух направлениях одновременно.
Успешность решения
Серии АЬ зависит от способности
испытуемого видеть дискретные фигуры
как пространственно связанное целое и
выбирать фигуры, которые дополняют
пространственную схему.
Серия В содержит
достаточное количество заданий,
использующие аналогии и определяющие,
способен ли человек думать таким образом.
Последние несколько заданий Серии В по
трудности сопоставимы с первыми задачами
Серий С, D,
и Е Стандартных Прогрессивных Матриц.
Чтобы облегчить испытуемому переход
от Цветных к Стандартным Матрицам,
последние несколько заданий Серии В
напечатаны в Цветном
варианте точно также как и в Стандартном,
т.е. черно-белыми. Таким
образом испытуемый, успешно решивший
эти задания, может не прерываясь перейти
к выполнению заданий Серий С, D,
и Е Стандартных Прогрессивных Матриц,
чтобы его интеллектуальные способности
можно было оценить с большей точностью.
Когда возможно, результаты Серии АЬ
могут быть просто опущены, а итоговый
результат считается по Стандартным
пяти сериям для определения процентильного
уровня в соответствии с нормами для
Стандартных Матриц. Обычно он согласуется
с процентильным уровнем по Сериям А, АЬ
и В, но по мере созревания интеллектуальной
способности формировать сравнения и
рассуждать по аналогии оценки СПМ
становятся более надежными и психологически
валидными.

В период до окончательного созревания
способности формировать сравнения и
рассуждать по аналогии или в случаях
её нарушения ЦПМ позволяют измерить
степень развития или нарушения умения
испытуемого наблюдать и ясно мыслить.
После того, как эта способность созреет,
СПМ измеряют интеллектуальные способности
испытуемого относительно других людей
того же возраста.

Иногда важно оценить скорость
аккуратной интеллектуальной работы
испытуемого, в отличие от уровня общей
его способности к упорядоченному
мышлению. Поскольку СПМ организованы
в пять серий, в каждой из которых простые
задания постепенно сменяются всё более
трудными, то скорость интеллектуальной
работы испытуемого не может быть измерена
количеством заданий, решенных за
фиксированный промежуток времени.
Использование СПМ с ограничением общего
времени решения ведет к получению
нестабильных и невалидных распределений
оценок, поскольку некоторые люди
посвящают непропорционально большое
время решению последних и наиболее
трудных заданий, скажем, Серии D,
тогда как другие просто пропускают их
и значительно повышают свои оценки за
счет быстрого и правильного решения
наиболее легких задач Серии Е. Эта
проблема может быть снята путем
ограничения времени отдельно на каждую
серию теста. До недавнего времени это
была стандартная процедура проведения
теста ПМР в Австралии. Но эта процедура
весьма обременительна, а необходимая
информация может быть получена проще
с помощью Серии I
Продвинутых Прогрессивных
Матриц.

Продвинутые Прогрессивные
Матрицы
(ППМ) позволяют
решить следующие задачи: (i)
диагностика наиболее развитой формы
продуктивной способности; (и) оценка
распределения тестовых баллов для
верхних 25% общей популяции; (ш) более
точное измерение скорости интеллектуальной
работы испытуемого. Серия I
включает только 12 задач. Она используется
главным образом для задания проблемного
поля и обучения методу работы. Но ее
можно использовать и для быстрого
получения индекса продуктивной
способности или эффективности, проводя
тестирование в условиях ограниченного
или не ограниченного времени. Обычно
за Серией I
сразу же следует Серия II,
хотя иногда испытуемым позволяют взять
первую серию домой для практики за
несколько дней до тестирования. Серия
II
включает 36 заданий, расположенных в
порядке возрастания трудности.
Соответственно, испытуемому не нужно
пробовать решить каждую задачу прежде,
чем прекратить работу. При тестировании
с ограничением времени Серия II
может быть использована для оценки
«интеллектуальной

эффективности». Хотя интеллектуальная
эффективность, в общем, тесно связана
со способностью к дисциплинированному
мышлению, но бывают и исключения, так
что эти две способности не следует
смешивать.

Индекс интеллектуальной эффективности
особенно полезен для оценки пригодности
человека к работе, требующей быстрых и
точных суждений, или, что часто требуется
в клинической практике, для оценки
заторможенности мышления больного.

Проведенная в 1992 году Стандартизация
ППМ показала, что на сегодняшний день,
вследствие обсуждавшегося ранее
повышения норм при смене поколений, ППМ
дают отличную дифференцировку по всей
взрослой популяции (а не только по
верхним 20%) и такое распределение
показателей, которому многие могут
только позавидовать. Тем не менее, его
нельзя безоговорочно рекомендовать
для широкого использования. Причина
такой осторожной рекомендации отчасти
в том, что циклический формат СПМ
предоставляет испытуемому пять
возможностей понять что от него требуется,
и выработать подходящий метод работы.
Таким образом, если предполагается, что
отдельным испытуемым пойдет на пользу
практика, то следует предпочесть СПМ.
Другими достоинствами СПМ являются:

-испытуемые
с низкими оценками сталкиваются с
меньшим числом заданий недоступного
для них уровня сложности и, как следствие,
получают более позитивный опыт,

— для СПМ
собрано больше исследовательских
данных, включая отдельные нормы для
разных суб-популяций,

-поскольку
тестирование проводится без ограничения
времени, то такая ситуация является
менее стрессовой для испытуемых.

РАЗРАБОТКА И СТРУКТУРА ОТДЕЛЬНЫХ ЗАДАНИЙ

Первые серии экспериментально
использовавшихся Матриц
представляли собой
девяти фигурные композиции, напоминавшие
тестовый материал Спирмана, с той лишь
разницей, что если Спирнан просил
испытуемых идентифицировать правило,
которое лежало в основе композиции, то
в матрицах Равена задача состояла в
нахождении пропущенной фигуры. Взрослые
легко понимали такую задачу, даже если
они не были способны ее решить. Маленькие
же дети, напротив, часто не могли уяснить,
что же от них требуется, даже если им
объясняли суть проблемы. Когда похожие
задачи были предъявлены им в виде
сплошного структурированного рисунка
с вырезанным фрагментом (как в Серии
А), те же самые дети увидели, что же им
нужно делать. Было показано, однако, что
опыт работы с задачами такого типа не
помогал им решать задачи, построенные
на взаимосвязях между четырьмя фигурами.
Хотя представлялось вполне возможным
представить ход возрастного развития
интеллектуальных способностей как
относительно равномерный процесс, было
обнаружено, что решение задач типа тех,
которые включены в Серию В, нуждалось
в увеличении зрелости интеллектуальной
деятельности более чем на один «порядок».
Также выяснилось, что опыт решения
последовательности задач одного
«порядка» совсем не обязательно
обучает ребенка решению задач другого
«порядка». Более новые и систематические
исследования (Andrich,
1989; Guthke
and
Lehwald,
1984) подтверждают это наблюдение.
Упражнение, опыт и обратная связь
уменьшают обычно только те ошибки,
которые сделаны до последнего правильно
решенного задания.

На рисунке 07 изображена «конкретная»
задача, которая встает перед каждым
человеком, в буквальном или переносном
смысле «пересекающим дорогу». Он
может быть использован для иллюстрации
решений разного «порядка», возможных
на разных уровнях восприятия.

45 Сравнительное
исследование детских ответов на задания
такого типа показали, что выбираемое
решение определяется контекстом того
«проблемного поля», в котором
ребенок постигает задачу (Miller
and
Raven,
1939).

Рисунки О8 и О9 изображают принципиально
ту же самую задачу, что и рисунок О7.
Разница только 8 форме представления.
На рисунке О8 задача представлена в
форме дискретных объектов, а на рисунке
О9 — через абстрактные символы. Отличие
последних от изображенного на рисунке
О7 — в способах построения умозаключения,
зависящих от концептуального поля, в
контексте которого рассматривается
проблема. Для рисунка О8 это поле задается
непосредственным восприятием, а для
рисунка О9 — ассоциативным воспроизведением.
Чтобы как следует уразуметь задание на
рисунках О8 или О9, необходимо спросить:
Что представлено на рисунке? Что из
этого может следовать? Какой из выводов
будет правильным и почему?

Рис. О7. «Конкретная»
задача, требующая завершения.

Мы можем следующим образом проиллюстрировать
важность проблемного поля для выбора
правильного решения:

Рис. О8. Дискретные фигуры.

Рис.О9. Абстрактные символы.

46

Наиболее редкий способ
реагирования на задачи такого типа
может быть обозначен как пассивное
восприятие.
Он
встречается только у очень маленьких
или очень глупых детей и у очень старых
людей. Фигуры не воспринимаются ими как
какая-то проблемная ситуация. Такие
испытуемые просто смотрят на то, что им
предъявляют, и не понимают, что отсюда
следует.

Более частым способом ответа
маленьких детей или «примитивных»
людей является активное
повторение
или
воспроизведение
структуры.
Иногда
незавершенная матрица описывается даже
как «рисунок на обоях». В редких
случаях повторяющаяся структура такого
типа может быть ориентирована диагонально
по отношению к наблюдателю, как показано
на рисунке О10. Чаще же структура
ориентирована горизонтально или
вертикально, как на рисунке 011.

Еще более часто встречаются
ответы, обнаруживающие серийные
изменения
в проблемном
поле. Это может быть одномерное изменение,
как в случае арифметической прогрессии,
изображенной на рисунке О12. Однако,
более типичным способом ответа, особенно
у взрослых испытуемых, является тот,
который производит «продуктивные»
изменения проблемного поля. Такие
изменения проиллюстрированы численными
значениями геометрической прогрессии
на рисунке О13, хотя это отнюдь не
единственный способ, посредством
которого такие взаимосвязи могут быть
выражены в матрице.

Люди склонны думать, что если они
логически обосновали одну линию
рассуждения, то все другие решения кроме
их собственного должны быть ошибочными.
Прежде чем принять такого рода вывод,
мы должны выяснить не только содержание
проблемы, но кое-что и о контексте, или
«поле» выделенной проблемы. Если,
например, мы представляем рисунок О7
как

схему реальных автодорог
и опасных участков (кружки), то логика
может подсказать
идеальное решение
в виде «развязки типа кленового
листа». Если это не практично,
то «круговая»
развязка может быть наилучшим возможным
решением.

В тесте Прогрессивных
Матриц
последовательность
предъявления заданий развертывает
соответствующее проблемное поле
постепенно и, таким образом, обеспечивает
обучение данному методу работы. И сама
умственная деятельность, и та ступень
интеллектуальной организации, на которой
находится испытуемый, одновременно
определяют структурный «порядок»
возникающего проблемного поля. Выбираемое
решение дает представление о качестве
интеллектуальной организации и,
следовательно, представляет значительный
психологический интерес.

В этой связи важны пространственные
взаимоотношения между незавершенной
матрицей и альтернативными вариантами
решения, так как местоположение последних
влияет на выбор испытуемого. Пилотажные
исследования показали, что более
удовлетворительным расположением
альтернативных решений является позиция
под матрицей, а не сбоку. Кроме того,
Миллер и Равен (1939) пришли к выводу, что:

«Частота
выбора одной из альтернатив частично
зависит от ее собственной позиции, и
частично — от взаимного расположения
других вариантов решения. Испытуемые
часто воспринимают матрицу и набор
вариантов решения как целое. Внимание
сосредотачивается на разрыве в матрице,
который должен быть заполнен, а частота,
с которой выбирается определенная
альтернатива, зависит от объема уделяемого
ей внимания. Было обнаружено, что
испытуемые имели склонность к более
внимательному изучению всех возможных
вариантов решения, если заведомо
ошибочные фигуры располагались на
наиболее удобных для рассматривания
позициях. Если знакомая фигура,
повторяющая, например, часть матрицы,
расположена в центре внимания, то тогда
потребуется меньше усилий, чтобы изучить
все варианты решения в поисках правильного
ответа. Когда испытуемый имеет дело с
заданиями умеренной трудности, то
расположение вариантов ответа оказывает
незначительное (или вовсе никакого)
влияние на процент правильных ответов,
но когда задачи становятся слишком
трудными для него, то правильные ответы
угадываются чаще, когда они расположены
в наиболее выгодной позиции.»

Имея в виду что контекст, или проблемное
поле оказывает влияние на порядок
предпочтения альтернатив ответа,
уверенное умозаключение по аналогии
предполагает достижение определенной
степени интеллектуальной сложности,
которую редко можно встретить у маленьких
детей. Однако, поскольку большинство
взрослых полностью полагаются именно
на этот способ рассуждения, им трудно
представить себе, что дети могут думать
совершенно иным образом.

Научение Методу Работы

Важно понять причины,
побудившие авторов Прогрессивных
Матриц
придать тесту
циклический формат.

Как указывает название
теста, внешняя форма заданий побуждает
испытуемых воспринимать каждое из них
в рамках определенной мыслительной
схемы, уделять внимание и рассматривать
определенные детали изображения. Она
также побуждает испытуемых к определенным
способам размышления (смотри Jacobs
and
Vandeventer,
1972). Следовательно, последовательность
заданий обеспечивает «научение методу
мышления» и при выполнении Стандартной
серии Матриц испытуемые
получают пять возможностей для
формирования смысла этого метода. Таким
образом, тест позволяет диагносцировать
тенденцию учиться через опыт,
который является
более логичным определением «потенциала
обучаемости», нежели такое использование
ПМР, где фактически оценивается тип
научения посредством инструкции.

48 Именно по
этой причине «натаскивание» на
работу с ПМР дает меньший эффект, чем
при работе со многими другими тестами,
и это объясняет также эффект минимизации
культурного неравенства. Тестирование
с ограничением времени, а также
использование сокращенных вариантов,
ставят в невыгодное положение именно
тех испытуемых, кто больше других выиграл
бы от самообучения в процессе решения
оригинальной последовательности
заданий. Так Делено (de
Lemos,
1989) установил, что (а) различия в средних
оценках детей из англо­говорящей и
неанглийской среды возрастали, если
использовалась процедура тестирования
с ограничением времени; (б) корреляции
между тестовыми оценками, полученными
с ограничением и без ограничения времени,
ниже у детей из неанглийской среды.

Хотя способ конструирования теста и
минимизирует эффект «натаскивания»
и опыта прошлой работы с похожими
тестами, тем не менее он не является
абсолютной защитой от получения
недостоверных результатов. Когда
результаты теста могут оказать серьезное
влияние на жизнь испытуемого, желательно
проводить тест в индивидуальном порядке,
и не в группе. В таких условиях проще
выявить тех, кто просто заучил правильные
ответы, тех, кого тестовые задачи приводят
в замешательство, или тех, чье культурное
происхождение снижает их заинтересованность
в точности собственных ответов.

ФОРМАТ АНАЛИЗА ТЕСТОВЫХ ЗАДАНИЙ

Следуя современной
терминологии, в ПМР изначально была
заложена такая форма анализа тестовых
пунктов (заданий), которая во всех
отношениях отвечала требованиям
трехпараметрической модели анализа
тестовых данных Раша (Rasch)
. Однако, вместо использования
математических индексов применяли
визуальный анализ характеристических
кривых отдельных заданий. Такого рода
исследования, проведенные с особой
тщательностью, действительно позволяют
больше узнать о природе измеряемой
способности и о возможностях дальнейшего
улучшения теста.

7
Читателям может быть
будет интересно узнать, что Раш впервые
тестировал свою модель именно на Матрицах
(Rasch,
1947)

На психологическом уровне, анализ
заданий должен продемонстрировать, что
способности, необходимые для решения
данного задания, надстраиваются над
теми, которые требовались для решения
предыдущих заданий. Однако, даже если
и можно показать, что некоторые способности
нужны для формирования остальных, тем
не менее может случиться так, что для
решения более простых и более сложных
заданий потребуются разные психологические
процессы.

Рисунок О14 показывает характеристические
кривые (ХКЗ) для трех гипотетических
заданий шкалы. Вертикальная ось показывает
процент обследованных, правильно
ответивших на данное задание, а
горизонтальная показывает общую тестовую
оценку. Отдельные кривые отражают
процентную долю общей выборки, правильно
решивших данное задание, как функцию
итоговой результативности. В целом
рисунок показывает, как будут вести
себя удачно и неудачно подобранные
задания, если каждый пункт теста оценивает
одну и ту же, но последовательно
прогрессирующую, интеллектуальную
функцию.

Кривая А показывает идеальное поведение
психологически эффективного тестового
задания, имеющего уровень сложности
ниже среднего. Кривая В показывает
поведение столь же эффективного, но
более сложного задания. Кривая С отражает
поведение неэффективного задания такой
же сложности, как и кривая В. Пунктирная
линия на уровне 12.5% показывает частоту
случайного выбора правильной фигура
из восьми предъявленных вариантов
фигур.

Рисунок О15 показывает, как должен вести
себя идеальный набор заданий.
Характеристические Кривые Заданий
должны быть вертикальны и сдвинуты друг
относительно друга на равное расстояние.
В этом случае тестовые задания сформируют
настоящую шкалу интервалов. Будет
достигнуто абсолютно однозначное
соответствие между полученным испытуемым
общим баллом и последним правильно
решенным им заданием.

ХКЗ для задания А на графике О14 показывает
тенденцию, что испытуемые отвечают
более-менее случайным образом до тех
пор, пока их общая оценка не достигнет
некоего определенного уровня. С момента,
когда они начинают содержательно
включаться в задачу, кривая монотонно
и круто возрастает с увеличением
суммарной шкальной оценки. В диапазоне
40-60% скорость изменения вероятности
правильного решения с увеличением
общего балла остается практически
неизменной. На уровне выше 80-90% эта
скорость изменяются также, как и на
уровне 10-20%. Достижение уровня 100% означает
отсутствие дальнейших ошибок, потому
что испытуемые с более высокими тестовыми
оценками уже не выбирают ложных
альтернатив. Резкий подъем кривой в
среднем диапазоне предполагает, что
существует некая важная процессуальная
• характеристика, необходимая для
решения данного задания, которая
подключается именно на этом, измеряемом
общим тестовым баллом, уровне развития

продуктивной способности. До достижения
этого уровня способности практически
никто не выбирает правильную фигуру-
После того как он достигнут, все меньше
и меньше людей выбирают ошибочный
вариант.

ХКЗ для задания В — столь же эффективного
как А, но более сложного — показывает
такую же крутую прогрессию от случайных
угадываний до 100%-го успеха. Однако, для
его решения требуется значительно более
высокий уровень развития способности
решать задачи.

ХКЗ для задания С иллюстрирует четыре
причины, почему данное задание может
быть неэффективным тестовым пунктом:

а. Некоторое количество испытуемых,
чьи общие оценки не предполагают, что
они способны решить данное задание,
тем не менее выбирают правильный
ответ. Наиболее вероятное объяснение
этого заключается в том, что правильный
ответ, в силу своего расположения или
общей планировки, привлекает внимание
испытуемого сильнее, чем альтернативные
ответы.

б. Те испытуемые, чья общая тестовая
оценка чуть ниже уровня, при котором
они должны

быть способны правильно решать данную
задачу, начинают выбирать другой ответ,
так что процент правильных ответов
опускается до полосы 12.5% — как при
случайном угадывании. Это может быть
потому, что одна из ошибочных фигур
стала более привлекательной для
испытуемых с этим уровнем способностей.

в. Среди тех, для кого данное задание
становится психологически проблетичным,
процент

правильного решивших растет только до
50%-го уровня. Для значительного диапазона
способности кривая колеблется вокруг
50%-го уровня. Ошибочные выборы, совершаемые
на этом уровне способности, могут
указывать на то, что при решении данного
задания испытуемые более или менее
случайно выбирают между двумя очень
похожими фигурами.

г. Выше 60%-го уровня успешности кривая
растет медленно и никогда не достигает
уровня

100%. Даже
среди наиболее способных испытуемых
есть такие, которые не могут решить
задачу правильно.

Отметим, что область под кривой С
приблизительно равна области под кривой
В. Из этого следует, что нормативные
индексы сложности этих двух заданий
должны быть сходными, так что задания
могут показаться одинаково трудными и
одинаково удовлетворительными. Кроме
того, нормативные индексы сложности не
отразят того факта, что эти кривые
пересекаются, то есть эти задания
представляют различную сложность для
людей с разными общими тестовыми
оценками.

На рисунке О14 не показаны две разновидности
откровенно неэффективных тестовых
заданий — такие, которые решаются всеми
испытуемыми, и те, которые не решаются
никем.

Хотя данная измерительная
модель предполагает, что создатель
теста должен стараться подобрать задания
с равноудаленными друг от друга ХКЗ
одинаковой формы, сделать это практически
невозможно. Некоторые ХКЗ продолжают
пересекать другие. На одном уровне это
значит, что необходимо применять
трехпараметрическую модель Раша для
аппроксимации данных. Однако на другом
уровне это предполагает, что люди с
высокими и низкими тестовыми оценками
решают поставленные перед ними задачи
качественно различными способами. Эта
гипотеза подтверждается бимодальными
распределениями, приведенными в
Исследовательском
Приложении №1.
Однако,
полученный набор ХКЗ показывает также,
что начальные перцептивные задания
формируют часть континуума когнитивных
способностей, которые надстраиваются
друг над другом.

В Исследовательском
Приложении №4
приведено
исследование Эндрич и Давс, в котором
трехпараметрическая модель Раша успешно
описывает тестовые данные. Фишер

(Fischer,
1988) и другие обсуждали
это требование. Наш собственный вклад
в эту дискуссию состоит в наблюдении,
что ХКЗ позволяют обнаружить причины,
почему тесты подтверждают
или не подтверждают
модель.
Кроме того, Хэмблтон (Hambleton,
1988, 1989) продемонстрировал, что многие
из используемых индексов не обладают
стабильностью (завися от таких вещей
как объем выборки и специфика тестируемой
популяции) и что большая часть аргументов
зависит от строгости критериев,
устанавливающих «соответствие»
или «несоответствие» модели Раша.

Применение факторного
анализа к тестовым заданиям становится
все более модным, и ввиду этого следует
сказать несколько слов предостережения.
Важно отметить, что и психологическая
модель продуктивной способности, и
техника шкалирования, использованная
для создания ПМР и СШМХ, несовместимы
со шкалами, конструируемыми при помощи
факторного анализа для достижения
внутренней согласованности. Если
рассмотреть взаимные корреляции пунктов
теста, построенного в соответствии с
изображенной на рисунке О15 моделью, то
будет обнаружена крайне высокая
корреляция между соседними пунктами
(поскольку на основании успеха или
неуспеха при решении предыдущего задания
можно предсказать правильность решения
последующего) и крайне низкая корреляция
между пунктами, расположенными на
противоположных концах шкалы (поскольку
успешное решение простейших заданий
ничего не говорит о том, будет ли успешным
решение сложных). Из этого следует, что
поскольку пункты упорядочены по
сложности, матрица корреляций будет
такова, что высокие значения будут
расположены вокруг диагонали, уменьшаясь
практически до нуля по мере удаления к
углам. Такая матрица не подлежит анализу
с использованием модели «генеральных
факторов с коррективами» или модели
«независимых факторов» (Raven
et
al,
1971). Следовательно, такой анализ мало
что скажет нам о природе способностей,
измеряемых ПМР и СШМХ. (Этот комментарий
не относится, конечно, к применению
факторного анализа к батареям
тестов, включающих в
себя, в числе прочих, ПМР и СШМХ).

ИСТОРИЯ СОЗДАНИЯ И ТЕОРЕТИЧЕСКИЕ
ОСНОВЫ

СЛОВАРНЫХ ШКАЛ

Невербальные тесты часто
ошибочно считают тестами интеллекта,
тогда как на самом деле они измеряют
только некоторые аспекты интеллектуальной
деятельности. Причина использования
словарных шкал совместно с Прогрессивными
Матрицами
состоит в
том, что они дополняют друг друга.
Прогрессивные Матрицы
направлены главным
образом на оценку продуктивной
способности, а вербальные тесты измеряют
репродуктивные
способности, или объем
эрудиции. Равен и Уолшоу (Raven
and
Waishaw,
1944), обосновывая применение описанных
ниже словарных тестов, пишут:

«Единственным
оправданием для конструирования шкал,
в которых словарные тесты очень тесно
завязаны с другими тестами, является
то, что теоретически невозможно создать
чисто продуктивный или чисто репродуктивный
по своей природе тест… Тем не менее…
мы можем создавать такие тесты, что для
соответствующей категории испытуемых
диагносцируемый процесс будет единственным
процессом, лежащим вблизи границы
баланса возможного и невозможного
события. Также как мы в состоянии создать
тесты, преимущественно продуктивные
по своей природе, мы можем сконструировать
и такие тесты, в которых сам ход
тестирования активизирует столь простые
и генерализованные продуктивные
процессы, что для их успешного выполнения
оказывается необходимым лишь воспоминание
информации, относящейся к прошлому
опыту. Поэтому исключительно полезно
оказывается рассматривать результаты
этих тестов отдельно от результатов
тестов, в процессе решения которых
значимую роль играют продуктивные
способности.»

Многие исследования, где
применяли Прогрессивные
Матрицы,
дополнялись
также и словарными тестами. В некоторых
случаях использовалась Словарная Шкала
Векслера (например, Desai,
1955; Morresey,
1974). Во многих других пользовались
Словарной Шкалой Милл
Хилл,
несмотря на
неудачу ряда тестовых агентств с
продвижением этого теста на рынок за
пределы Великобритании. Примерами таких
исследований являются работы Frost
(1963), Payne
(1962), Holmes
(1980), Peterson
(1971).

Словарные Шкалы Равена
имеют преимущество перед субшкалами
других тестов в том, что они позволяют
оценить широкий диапазон способности,
доступны для проведения в форме открытых
(свободный ответ) или закрытых (выбор
ответа среди нескольких альтернатив)
вопросов, в устной или письменной форме.
Кроме того, форма с закрытыми вопросами
может обсчитываться автоматически.

ВАРИАНТЫ СЛОВАРНЫХ ШКАЛ

Как и в случае с Прогрессивными
Матрицами,
существует
основная версия словарного теста, на
базе которого созданы и несколько
дополнительных. Основная форма
представляет собой версию Словарной
Шкалы Милл Хилл
с
открытыми вопросами, состоящую из 88
слов, разделенных на два параллельных
набора, в каждом из которых 44 слова
упорядочены по степени нарастания
трудности.

На этой основе были созданы
версии для Младшего
и Старшего
возраста. В первой
были убраны 22 наиболее трудных слова с
тем, чтобы избавить детей от столкновения
со слишком большим числом незнакомых
им слов. Из последней были удалены 20
самых простых слов. В обеих версиях
половина слов предъявляется в форме
открытых вопросов, а другая половина —
в виде закрытых вопросов. Выбирая, какую
из половин предъявлять в форме открытых
или закрытых вопросов, можно создавать
параллельные формы теста. Более детально
они описаны ниже.

Как уже объяснялось ранее,
Цветные Прогрессивные
Матрицы
были разработаны
на основе Стандартных Прогрессивных
Матриц путем включения дополнительных
простых заданий и исключением более
трудных. Подобным же образом создавалась
и производная версия Словарной
Шкалы Милл Хилл,
ныне
известная как Словарная
Шкала Крайтон.

Сравнение Форм с Закрытыми и Открытыми
Вопросами

Часть теста, состоящая из
закрытых вопросов, предназначена для
измерения репродуктивной способности
с минимальным вовлечением продуктивных
процессов. Хотя такой подход имеет много
преимуществ и неоднократно использовался
другими авторами (смотри, например,
Shipley,
1940), он имеет также и несколько внутренне
присущих ему недостатков. В частности
подход, основанный на множественном
выборе, не позволяет проводить качественное
различение, так что тестовые баллы
становятся менее информативными по
мере приближения к верхнему концу шкалы
способностей.

Открытые Вопросы, или
Определения позволяют
осуществлять более детальную качественную
оценку знания и использования слов.

Разновидности Словарной Шкалы Милл
Хилл

На данный момент существуют
девять версий Словарной
Шкалы Милл Хилл.
Форма
СШМХ Открытые Вопросы, или Определения.

Эта форма состоит из 88
слов-заданий в форме открытых вопросов.
Не существует форм для младшего или
старшего возраста, а также параллельных
форм. СШМХ, Формы 1 и 2
для Младшего возраста,

В версии для Младшего
возраста,
опущены 22
наиболее трудных слова. Половина слов
представлена в виде открытых вопросов,
другая половина имеет формат закрытых
вопросов. В Форме 1 первая половина
заданий (Серия А) содержит открытые
вопросы, а вторая половина (Серия В) —
закрытые вопросы. В Форме 2 наоборот —
Серия А предъявляется в формате закрытых
вопросов, а Секция В — в формате отрытых
вопросов,

Версии для Младшего
возраста
рассчитаны
на детей от 11 до 14 лет и могут использоваться
как для индивидуального, так и для
группового тестирования. В среднем,
следует ожидать повышение успешности
выполнения примерно на 3 слова за каждый
год взросления.

СШМХ, Формы 1 и 2 для Старшего
возраста.

В версии
для Старшего возраста
опущены 20 самых простых
слов. Также, в Форме 1 первая половина
заданий (Серия А) содержит открытые
вопросы, а вторая половина (Секция В) —
закрытые вопросы. В Форме 2 задания
предъявляются в обратном формате.

Формы 1 и 2 для Младшего
и Старшего
возрастов
являются
наиболее распространенными версиями
данного теста.

Иногда возникает необходимость
использовать части тестов, содержащие
только открытые вопросы, либо только
закрытые вопросы из версий для Младшего
или Старшего
возраста. В
таких
ситуациях допустимо оценивать суммарный
тестовый балл, который получил бы ребенок
в случае использования комбинации обеих
этих частей, по имеющимся нормативным
таблицам.

СШМХ, Форма со Всеми
Закрытыми Вопросами
для
Старшего Возраста,
с быстрым подсчетом
тестовых баллов (самокопирующиеся
бланки).

Была создана для использования
совместно с Профессиональной версией
Продвинутых Прогрессивных
Матриц.

СШМХ, Формы со Всеми
Закрытыми Вопросами
для
Младшего и
Старшего Возраста.
Применимы только на
территории США.

Этот тест позволяет исследователю
получать быструю оценку коммуникативных
способностей испытуемого, а также, что
весьма полезно для качественного анализа
ответов, более детальную информацию об
употреблении слов, нарушениях мыслительных
процессов и использовании языка для
организации прошлого опыта, планов на
будущее и текущей деятельности. Он
включает в себя каждое пятое слово
оригинальной СШМХ и проводится в устной
форме с возможностью получения
дополнительных разъяснений. Кроме
определения каждого слова испытуемых
просят привести и пример его использования
в предложении. Такая качественная
информация может быть особенно полезна
в клинических исследования.

Словарная Шкала Крайтон

В этой версии используются
40 новых слов, подобранных в дополнение
к 40 простейшим словам Словарной
Шкалы Милл Хилл,
а
наиболее трудные слова опущены. Ее
предлагается использовать для тестирования
детей до 11 лет, а также лиц более старшего
возраста, получающих низкие оценки.
Тест следует проводить в устной форме.
Если испытуемый успешно справляется с
подавляющим большинством из предложенных
ему заданий, то вслед за выполнением
первой половины СШК он может переходить
непосредственно к работе со Словарной
Шкалой Милл Хилл.

54 Более
детальная информация относительно
данных версий словарных шкал, а также
их отношения к Прогрессивным
Матрицам,
содержится
в Части II
настоящего Руководства.
При оформлении заказа
на данные тесты пользователей просят
четко указывать, какая именно форма им
необходима, а при представлении полученных
результатов — сообщать, какую форму они
использовали.

О СОЗДАНИИ СЛОВАРНЫХ ШКАЛ

Чтобы иметь в процессе
отработки методики достаточную свободу
выбора и избежать субъективности, из
Краткого Оксфордского Словаря Английского
Языка были отобраны 500 слов, расположенных
через равные интервалы друг от друга.
Детям от 5 до 14 лет предъявляли по 50
случайных слов из этого набора, в
результате чего определили приблизительный
порядок трудности отобранных слов и
выяснили, что исходный набор содержал
слишком много простых слов. Еще один
список из 150 слов был отобран из Тезауруса
Роже (Roget’s
Thesaurus).
С этой целью по оглавлению тезауруса
были определены номера страниц с
фиксированным межстраничным интервалом,
а затем два эксперта независимо друг
от друга прочитывали каждую отобранную
страницу до тех пор, пока не встречали
слово, которое, по их мнению, должен
знать любой интеллигентный взрослый
человек независимо от его профессии,
но которое может вызвать его затруднения
при определении.

Из общего списка в 650 слов для
экспериментальной шкалы были отобраны
112, каждое из которых имело синонимы
того же порядка сложности. Слова, не
прошедшие этот отбор, были упорядочены
по возрастающей сложности и организованы
в группы по четыре. Они использовались
в качестве ложных вариантов ответов
(дистракторов), дополняясь синонимами
слов соответствующей сложности.
Экспериментальные серии предъявлялись
в формате открытых вопросов и закрытых
вопросов выбора группам взрослых и
детей с самым широким диапазоном
вербальных способностей. Выяснилось,
что форма с открытыми вопросами доступна
для всех испытуемых, а форма с закрытыми
вопросами доступна только тем людям
старше 10 лет, которые не испытывают
затруднений при чтении и письме.

Для каждого слова из экспериментальной
шкалы сохраняли каждый вариант ответа.
Все ответы были организованы в порядке
убывания степени сходства с определением,
приведенным в Оксфордском Словаре,
вплоть до таких, которые показывали
полное отсутствие понимания значения
слова. Отмечались и на качественном
уровне анализировались индивидуальные
различия в определении и использовании
слов. С целью количественного сравнения
ответы испытуемых оценивались как
«правильные» или «неправильные».
Была признана неудовлетворительной
идея использования удвоенных баллов
для хороших определений или половинных
баллов для сомнительных объяснений.

Такие слова как «колоссальный»
или «вонючий», которые характерны
для разговорной речи, или «рок» и
«категория» — слова широко
распространенные, но плохо понимаемые,
были исключены из Шкалы. Остальные были
организованы таким образом, чтобы
обеспечивать приблизительно равное
увеличение полученных баллов с возрастом.
Частоту, с которой выбирались синонимы,
сравнивали с частотой правильного
определения слова. На основании
распределения ошибочных ответов в
версии теста с закрытыми вопросами
можно было исключить любое слово, которое
выбирали так редко, что его использование
теряло смысл, или так часто, что оно
«затмевало» синоним. В каждой группе
из четырех возможных дистракторов
эквивалентной трудности отбрасывалось
наименее подходящее слово, а три
оставшихся сохранялись. Затем добавлялись
два новых слова. Они были выбраны с
учетом ошибочных определений слова-стимула
(а) в результате смешения его со сходно
звучащим словом, или (б) как отражение
наиболее типичного определения, которое
дают люди, не имеющие ясного представления
о значении слова. Таким образом группа,
из которой нужно было сделать выбор,
состояла из шести слов примерно равной
длины и одинаковой степени сложности
— синонима, трех случайных слов равной
сложности и двух слов, имевших высокую
вероятность выбора при использовании
стратегии случайного угадывания. Было
установлено, что пространственное
расположение этих шести слов в виде
двух колонок по три слова в каждой,
расположенных ниже стимульного слова,
обеспечивает наиболее равномерное
распределение выборов.

В итоге, после дальнейших испытаний
были оставлены 88 слов, расположенные в
порядке возрастания сложности. Они были
разделены на два уравненных по сложности
параллельных набора по 44 слова.

Порядок предъявления слов
пересматривался в 1976 и 1980 годах. В
процессе стандартизации этого теста в
Америке, проведенной в 1984 и 1988 годах,
два слова из Словарной
Шкале Милл Хилл
и одно
из Словарной Шкале
Крайтон
были изменены
в соответствии с американским
словоупотребелением. Более подробное
описание этих изменений можно найти в
разделе настоящего Руководства,
специально посвященного
СШМХ.

ПРИЛОЖЕНИЕ

Воспроизводимость психометрических
свойств ПМР на разных социо-экономических
и этнических группах, постоянная динамика
в увеличении оценок со временем и
сходство нормативных данных, полученных
в разных культурных популяциях в один
и тот же момент времени — все это
позволяет предположить, что ПМР измеряют
что-то такое, что имеет фундаментальное
психологическое значение.

В Приложении будут суммированы самые
последние данные, убедительно
свидетельствующие о научном статусе и
практической важности «продуктивной
способности».

Способность ПМР измерять
и выявлять фундаментальные свойства
когнитивных процессов заложена в самой
их конструкции, использующей Теорию
Выбора Ответов (Item
Re­sponse
Theory).

В той степени, в какой Характеристические
Кривые шкальных Заданий (ХКЗ) действительно
демонстрируют ступенчатый рост
вероятности решения какого-то одного
задания с увеличением вероятности
решения более легких и более трудных
заданий, с такой же достоверностью можно
утверждать, что, независимо от содержания
заданий, все они составляют единый
континуум.

Имея в виду, что содержание
заданий изменяется от простых перцептивных
(«гештальт») заданий, через простые
аналогии к заданиям, требующим привлечения
сложных взаимодействующих стратегий
для спецификации проблемной ситуации,
выделения «релевантных» элементов
и способа их взаимосвязи, следует
признать, что «восприятие» и
«мышление» составляют часть единого
психологического континуума. Говоря
другими словами, восприятие не является
непосредственным зрительным процессом,
а включает и понятийные
операции. Оно нуждается
в выделении фигуры из фона и в различении
важных элементов от несущественных.
Именно по этой причине будет ошибкой
считать, что ПМР измеряют «способность
к решению задач», поскольку, как не
уставал подчеркивать в своем принципе
ноэгенеза Спирман, способность к
выделению и разрешению проблем зависит
от одновременного
осмысления целого,
чтобы знать, что искать в составляющих
его частях (т.е. чтобы «анализировать»),
и понимания,
какие части нужно выделить из фонового
«шума», чтобы иметь возможность
«увидеть» целое.

Следовательно, набор ХКЗ для ПМР
демонстрирует, (а) что «существует»
нечто, что условно может быть названо
«общей концептуальной способностью»,
(б) что ПРМ проникает в эту способность,
и (в) качественно различные типы заданий,
из которых состоит тест, формируют часть
общего континуума. Эти качественно
различные типы заданий не измеряют
«разные вещи». Также как и понятие
«твердость» нельзя опровергнуть
тем фактом, что существуют разные
вещества, обладающие разной степенью
выраженности этой

56 характеристики,
так и тот факт, что задания в ПМР
различаются по своему содержанию, не
дает основания усомниться, что их решение
обеспечивается разными уровнями
«когнитивной способности».
Способность решать задания одного типа
увеличивается постепенно и в параллель
со способностью решать задания других
типов, В мышлении не происходит каких-то
метаморфоз при переходе способности
решать один тип заданий к последующим
по сложности заданиям.

Здесь необходимо учитывать
такое возражение, что приверженцы
факторного анализа выделяют в отдельные
факторы задания, решаемые посредством
«восприятия», «рассуждения»
и «анализа». В другой работе (Raven,
Ritchie
and
Baxter,
1971) нами было показано, что корреляционная
матрица, полученная путем взаимной
корреляции пунктов усовершенствованной
шкалы Гутмана (Guttman)
или шкалы Раша, не может быть подвергнута
анализу ни методом главных компонентов,
ни методом ортогонально или наклонного
вращения. Природа корреляционной матрицы
определяется свойствами шкал, построенных
с помощью Теории Выбора Ответов. Знание
того, что кто-либо правильно решает
очень легкое задание, не позволяет
правильно предсказать, будут ли решены
очень трудные тестовые задания. Таким
образом, корреляция между очень легким
и очень трудным пунктами шкалы будет
стремиться к нулю. С другой стороны,
близкие по сложности задания имеют
высокий коэффициент корреляции:
успешность или неуспешность решения
одного задания позволяет с высокой
вероятностью предсказать результат
решения наиболее сложного задания.
Поэтому корреляционная матрица,
полученная в результате взаимной
корреляции упорядоченных по сложности
заданий шкалы, будет состоять из значений,
стремящихся к единице вокруг диагонали
матрицы и приближающихся к нулю по мере
приближения к её дальним углам.
Корреляционную матрицу нельзя переделать
путем умножения и добавления весовых
коэффициентов к любому
набору факторов, число
которых меньше чем количества исходных
заданий шкалы. Если всё-таки обработать
такого рода данные посредством факторного
анализа, то в результате получится серия
факторов «мощности». Они будут
охватывать задания «сходной»
сложности, поскольку именно соседние
задания имеют высокую корреляцию.
(Средняя внутри факторная корреляция
зависит от числа выделенных факторов).
Но здесь и подкрадывается возможность
неверного истолкования этих результатов.
Сходные по сложности задания
преимущественно, хотя и не повсеместно,
обладают и сходством по содержанию. На
самом деле, эти факторы включают некоторое
количество более легких заданий
качественно другого типа, осваиваемого
в более раннем возрасте, и ряд более
трудных заданий, освоение которых обычно
происходит позднее, чем основная масса
попавших в кластер заданий. Но эти
«неподходящие» задания можно легко
не заметить, когда дается наименование
фактора. В результате, исследователи
называют эти факторы по доминирующему
признаку входящих туда заданий, хотя
на самом деле они являются факторами
мощности.

После этого отступления мы
можем вернуться в сформулированному
нами выводу, что основанный на Теории
Выбора Ответов анализ заданий ПМР
действительно показывает существование
континуума в «когнитивной
(истинно ‘концептуальной’) способности»
и что этот континуум может быть оценен
набором заданий, охватывающих диапазон
с легких «перцептивных» и до сложных
«аналитических» заданий.

Этот вывод недавно получил
дополнительное подтверждение и обобщение
в исследовании Стайлза и Эндрича (Styles
and
Andrich,
1994).

Используя рашевский вариант Теории
Выбора Ответов, Стайлз и Эндрич отобразили
результаты решения трех заданий Пиаже
— заданий на равновесие, на химические
комбинации и корреляции — на едином
графике с набором ХКЗ для ПМР.

Выяснилось, что способность решать эти
задания Пиаже возрастает постепенно и
идет в ногу со способностью решать
задания ПМР сходной сложности. И опять
мы приходим к заключению, что способность
решать качественно разные типы задач
развивается поступательно и не
претерпевает каких-то качественных
метаморфоз при переходе от решения

задач одного типа к задачам другого
типа, гипотезы о которых продолжают
высказываться время от времени. Это,
конечно, не исключает возможности резких
скачков в индивидуальном развитии и
деятельности, когда ребенок внезапно
«схватывает идею».

Наряду с исследованием Эндрича и Стайлза
имеются и другие, которые также
подтверждают, что ПМР оценивают континуум
фундаментальной психологической
значимости. Они также указывают, что
измеряемую способность, как бы её ни
называть, нельзя просто отнести к
предмету, имеющему чисто научный интерес.
Из работы Эндрича и Стайлза следует,
что оценки по ПМР отражают способность
решать сложные реалистические,
практические проблемы самого разного
типа. Можно, наверно, предположить, что
рост тестовых оценок на протяжении
прошлого века непременно должен оказать
реальное влияние на способность общества
справляться с ситуациями, где нужно
идентифицировать и решить сложные
проблемы.

Совсем другое направление
работ, которое также приходит к выводу,
что тест ПМР диагносцирует базовые
психологические способностей, включает
исследования с измерением времени
реакции и времени наблюдения (Jensen
et
al.,
1988; Veraon,
1989, 1991, 1993; Deary,
1993, 1995).

Верной и Дири в своих обзорах независимо
пришли к выводу, что ПМР имеет значимые,
но не очень высокие корреляции с:

Низкой скоростью
коркового метаболизма глюкозы. Поэтому
те, кто имеет высокие оценки по ПМР,
должен работать более эффективно.

•Скоростью нереной проводимости.

Некоторыми — но
далеко не всеми — измерениями скорости
реакции. (Многие измерения времени
реакции не коррелируют
с ПМР, а в исследованиях, где сообщалось
о самых высоких корреляциях, использовали
самые трудные и интеллектуально
нагруженные вопросы. Следовательно,
нельзя сделать общий
вывод, что ПМР и
скорость реакции измеряют одно и то
же.)

•Сильной корковой (ЭЭГ) реактивностью
(усредненные вызванные потенциалы) на
неожиданные зрительные стимулы и слабой
корковой реактивностью — на запускаемую
наблюдателем стимуляцию.

•Уровнем кальция в крови, который сам
связан с нервной проводимостью.

Наибольшее впечатление производят,
однако, данные Дири, который показал,
что ПМР -и продуктивная способность в
целом — имеют более высокую (порядка
0.6) корреляцию с количеством времени,
которое нужно для определения с 85%
точностью более длинной из 2 сильно
различающихся по длине линий, т.е. с
«временем наблюдения». (Дири
специально подчеркивает тот момент,
что измерение времени наблюдения НЕ
включает требования, чтобы испытуемый
работал как можно быстрее. Процедура
измерения состоит в варьировании времени
экспозиции линий и нахождении такой
величины, при которой испытуемые
неспособны к точному различению.)

Как и продуктивная способность и в
отличии от репродуктивной способности,
время наблюдения имеет тенденцию к
«уменьшению» с возрастом…т.е.
возрастает в зависимости от даты
рождения.

Как предостережение против
неправильной интерпретации этих
результатов, нужно подчеркнуть, что,
согласно данным Фодегель-Матцен
(Vodegei-Matzen,
1994), испытуемые, получившие высокие
оценки по ПМР, тратят на решение больше
времени, чем те, кто
получил

58 низкие
оценки. Это особенно относится к решению
более сложных заданий. Как и Стернберг
(Sternberg,
1977), она показала, что это дополнительное
время тратится на кодирование элементов
матрицы; не было различий между испытуемыми
по времени, которое они тратили на оценку
возможных альтернатив ответа. Те, кто
тратил мало времени на изучение задания,
демонстрировали тенденцию к выбору
такого варианта ответа, который
недостаточно учитывал весь набор
возможных правил решения (смотри ниже).

Третье направление работ, значительно
продвигающих понимание содержательной
направленности теста ПМР, связано с
именами Карпентер и Джаст, и Фодегель-Матцен.

В исследовании {Carpenter,
Just
and
Shell,
1990) было показано, что 95% из подгруппы
переведенных в словесную форму заданий
Продвинутых Прогрессивных
Матриц
могут быть
решены компьютерной программой, которой
требовалось проверить на наличие или
отсутствие только пять правил, определяющих
закономерности конструирования матриц
и, в случае их наличия, совместно
указывающих на элемент, необходимый
для дополнения матрицы.

ПМР не создавались в прицелом на анализ
применяемых испытуемыми стратегий
решения задач. Как следствие, задания
классических серий часто имеют такие
особенности, которые затрудняют выделение
операциональных правил, изучаемых в
работе Джаст и Карпентер. Аналогичным
образом и варианты ответов, из которых
нужно выбрать правильный ответ, не были
сконструированы таким образом, чтобы
можно было проверить вытекающие из
теории Карпентера и Джаста гипотезы о
связи типологии ошибочных выборов с
общей оценкой по тесту (хотя Равен на
самом деле показал, что тип ошибки прямо
связан с общей оценкой).

Фодегель-Матцен (1994а&Ь) сконструировала
набор заданий, который (а) не содержал
инородных по отношению к теории Карпентер
и Джаста признаков, которые могли
повлиять на их сложность, (б) обладал
рассчитанными на основе теории Карпентер
и Джаста несколькими уровнями сложности
и (в) включал ошибочные варианты ответов
(дистракторы), которые систематически
отличались от правильного ответа только
по количеству и типу неучтенных правил,
благодаря чему теоретически можно было
ожидать, что вероятность выбора каждого
из них закономерно связана с суммарной
оценкой.

Этот новый тест имел превосходные
внутренние психометрические свойства
и очень высокую корреляцию с классическим
тестом ПМР.

Результаты анализа ошибок
находились в полном соответствии с
предсказаниями теории Карпентер и
Джаст. Наиболее способные из тех, кто
не смог решить данное задание, выбирали
ответ, который не учитывал только одно,
самое трудное правило организации
матричной структуры. Менее способные
игнорировали большее число правил.
Таким образом, тип
совершенной ошибки
менялся вместе с общей оценкой именно
так, как предсказывала теория. Этот факт
проливает яркий свет на механизмы
нарушения когнитивной деятельности.

Другим фактором, определяющим сложность
задания, является легкость идентификации
тех критических элементов, на которые
должно быть сфокусировано внимание.

В своем исследовании
Фодегель-Матцен продемонстрировала
действительную значимость этого фактора
путем замены составляющих Матрицы
геометрических элементов -квадратов и
треугольников — на более знакомые
обыденные предметы, такие как шляпы,
бананы или лица, хотя для правильного
решения от испытуемых в обоих случаях
требовалось применить одно
и то же
правило.

Но что самое интересное, изменение
элементов на более знакомые привело к
снижению трудности задания для всех, а
не только для испытуемых с низкими
суммарными оценками по тесту. Ранговый
порядок заданий и испытуемых сохранился
без видимых изменений, Таким

образом, конструирование заданий с
изображениями предметов уменьшает их
кажущуюся сложность для всей популяции
испытуемых.

Иначе говоря, уменьшая заметность важных
признаков мы, тем самым, затрудняем
процесс нахождения соответствия, что,
в свою очередь, делает задания более
сложными для любого испытуемого. Но это
приводит лишь к небольшим изменениям
в порядке сложности заданий или в
ранговом порядке тестируемых.

Литература к Приложению, не вошедшая в
основной список

Carpenter, PA, Just, M.A. and Shell, P. (1990). What one intelligence
test measures: A theoretical account of the processing in

the Raven Progressive Matrices Test. Psychological Review, 97(3),
404-431.

Deary, IJ. (1993). Inspection lime and WAIS-R IQ subtypes: A
confirmatory factor analysis study. Intelligence, 17, 223-236. Deary,
I.J. (1995) Auditory inspection time and intelligence: What is the
direction of Causation? Development Psychology, 31,

in press.

Jensen, A.R., Larson, G.E.
and Paul, S.M. (1988). Psychometric g
and
mental
processing speed on a semantic verification test-Personality and
Individual Differences, 9(2), 243 255.
Raven, J.,
Ritchie, J. and Baxter, D. (1971). Factor analysis and cluster
analysis: Their value and stability in social survey research.

Economic and Social Review,
367 — 391.
Styles, I. and Andrich, D. (1994). Linking Psychometrics and
Cognitive-Developmental Variables. Paper presented at the 21st

International Congress of
Psychology, Madrid, Spain. Not to be quoted without permission.
Vernon, PA. (1989). Speed of Information-Processing and Intelligence.
Norwood, NJ: Ablex. Vemori, P.A. (1991). Studying intelligence the
hard way. Intelligence, IS, 389-395. Vernon, P.A- (1993).
Intelligence and neural efficiency. Chapter 7 in
O.K..
Detterman (Ed.), Current Topics in Human

Intelligence, Volume 3. Norwood, NJ: Ablex.

Vernon, P-A. (1994). Reaction time. In R.J. Sternberg (Ed.),
Encyclopaedia of Human Intelligence. New York: Macmillan.
Vodegel-Matzen, L.B.L, (1994). Performance on Raven’s Progressive
Matrices. Ph.D. Thesis, University of Amsterdam. Vodegel-Marzen,
L.B.L., van der Molen, M.W. and Dudink, A.C.M. (1994). Error analysis
of Raven test performance. Personality

and Individual Differences, 16(3), 433-445.

Литература

Alderton, D,L and Larson, G. (1990). Dimensionality of Raven’s
Advanced Progressive Matrices Items. Educational and

Psychological Measurement, 50, 887-900. Andrich D. (1989).
Distinctions between assumptions and requirements in measurement in
the social sciences. Bulletin of

the International Test Commission, No.28/29,46-66. Strasbourg: ITC.
Andrich, D. and Styles, 1. (1993). Psychometric evidence of
intellectual growth spurts in early adolescence. In Press.
Preliminary

paper presented to the 1991 meeting of the American Educational
Research Association.

AngorT, W,H. (1988). The
nature-nurture debate, aptitudes, and group differences. American
Psychologist, 43, 713 -720. Baird, D. and Scott, E.M. (1953).
Intelligence and childbearing. Eugenics Review, 45, No,3t
139-154. Baltes, P.B. and Lindenberger, U. (1988). On the range of
cognitive plasticity in old age as a function of experience: 15

years of intervention research. Behavior Therapy, 19, 283 — 300.
Benton, 0 and Roberts, G. (1988). Effect of vitamin and mineral
supplementation on intelligence of a sample of schoolchildren.

The Lancet, 23, January, 140 — 143.

Berg, 1. (1973). Education
and Jobs: The Great Training Robbery. London: Penguin Books. Bock,
G., Stebbins, L.B. and Proper, E.G. (1977). Education as
Experimentation:
A Planned Variation Model, (Vol.lV-B).

Effects of Follow Through Models. Cambridge MA: Abt Associates.
Bouchard, T.J., Lykken, D.T., McGue, M., Segal, N.L. and Tellegen, A.
(1990). Sources of human psychological differences:

The Minnesota Study. Science, 250, 223-228.

Bouvier, U (1969) Evolution
des Cotes a Quelques Test Belgium: Centre de Recherches, Forces
Armees Beiges Brandis, W and Bernstein, B. (1974). Selection and
Control. London: Routledge and Kegan Paul. Broadbent, D,B. and Aston,
В
(1978). Human control of a simulated economic system. Ergonomics,
21,12, 1035 -1043. Brown, J.S., Collins, A. and Duguid, P. (1989).
Situated cognition and the culture of learning. Educational
Researcher,

Jan-Feb, 32-42. Budoff, M. and Gorman, L. (1976). Effectiveness of a
learning potential procedure in improving problem-solving skills of

retarded and non-retarded children. Amer. J. Mental Deficiency,
81,260-264. Budoff, M. and Friedman, M. (1964). ‘Learning Potential’
as an assessment approach to the adolescent mentally retarded.

J. Consult. Psychology, 28, 434-439.

Burt, C. (1957). The distribution of intelligence. British J.
Psychology, 48,161-175. Chan,J. (1981). Correlates of parent-child
interaction and certain psychological variables among adolescents in
Hong Kong.

in J.L M Binnie-Dawson (Ed.), Perspectives in Asian Cross-Cultural
Psychology. Lisle, Netherlands: Zwets and Zeitlinger. Chomsky, N.
(1987) The Chomsky Reader. London: Serpent’s Tail. Coles, R. (1986).
The Moral Life of Children. New York: Atlantic Monthly Press Cook, M
(1988). Personnel Selection and Productivity. Chichester; John
Wiley. Crichton Royal, Dumfries. (1957). A comparative study of two
psychological tests, (unpublished). Department of Psychological

Research.

Day, P. and Klein, R. (1987). Accountabilities: Five Public Services.
London: Tavistock Publications, dc Lcmos, M.M. (1989). The Australian
re-standardisation of the Standard Progressive Matrices.
Psychological Test Bulletin,

Vol.2, No.2, Nov., 17-24. Hawthorn, Victoria: ACER. Deltour, J.J,
(1984, Unpublished), line Nouvelle Methode devaluation Kapidc de la
Deterioration Mentale, University of

biege: Laboratoir de Psychologic Appliquee. Desai, M. (1955) The
relationship of the Wechsler-Bellvue Verbal Scale and the Progressive
Matrices.! Consulting Psychology,

19, 60. Dickstein, LS. and Ayers.J. (1973). Effect of an incentive
upon intelligence test performance. Psychological Reports, 33,

127-130. Dillon, R.F, (1980). Matching students to their preferred
testing conditions: Improving the validity of cognitive assessment.

Educational and Psychological Measurement, 40, 999 — 1004. Dockrell,
W.B. (1989). Extreme scores on the WISC-R. Bulletin of the
International Test Commission, No 28/29,1 — 7.

Strasbourg: ITC Fysenck, H.J, and Eysenck, S.B.G., (Eds,) (1991).
Improvement of IQ and behaviour a5 a function of dietary
supplementation.

/I Symposium.
Personality
and Individual Differences, Vol.12, No.4, Whole Issue. Feuerstein, R.
(1979). The Dynamic Assessment of Retarded Performers Baltimore:
University Park Press. Feuerstein, R. (1980). Instrumental
Enrichment. Baltimore: University Park Press. Feuerstein, R.(
Klein, P. and Tannenbaum, A. (Eds.). (1990). Mediated learning
experience: Theoretical, psychosociat, and

educational implications. Proc. First International Conference on
Mediated Learning Experience. Tel Aviv: Freund. Feuerstein, R., Rand,
Y. and Rynders.J.K. (1988). Don’t Accept Me As I Am:
Helping’Retarded’ People to Excel. New

York: Plenum. Firkowska-Mankiewicz, A. and Czarkowski, M. (1982).
Social status and mental test performance in Warsaw children.
Personality

and Individual Differences,
3, 237-247. Fischer, G.H (1988). Comments made in a symposium on
Questionable
Assumptions in Test Construction,
held
at the

61
Sydney meeting of the
International Association for Applied Psychology.

Fivars, G. and Gosnell, D
(1966). Nursing Evaluation: The Problem and the Process. Pittsburg
PA: Westinghouse Learning Corp. Flynn.J.R. (1984). The mean IQ of
Americans: Massive gains 1932 to 1978. Psychological Bulletin, 95,
29-л1,
Flynn J.R. (1987). Massive IQ gains in 14 nations: What IQ tests
really measure. Psychological Bulletin, 101, 171 — 191. Flynn.J.R.
(1989). Chinese Americans: Evidence that IQ tests cannot compare
ethnic groups. Bulletin of (he International

Test Commission,
No.28/29, 8-20 Strasbourg: ГГС.

Flynn.J.R. (1991). Asian Americans: Achievement Beyond IQ. Hillside,
NJ: Lawrence Erlbaum Associates, Inc. Foulds.G.A. and Raven, J.C.
(1948). Normal changes in the mental abilities of adults as age
advances. Journal of Mental

Science, Vol.XClV, No.394, January, 133- 142.

Fraley, A. (1981). Schooling
and Innovation: The Rhetoric and the Reality. New York: Tyler Gibson.
Francis, H. (1982). Language teaching research and its effect on
teachers in early education, in
A. Davies
(Ed.), Language

and Learning in Home and School. London: SCRC/Hcinemann.

Frederiksen, N. (1984)
Implications of cognitive theory for instruction in problem solving.
Rev. Ed. Research, 54,
363 — 407.
Frost, B.P, (1963). The role of intelligence in the selection of
children for remedial teaching of reading. Alberta J. Educational

Research, 9,2, 73-78.
Gallimore, R, (1985). The Accommodation of Instruction to Cultural
Differences, 1л&
Angeles:
Univ. California, Dept

Psychiatry.

Gardner, H. (1983). Frames of Mind. New York: Basic Books. Gardner,
H. (1985). The Mind’s New Science. New York: Basic Books.

Gardner, H. (1987).
Developing the spectrum of human intelligence. Harvard Education
Review, 57,187 -193. Gardner, H. (1991). Assessment in context: The
alternative to standardised testing, in
B.R.
Gifford and M.C. O’Connor

(Eds.), Changing Assessments: Alternative Views of Aptitude,
Achievement and Instruction. New York: Kluwer Publishers. Goodlad, J
(1983) A Place Called School. New York: McGraw Hill. Greeno.J.G.
(1989) A Perspective on Thinking. Amer. Psychologist, 44, 134- 141.

Guilford.J.P. (1977). Way Beyond the IQ. New York: Creative Education
Foundation and Creative Synergetic Associates. Guthke.J. (1982). The
learning test concept — An alternative to the traditional, static
intelligence test. German J. of Psychology,

6, 306-324. Guihke.J , Bauer, H., Burkert, D., Gittct, K. and
Donsszik.J. (1986). VorlaufigeDDR-NormenfurdenFarbigenProgressiven

Matrizentest (CPM) nach Raven. Psychologie fur der Praxis, 350- 357.
Guthke J and Lehwald, G. (1984). On component analysis of the
intellectual learning ability in learning tests, /.eilsclmtt

fur Psychologie Bd , 192,
3-17. liambleton, R.K… (1988). Comments made in a symposium on
Questionable
Assumptions in Test Construction,
held
at

the Sydney meeting of the International Association for Applied
Psychology. Hambleton, R.K. (1989). Constructing tests with item
response models: A discussion of methods and two problems. Bulletin

of the International Test Commission, No.28/29, 96-106. Strasbourg:
ITC. Hatch, T.C. and Gardner, H. (1990). If Binet had looked beyond
the classroom: The assessment of multiple intelligences.

International Journal of Educational Research, 415-429. Haywood,
H.C.,Arbitrnan-Smith, R., Bransford.J.D., Towery, V.R., Hannel, l.L.
and Hannel, M.V. (1982). Cognitive

Education with Adolescents: Evaluation of Instrumental Enrichment.
Paper presented at the International Association

for the Study of Mental Deficiency. Hess, R.D. and Shipnian,
V.C.(1965). Early experience and the socialisation of cognitive modes
in children. Child Development,

36, 869 — 886.

HMI (Scotland) (1980).
Learning and Teaching in Primary 4 and Primary 7. Edinburgh: HMSO.
Hogan, R (1990). Unmasking incompetent managers. Insight, May 21,
42-44. Hogan, R., Raskin, R. and Fazzini, D, (1990). The dark side of
charisma, in
K.E. dark
and M.B. dark (Eds.), Measures

of Leadership. West Orange, NJ: Leadership Library of America.

Holland,.!.L. and Richards,!M. (1965). Academic and non-academic
accomplishments. J, Ed, Psychology, 56, 165 — 175. Holmes, B.J.
(1980). British Columbia Norms for Wcchsler Intelligence Scale for
Children — Revised; Peabody Picture

Vocabulary Test; Slosson Intelligence Test; Standard Progressive
Matrices; and Mill Hill Vocabulary Scale. University

of British Columbia: Faculty of Education. Hope, K. (1985). As Others
See Us: Schooling and Social Mobility in Scotland and the United
States New York: Cambridge

University Press, Hornke, L.F. and Habon, M.W. (1984). Regelgeleitcte
Konstruktion und Evaluation von nicht-verbalen Denkaufgaben. (Rule

governed construction and evaluation of non-verbal test items).
Wehrpsychologische Untersuchungen 4/84.

Erziehungswissenschaftliches Institut der Univ. Dusseldorf. Hoyt,
D.P. (1965). The Relationship Between College Grades and Adult
Achievement. Iowa: American College Testing

Program, Res. Report No. 7.

HunterJ.E. and R.F. (1984) Validity and utility ofalternarive
predictors of job performance. Psychol. Bull., 96, 72 -98. Jackson,
P.W (1986). The Practice of Teaching. New York: Teachers College
Press. Jacobs, P.I. (1977). Up the IQ! New York: Wyden Books. Jacobs,
P.I. and Vandeventcr, M. (1968). Progressive Matrices: an
experimental, developmental, nonfactorial analysis. Perceptual

and Motor Skills, 27, 759- 766. Jacobs, P.I and Vandeventer, M.
(1971). The learning and transfer of double-classification skills by
first graders. Child

Профессиональные психодиагностические
методики: http://www.psyton.ru

Прогрессивные матрицы Равена: инструкция к тесту, ключ, ответы, обработка результатов, интерпретация

Методика «Шкала прогрессивных матриц» была разработана в 1936 году Джоном Равеном (совместно с Л. Пенроузом). Тест прогрессивные матрицы Равена (ПМР) предназначен для диагностики уровня интеллектуального развития и оценивает способность к систематизированной, планомерной, методичной интеллектуальной деятельности (логичность мышления).

Автору методики удалось создать тест, который был бы теоретически обоснован, однозначно интерпретируем, и оценка которого минимально зависела бы от различий в образовании, происхождении и в жизненном опыте людей.

Имеется взрослый и детский вариант тестов Равена. Приведенный здесь вариант теста ПМР предназначен для обследования взрослых (возрастной диапазон от 14 до 65 лет).

Тест состоит из 60 таблиц (5 серий). В каждой серии таблиц содержатся задания нарастающей трудности. В то же время характерно и усложнение типа заданий от серии к серии. Время прохождения теста ограничено и составляет 20 мин.

Прогрессивные матрицы Равена (ПМР / Raven Progressiv Matrices / Методики для диагностики интеллекта подростков и взрослых):

Далее:

  • Инструкция к тесту Равена.
  • Тестовый материал (таблицы из 5 серий по 12 штук) к методике Равена.
  • Бланк ответов к тесту Равена.
  • Обработка результатов ПМР.
  • Ключ (ответы) к тесту Равена.
  • Нормативное (ожидаемое) распределение баллов по сериям.
  • Перевод полученных результатов в IQ показатель.
  • Интерпретация полученных результатов.
  • Качественный анализ результатов теста Равена.
  • Сферы применения теста ПМР.

Инструкция к тесту Равена.

Сейчас вам будет предложен ряд графических рисунков. Всего их 60, они объединены в 5 групп.

На каждом отдельном рисунке в верхней половине листа находится прямоугольник, имеющий определенный фон или составные элементы (фигуры), связанные между собой некоей зависимостью. В правом нижнем углу прямоуголь­ника имеется вырез — свободное, пустое место.

Под прямоугольником нахо­дится 2 ряда фрагментов (шесть или восемь), которые по форме и величине точно подходят к вырезу прямоугольника. Каждый предложенный фрагмент имеет различный рисунок.

Вашей задачей является найти в ряде фрагментов тот, который точно вписался бы в свободное место. Предпосылкой правильного решения является логиче­ское рассуждение о том, по какому закону составлен рисунок в прямоугольнике, пустое место в котором вы должны запол­нить.

Время на решение 60 заданий ограничено 20 минутами. Не задерживайтесь на первых заданиях теста, так как сложность их все время увеличивается.

Тестовый материал к методике Равена.

прогрессивные матрицы Равена, серия А, карточка 1

прогрессивные матрицы Равена, серия А, карточка 2

прогрессивные матрицы Равена, серия А, карточка 3

прогрессивные матрицы Равена, серия А, карточка 4

прогрессивные матрицы Равена, серия А, карточка 5

прогрессивные матрицы Равена, серия А, карточка 6

прогрессивные матрицы Равена, серия А, карточка 7

прогрессивные матрицы Равена, серия А, карточка 8

прогрессивные матрицы Равена, серия А, карточка 9

прогрессивные матрицы Равена, серия А, карточка 10

прогрессивные матрицы Равена, серия А, карточка 11

прогрессивные матрицы Равена, серия А, карточка 12

прогрессивные матрицы Равена, серия B, карточка 1

прогрессивные матрицы Равена, серия B, карточка 2

прогрессивные матрицы Равена, серия B, карточка 3

прогрессивные матрицы Равена, серия B, карточка 4

прогрессивные матрицы Равена, серия B, карточка 5

прогрессивные матрицы Равена, серия B, карточка 6

прогрессивные матрицы Равена, серия B, карточка 7

прогрессивные матрицы Равена, серия B, карточка 8

прогрессивные матрицы Равена, серия B, карточка 9

прогрессивные матрицы Равена, серия B, карточка 10

прогрессивные матрицы Равена, серия B, карточка 11

прогрессивные матрицы Равена, серия B, карточка 12

прогрессивные матрицы Равена, серия C, карточка 1

прогрессивные матрицы Равена, серия C, карточка 2

прогрессивные матрицы Равена, серия C, карточка 3

прогрессивные матрицы Равена, серия C, карточка 4

прогрессивные матрицы Равена, серия C, карточка 5

прогрессивные матрицы Равена, серия C, карточка 6

прогрессивные матрицы Равена, серия C, карточка 7

прогрессивные матрицы Равена, серия C, карточка 8

прогрессивные матрицы Равена, серия C, карточка 9

прогрессивные матрицы Равена, серия C, карточка 10

прогрессивные матрицы Равена, серия C, карточка 11

прогрессивные матрицы Равена, серия C, карточка 12

прогрессивные матрицы Равена, серия D, карточка 1

прогрессивные матрицы Равена, серия D, карточка 2

прогрессивные матрицы Равена, серия D, карточка 3

прогрессивные матрицы Равена, серия D, карточка 4

прогрессивные матрицы Равена, серия D, карточка 5

прогрессивные матрицы Равена, серия D, карточка 6

прогрессивные матрицы Равена, серия D, карточка 7

прогрессивные матрицы Равена, серия D, карточка 8

прогрессивные матрицы Равена, серия D, карточка 9

Тест Равена, серия D, таблица 10

прогрессивные матрицы Равена, серия D, карточка 11

прогрессивные матрицы Равена, серия D, карточка 12

прогрессивные матрицы Равена, серия E, карточка 1 

Тест Равена, серия Е, таблица 2

прогрессивные матрицы Равена, серия E, карточка 3

прогрессивные матрицы Равена, серия E, карточка 4

прогрессивные матрицы Равена, серия E, карточка 5

прогрессивные матрицы Равена, серия E, карточка 6

прогрессивные матрицы Равена, серия E, карточка 7

прогрессивные матрицы Равена, серия E, карточка 8

прогрессивные матрицы Равена, серия E, карточка 9

прогрессивные матрицы Равена, серия E, карточка 10

прогрессивные матрицы Равена, серия E, карточка 11

прогрессивные матрицы Равена, серия E, карточка 12

Бланк ответов к тесту Равена.

№ задания Серия A Серия B Серия C Серия D Серия E
1          
2          
3          
4          
5          
6          
7          
8          
9          
10          
11          
12          
Сумма
правильных
ответов
         
Нормативное
распределение
баллов
         

Обработка результатов методики Равена.

Правильное решение каждого задания оценивается в один балл, затем подсчитывается общее число баллов по всем таблицам и по отдельным сериям. Полученный общий показатель рассматривается как индекс интеллекта, умственной производительности испытуемого. Показатели выполнения заданий по отдельным сериям сравнивают со среднестатистическим, учитывают разницу между результатами, полученными в каждой серии, и контрольными, полученными статистической обработкой при исследовании больших групп здоровых обследуемых и, таким образом, расцениваемыми как ожидаемые результату. Такая разница позволяет судить о надежности полученных результатов.

Ключ (ответы) к тесту Равена.

Серия А Серия В Серия С Серия D Серия Е
1 4 2 8 3 7
2 5 6 2 4 6
3 1 1 3 3 8
4 2 2 8 7 2
5 6 1 7 8 1
6 3 3 4 6 5
7 6 5 5 5 1
8 2 6 1 4 6
9 1 4 7 1 3
10 3 3 6 2 2
11 4 4 1 5 4
12 5 5 2 6 5

Нормативное (ожидаемое) распределение баллов по сериям. Перевод полученных результатов в IQ показатель.

Количество правильных ответов/ Серия А В С D E IQ Диагноз

15

16

17

18

19

20

21

8

8

8

8

8

8

8

4

4

5

5

6

6

6

2

3

3

3

3

4

4

1

1

1

2

2

2

2

0

0

0

0

0

0

1

62

65

65

66

67

69

70

Идиотия 0-20

Имбецильность 21-25

Дебильность средняя

51-70

1.

22

23

24

25

26

27

28

29

9

9

9

10

10

10

10

10

6

7

7

7

7

7

7

7

4

4

4

4

5

5

6

6

2

2

3

3

3

4

4

5

1

1

1

1

1

1

1

1

71

72

73

75

76

77

79

80

Легкая степень дебильности

71-80

2.

30

31

32

33

34

35

36

10

10

10

11

11

11

11

7

7

8

8

8

8

8

6

7

7

7

7

7

8

5

5

5

5

6

7

7

2

2

2

2

2

2

2

82

83

84

86

87

88

90

Ниже среднего

82-90

3.

37

38

39

40

41

42

43

44

11

11

11

11

11

11

12

12

9

9

10

10

10

10

10

10

8

8

8

8

9

9

9

9

7

8

8

8

8

9

9

9

2

2

3

3

3

3

3

4

91

92

94

95

96

98

99

100

Средний

91-100

4.

45

46

47

48

49

12

12

12

12

12

10

10

10

11

11

9

10

10

10

10

9

9

9

9

10

5

5

6

6

6

102

104

106

108

110

Нормальный

101-110

5.

50

51

52

53

54

12

12

12

12

12

11

11

11

11

12

10

11

11

11

11

10

10

10

11

11

7

7

8

8

8

112

114

116

118

120

Выше среднего

112- 120

6.

55

56

57

58

59

60

12

12

12

12

12

12

12

12

12

12

12

12

11

12

12

12

12

12

11

11

11

12

12

12

9

9

10

10

11

12

122

124

126

128

130

140

Высокий

Незаурядный

121-130

7.

Различие (разница) между результатом тестирования по каждой серии и между ожидаемыми результатами по общей шкале выражается и записывается как «отклонение» (0, -1, +2, -2, +1 и т. д.).

Когда отклонение по отдельным сериям больше 2, то числовой показатель по данной серии нельзя считать надежным. Общий показатель надежен тогда, когда отклонение больше 2-х появляется только к концу испытания в последних сериях. Большее отклонение в начале теста может быть признаком дефекта интеллектуальной способности, или же свидетельствует о дефекте внимания и/или восприятия.

Нормальные значения индекса в пределах 0-4 свидетельствуют о достоверности результата исследования. При увеличении индекса до критических значений (7 и более) данные теста считаются недостоверными.

Интерпретация полученных результатов.

В соответствии с суммой полученных баллов уровень развития интеллекта испытуемого можно определить следующими способами:

1) на основании процентной шкалы (см. табл. 1);

2) с помощью перевода полученных баллов в IQ с учетом возраста испытуемого (см. табл. 2.)

3) на основе оценки уровня интеллекта по шкале умственных способностей (табл. 3.)

Таблица №1. Процентная шкала степени развития интеллекта

Проценты Степень
95 и выше I степень: особо высокоразвитый интеллект испытуемого
75-95 2 степень; незаурядный интеллект
25-74 3 степень: средний интеллект
5-24 4 степень: интеллект ниже среднего.
5 и менее 5 степень: дефектная интеллектуальная способность

В зависимости от возраста испытуемого IQ вычисляется по формуле:

IQ = (IQв / %) * 100

где % определяется по таблице №2 (Корректировка на возраст):

Возраст 14-30 35 40 45 50 55 60
% 100 97 93 88 82 76 70

Далее, ориентируясь на выявленный показатель IQ, можно определить уровень умственных способностей.

Таблица №3. Градации уровней умственных способностей.

Показатели IQ Уровень развития интеллекта
Свыше 140 незаурядный, выдающийся интеллект
121-140 высокий уровень интеллекта
111-120 интеллект выше среднего
91-110 средний уровень интеллекта
81-90 интеллект ниже среднего
71-80 низкий уровень интеллекта
51-70 лёгкая степень слабоумия
21-50 средняя степень слабоумия
0-20 тяжёлая степень слабоумия

Низкие показатели следует всегда считать менее надежными, чем высокие показатели.

Пример.

  Общая сумма баллов Серия А Серия B Серия C Серия D Серия E IQ Диагноз
Испытуемый (возраст 35 лет) 53 12 12 12 9 8 118 Выше среднего

Испытуемый в первых трех сериях не допустил ни одной ошибки, т.е. все 12 ответов в сериях A, B, C верны. В четвертой серии D три ответа не совпали в правильным вариантом, в пятой серии E таких ответов было четыре. Отклонение результатов тестирования по каждой серии не превышает 2-х (см. таблицу Нормативное распределение баллов по сериям). Следовательно, числовой показатель по каждой серии можно считать надежным. Общий показатель также надежен. Тем самым, можно говорить о достоверности результата исследования.

Уровень развития испытуемого на основании процентной шкалы: 53*100/60 = 88,33. Полученный результат означает 2 степень развития интеллекта, которую можно охарактеризовать как незаурядный интеллект (см. таблицу Процентная шкала степени развития интеллекта)

Общее количество баллов, полученных в результате диагностики по методике Равена, равно 53 и это соответствует значению коэффициента интеллекта IQ равному 118 (см. таблицу Перевод полученных результатов в IQ показатель).

Делаем поправку на возраст: (118 * 100) / 97  = 121,65 (см. таблицу №2). Таково фактическое значение IQ с учетом возраста испытуемого.

Согласно таблице №3 Градации уровней умственных способностей данное значение показателя IQ свидетельствует о высоком уровне интеллекта.

Качественный анализ результатов теста Равена. 

В серии А использован принцип установления взаимосвязи в структуре матриц. Здесь задание заключается в дополнении недостающей части основного изображения одним из приведенных в каждой таблице фрагментов. Выполнение задания требует от обследуемого тщательного анализа структуры основного изображения и обнаружения этих же особенностей в одном из нескольких фрагментов. Затем происходит слияние фрагмента, его сравнение с окружением основной части таблицы.

Серия В  построена по принципу аналогии между парами фигур. Испытуемый должен найти принцип, соответствен но которому построена в каждом отдельном случае фигура и, исходя из этого, подобрать недостающий фрагмент. При этом важно определить ось симметрии, соответственно которой расположены фигуры в основном образце.

Серия С построена по принципу прогрессивных изменений в фигурах матриц. Эти фигуры в пределах одной матрицы все больше усложняются, происходит как бы непрерывное их развитие. Обогащение фигур новыми элементами подчиняется четкому принципу, обнаружив который, можно подобрать недостающую фигуру.

Серия D построена по принципу перегруппировки фигур в матрице. Испытуемый должен найти эту перегруппировку, происходящую в горизонтальном и вертикальном положениях.

Серия Е основана на принципе разложения фигур основного изображения на элементы. Недостающие фигуры можно найти, поняв принцип анализа и синтеза фигур.

Сферы применения теста ПМР.

1. Научные исследования, направленные на оценку умственных способностей испытуемых из разных этнических и культурных групп, на изучение генетических, воспитательных и образовательных причин интеллектуальных различий.

2. Профессиональная деятельность, где данный тест может оказать помощь в обнаружении наиболее эффективных администраторов, бизнесменов, предпринимателей, управляющих, кураторов и организаторов.

3. Образование и учебные занятия, для прогнозирования будущих успехов детей и взрослых, независимо от их социального и этнического происхождения.

4. В клинике, для оценки и выявления нейропсихологических поражений, а также для контроля результатов, полученных при применении разнородных измерений интеллектуальной способности.

Раздел: тесты по психологии с ответами.

Тесты для диагностики интеллекта.

Тест Равена. Прогрессивные матрицы. ПМР. Raven Progressiv Matrices. 

Другие статьи, которые могут быть вам интересны:

Методика КОТ (Краткий ориентировочный, отборочный тест с ответами, В.Н. Бузина, Э.Ф. Вандерлик). Опросник диагностики интеллекта (IQ).

Тест на мышление и креативность. Опросник Определение типов мышления и уровня креативности. Диагностика по методике Дж. Брунера.

Тест креативности Торренса. Диагностика творческого мышления.

16 факторный личностный опросник Р. Б. Кеттелла. (Методика многофакторный опросник Кэттелла / Тест Кеттела 187 вопросов / Опросник Кетела 16 pf)

Тест на эмоциональный интеллект (Тест EQ)

Добавить комментарий

Описание методики

Прогрессивные матрицы Равена (Raven Progressive Matrices) предназначены для определения уровня умственного (интеллектуального) развития испытуемых в возрасте от 4,5 до 65 лет и старше. Матрицы Равена могут применяться на выборках испытуемых с любым языковым составом и социокультурным фоном, с любым уровнем речевого развития.

Поскольку известны три варианта матриц Равена, то следует заметить, что каждый из вариантов предназначен для проведения диагностической работы с определённым контингентом испытуемых.

Возрастные границы применимости Прогрессивных матриц Равена

Варианты теста Равена Контингент испытуемых
Цветные прогрессивные матрицы
  • 4,5 — 9 лет;
  • испытуемые с аномальным развитием;
  • реабилитационные исследования лиц старше 65 лет
Стандартные прогрессивные матрицы
  • дети от 8 до 14 лет;
  • взрослые от 20 до 65 лет
Продвинутые прогрессивные матрицы
  • испытуемые с интеллектуальными способностями выше среднего

История создания методики

Тест предложен Л. Пенроузом и Дж. Равеном в 1936 г. Р. п. м. разрабатывались в соответствии с традициями английской школы изучения интеллекта, согласно которым наилучший способ измерения фактора «g» — задача по выявлению отношений между абстрактными фигурами. Наиболее известны два основных варианта Р. п. м.: черно-белые и цветные матрицы. Разрабатывая тесты, которые были бы полезным инструментом для идентификации генетических и средовых причин интеллектуальных отклонений, Дж. Равен сознательно ставил перед собой задачу создания таких тестов, которые были бы теоретически обоснованы, однозначно интерпретируемы, просты для проведения и обработки, пригодны как для лабораторных, так и для полевых экспериментов, а также удобны для массовых обследований, проводимых на дому, в школах, на производстве и сопряженных с временными ограничениями.

Теоретические (методологические) основы

Тест «Прогрессивные матрицы Равена» относится к числу невербальных тестов интеллекта и основывается на двух теориях, разработанных гештальт-психологией: теорией перцепции форм и так называемой «теорией неогенеза» Ч. Спирмена.

Согласно теории перцепции форм каждое задание может быть рассмотрено как определенное целое, состоящее из ряда взаимосвязанных друг с другом элементов. Предполагается, что первоначально происходит глобальная оценка задания-матрицы, а затем осуществление аналитической перцепции с выделением испытуемым принципа, принятого при разработке серии. На заключительном этапе выделенные элементы включаются в целостный образ, что способствует обнаружению недостающей детали изображения. Теория Ч. Спирмена углубляет рассмотренные положения теории перцепции форм. Как показывает опыт многолетних исследований, данные, полученные с помощью теста Равена, хорошо согласуются с показателями других распространенных тестов: Векслера, Стенфорд-Бине, ШТУРа,Выготского-Сахарова. Прогрессивные матрицы Равена предназначены для определения уровня умственного развития у детей ментального возраста( 1-4 класс массовой школы). Матрицы Равена могут применяться на испытуемых с любым языковым составом и социокультурным фоном, с любым уровнем речевого развития.

Источники

  1. Прогрессивные матрицы Равена: методические рекомендации /сост. и общая редакция О.Е.Мухордовой, Т.В.Шрейбер. — Ижевск: Изд-во «Удмуртский университет», 2011. — 70с.
  2. Равен Дж.К., Равен Дж., Курт Дж.Х. Руководство к Прогрессивным Матрицам Равена и Словарным шкалам. Раздел 1. Общая часть руководства. — М.: Когито-Центр, 1997. — 76с.

Тест Равена [Онлайн примеры прогрессивной матрицы дж Равена]

При устройстве на работу соискателям нередко предлагают пройти тестирование на определение коэффициента интеллекта IQ. Самый популярный вариант задач на айкью — тест матрицы Равена. Он помогает за 20 минут определить уровень развития абстрактного мышления и часто используется, чтобы понять, подходит ли человек на должность, требующую умения мыслить логически.

Где применяется тест Равена

По результатам тестирования принимают решение о дальнейшем диалоге с соискателем, поэтому, как правило, оно проводится одним из первых на очном собеседовании, перед психологическими. Чаще всего тестирование встречается при трудоустройстве в МВД.

Тест Равена проходят соискатели в:

  • силовые структуры МВД, полицию;
  • прокуратуру;
  • ФСБ;
  • государственные компании;
  • частный бизнес.

Замечание:

От уровня интеллекта зависит способность адекватно воспринимать новую информацию и анализировать ее.

Тестирование  Равена используют и коммерческие организации, которые хотят быть уверенными, что нанимают подходящего «спеца», который не будет «пасовать» перед сложными задачами и сможет самостоятельно принимать решения.

Оценочные испытания используют для:

  • маркетологов;
  • инженеров;
  • преподавателей;
  • программистов;
  • операторов, работающих с массивами данных.

Онлайн-пример Логического теста:

На основании ответов на тест Равена руководством компании принимаются решения о переводе человека в другой отдел или о повышении. Результат тестирования имеет большое значение для личной характеристики человека.

Что определяет онлайн тест Равена

Тестирование длится 20 минут и проходит, как правило, на очном собеседовании, в отличие от тестов способностей, которые проходят дистанционно.

Задание относится к категории невербальных и культурно-свободных. То есть для его решения не нужны знания языка.

Задания представляют собой матрицы состоящих в логической связи фигур, которые требуется дополнить девятой фигурой. Для каждой задачи только один верный вариант ответа.

Преимуществом тестирования Равена считается то, что на его результаты не влияет:

  • психологический профиль;
  • черты характера, темперамент;
  • культурный код и воспитание;
  • знание языка.

Тест прогрессивные матрицы Равена – задание с динамической сложностью. По мере прохождения испытания сложность вопросов растет. Иногда сложность меняется в зависимости от числа правильных ответов.

Испытание состоит из пяти серий — A, B, C, D и E, — каждая из которых отвечает за аспект логического мышления.

  1. Серию A свободно решит любой взрослый человек. Фигуры в ней статичны — требуется проанализировать структуру матрицы, выбрав необходимое дополнение. Испытуемые со средним уровнем IQ  ошибаются здесь только по вспомогательным причинам, например,  стресс, невнимательность, спешка.
  2. Серия B сложнее. Здесь придется провести анализ пар фигур. Бывает, что испытуемый проходит только эту часть — это говорит о том, что он умеет выполнять поставленные перед ним рабочие задачи, но вряд ли справится с их постановкой подчиненным.
  3. Серия C показывает, насколько динамичен разум испытуемого, насколько он умеет работать в изменяющихся условиях или при дефиците времени, способен ли быстро переключаться. Положение фигур в матрицах постоянно меняется и требует от человека умения мыслить вне стереотипов. Соискатель, набравший высокий балл сможет легко работать на должности менеджера среднего звена с перспективой повышения.
  4. Серия D демонстрирует, насколько испытуемый способен самостоятельно ставить задачи (не только себе, но и коллективу), может ли руководить людьми. Фигуры в матрице перестраиваются – здесь придется искать дополнительные закономерности и аналогии. Если человек набирает больше 10 баллов, ему, как правило, предлагают руководящую должность.
  5. Серия E направлена на выявление выдающихся аналитических способностей. Логика изменения элементов фигур уже неочевидна, последовательности меняются группами, которые заметит только человек с развитыми интеллектуальными способностями. Если соискатель набрал максимальный балл, работодатель не упустит такого человека — он умеет мыслить стратегически, не обращая внимания на частности, и способен структурировать работу отдела или всей организации.

Испытание проходят на бумаге или на компьютере работодателя.

Хотя в интернете можно всегда скачать или пройти бесплатный тест Равена онлайн, это не поможет подготовиться к трудоустройству. Вопросы на собеседовании все равно будут другими.

Как подсчитывают результаты и баллы в тесте Равена

Интерпретацию результатов проходит в виде:

  1. «сырого» балла, описывающего общий уровень интеллекта участника;
  2. таблицы с баллами по каждой из серий вопросов.

Если кандидат старше 30 лет, вводится дополнительная поправка на возраст: полученный общий IQ балл делится на коэффициент, выраженный в процентах.

Методика подсчета баллов в тесте Равена в зависимости от возраста

Возраст, лет Коэффициент поправки
35 97 %
40 93 %
45 88 %
50 82 %
55 76 %
60 70 %

Благодаря тестированию работодатель оценивает ещё и то, насколько быстро соискатель устает от интеллектуального труда. Если к концу каждой серии однотипных заданий человек начинает неизменно ошибаться, то, вероятно, причина тому — накапливающаяся рассеянность.

Хотя усталость – естественный физиологический процесс, важно чтобы эффективность работы не падала слишком быстро. Поэтому рекомендуется приходить на собеседование выспавшимися и подготовленным.

Сложности матриц Равена

На базе матриц Райвена созданы логические тесты способностей, используемые российскими и международными работодателями для отбора кандидатов. Главная сложность двух этих типов задач – нехватка времени. Основная часть времени уходит на условие и попытку «войти в ритм», в итоге у человека не успевает найти решение.

Расшифровка результатов графического матричного теста проходит автоматически, что исключает субъективное отношение рекрутера. С другой стороны, это значит, что личное отношение к кандидату не является определяющим при принятии решение о найме.

Поскольку испытание проходит на собеседовании, немало трудностей вызывает стресс. Собеседование – само по себе волнительная процедура, а дополнительные задания, от результатов которых зависит дальнейшее трудоустройство, вызывают еще больше проблем.

Существует две причины, по которым соискатели не проходят тестирование:

  1. Главная причина – отсутствие подготовки к логическим тестам.
  2. Невнимательность – вторая по частоте причина ошибок. С одной стороны, кандидатам придется следить за таймером, а с другой – анализировать последовательности.

Полезные советы: как пройти прогрессивный тест Равена

  1. Матрицы Равена дают оценку не только интеллектуальному показателю испытуемого, но и его умениям мыслить логически и прослеживать закономерности. Ведь интеллект – это основа карьерного потенциала человека.
  2. Хотя для каждой должности и работодателя существует отдельный банк вопросов, исключающий вероятность списывания, вариантов группирования фигур не так много. Решая аналогичные тренировочные задачи, учатся быстро определять паттерны, по которым меняются последовательности.
  3. Для подготовки к тестированию решают матрицы тренировочных логических задач SHL и TalentQ. Чем больше аналогичных online заданий решает кандидат, тем лучше он подготовится к тестированию.
  4. В разных компаниях используют разные типы графических элементов: геометрические фигуры, символы, цифры, рисунки. При этом принцип остается тем же. Чтобы исключить влияние стресса, рекомендуется практиковаться на всех доступных типах логических задач.
  5. Перед тем как идти на собеседование, рекомендуется прочитать отзывы работающих сотрудников и бывших соискателей. Это поможет понять, что будет ждать на интервью.

Заключение

Подходящий сотрудник — это не только умный, но и обучаемый человек. Важны умение ужиться в коллективе, навыки командной работы, способность корректно объяснять задачи подчинённым.

Матрицы Равена — только один из этапов оценки кандидатов. И от результатов такого этапа зависит дальнейший диалог с работодателем. А это значит, что придется готовиться к каждой части собеседования.

Для теста Равена, например, достаточно тренировочных логических задач. Кроме того, рекомендуется уделить внимание проективным методикам оценки личности, психологическому тестированию, КОТ (краткий отборочный тест) и СМИЛ (MMPI).

Оцените статью

средняя оценка 5,00 (5 голосов)

Загрузка. ..

Стандартные прогрессивные матрицы


Стимульный материал

Обработка результатов и интерпретация

По окончании работы испытуемого, психолог с помощью ключа подсчитывает количество правильных ответов, причём правильное решение каждого отдельного задания оценивается в 1 балл.

Серия А Серия В Серия С Серия D Серия Е
1 4 2 8 3 7
2 5 6 2 4 6
3 1 1 3 3 8
4 2 2 8 7 2
5 6 1 7 8 1
6 3 3 4 6 5
7 6 5 5 5 1
8 2 6 1 4 4
9 1 4 7 1 5
10 3 3 6 2 6
11 4 4 1 5 3
12 5 5 2 6 5

Подсчитывается общая сумма полученных баллов (испытуемый может получить высшую оценку — 60 баллов), а также число правильных решений в каждой из пяти серий.

Общая сумма баллов является показателем интеллектуальной способности испытуемого, выявляет его умение мыслить согласно определенному методу и системе мышления.
Процентная шкала степени развития интеллекта

Проценты Степень
95 и выше I степень: особо высокоразвитый интеллект испытуемого соответствующей возрастной группы
75-95 2 степень; незаурядный интеллект для данной возрастной группы
25-74 3 степень: средник интеллект для данной возрастной группы
5-24 4 степень: интеллект ниже среднего.
5 и менее 5 степень: дефектная интеллектуальная способность

Использование приведённой таблицы определения уровня интеллектуального развития приобретает безусловную ценность в условиях обработки и интерпретации групповых данных. Обязательным требованием к составлению группы является соблюдение принципа гомогенности по определённому признаку — возрастному, половому, социально-экономическому, профессиональному, образовательному и т. д. В этом случае степень интеллектуального развития, приписываемая конкретному респонденту, фактически означает ранг этого индивида в соответствующей группе. Таким образом, психолог получает обобщённую характеристику количественных индивидуальных различий по уровню интеллектуального развития в обследованной группе.

Другой способ оценки общих результатов по Стандартным матрицам Равена заключается в переводе «сырого» балла в стандартизированный — коэффициент IQ. Такой перевод целесообразен в случаях необходимости сравнения результатов данного теста с другими методиками изучения умственных способностей (тест Векслера, ТСИ Р.Амтхауэра, тест «Домино» А.Энстея и т.п.).

Представленная ниже таблица содержит уже готовые показатели IQ согласно числу полученных испытуемым соответствующего возраста «сырых» баллов.

Количество
«сырых» баллов
Возраст в годах
8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 16-30
1 73 68 65 59 57 53 53 50 48 46 46 46
2 74 70 67 61 56 56 54 51 49 49 48 47
3 76 72 68 62 60 57 55 53 51 50 49 49
4 77 73 70 64 61 59 57 54 52 51 50 50
5 79 75 71 65 60 58 55 53 53 52 52 51
6 81 76 73 67 64 61 59 57 55 54 53 52
7 82 78 74 68 66 63 61 58 56 55 54 54
8 84 79 76 70 67 64 62 60 57 57 55 55
9 85 81 77 71 69 66 64 61 59 58 57 56
10 87 83 79 73 70 67 65 62 60 59 59 57 55
11 89 84 80 74 72 69 66 64 61 61 61 59 57
12 90 86 82 76 73 70 68 65 64 62 60 60 58
13 92 87 83 77 75 71 69 67 64 63 62 61 59
14 93 89 79 75 73 71 69 68 65 65 63 62 61
15 95 90 86 80 78 74 72 69 67 66 64 64 62
16 97 92 88 82 79 76 73 72 68 67 66 65 65
17 98 95 89 83 81 77 75 72 69 69 67 66 65
18 100 95 91 85 82 79 76 74 71 70 68 67 66
19 101 97 92 86 84 80 78 75 72 71 69 69 67
20 103 98 94 88 85 81 79 76 73 72 71 70 69
21 104 100 95 89 87 83 80 78 75 74 72 71 70
22 105 101 97 91 88 84 82 79 76 75 73 72 71
23 107 103 98 92 90 86 83 81 77 76 74 74 72
24 108 104 100 94 91 87 85 82 79 78 76 75 74
25 109 106 101 95 93 89 86 83 80 79 77 76 75
26 110 107 103 97 94 90 87 85 81 80 78 77 76
27 112 108 104 98 96 91 89 86 83 82 80 79 75
28 113 110 106 100 97 93 90 88 83 83 81 80 79
29 114 111 107 102 99 94 92 89 85 84 82 81 80
30 116 113 109 103 100 96 93 90 87 86 83 82 82
31 117 114 110 105 102 97 94 92 85 85 85 84 83
32 118 115 112 106 103 99 96 96 93 86 86 85 84
33 120 117 113 108 104 100 97 95 91 90 87 86 86
34 121 118 115 113 105 102 99 96 92 91 88 87 87
35 122 120 116 111 107 103 100 97 93 92 90 89 83
36 123 121 118 112 109 105 102 99 95 93 91 90 90
37 125 122 119 114 110 107 104 100 96 95 92 91 91
38 126 124 121 115 112 108 105 102 97 96 94 92 92
39 127 125 122 117 115 110 107 104 99 97 95 94 94
40 129 127 124 118 115 112 109 106 100 99 96 95 95
41 130 128 125 120 117 113 111 108 102 100 91 96 96
42 133 129 127 121 118 115 112 109 104 102 99 97 97
43 132 131 128 123 120 117 114 111 106 104 100 99 99
44 134 132 130 125 121 118 116 113 108 106 102 100 100
45 135 134 131 126 123 120 118 115 110 109 105 102 102
46 136 135 133 127 125 122 120 117 112 111 107 105 104
47 138 136 134 129 126 123 121 119 114 113 109 107 106
48 139 138 136 130 128 125 123 121 116 115 110 110 108
49 140 139 137 132 129 127 125 123 118 117 114 112 110
50 142 141 139 133 131 128 127 124 120 119 116 115 112
51 143 142 140 135 133 130 128 127 122 121 118 117 114
52 144 143 142 136 134 132 130 128 124 123 121 120 116
53 146 144 143 138 136 133 132 130 126 126 123 122 118
54 147 146 145 139 137 135 134 132 128 128 125 123 120
55 148 148 146 141 139 137 136 134 130 130 127 127 122
56 149 149 148 142 142 138 137 136 132 132 130 130 124
57 151 150 148 144 142 140 139 138 134 134 132 132 126
58 152 152 151 145 144 141 141 139 136 136 134 134 128
59 153 153 152 147 145 145 143 141 138 138 137 137 130
60 155 155 154 148 147 147 144 143 140 139 139 139 130

Для лиц более старшего возраста IQ вычисляется по формуле:

где % определяется по таблице:

Возраст 16-30 35 40 45 50 55 60
% 100 97 93 88 82 76 70

Далее, ориентируясь на выявленный показатель IQ, можно определить уровень умственных способностей.
Градации уровней умственных способностей

Показатели IQ Уровень развития интеллекта
Свыше 140 незаурядный, выдающийся интеллект
121-140 высокий уровень интеллекта
111-120 интеллект выше среднего
91-110 средний уровень интеллекта
81-90 интеллект ниже среднего
71-80 низкий уровень интеллекта
51-70 лёгкая степень слабоумия
21-50 средняя степень слабоумия
0-20 тяжёлая степень слабоумия

Низкие показатели следует всегда считать менее надежными, чем высокие показатели.

Если необходимо сопоставить результаты выполнения Стандартных матриц Равена с результатами других методик (на изучение мотивации, характера, темперамента, самоотношения, личностных особенностей и т.п.), то можно перевести «сырой» балл по тесту Равена не в показатели IQ, а в стены.
Перевод показателей IQ в стены

Стены 1 2 3 4 5 6 7 8 9
IQ-балл 45-58 59-72 73-86 87-100 101-114 115-128 129-142 >142

После интерпретации общего результата по тесту необходимо переходить к качественному анализу результативности выполнения заданий по сериям.

Ниже приводится краткая характеристика основных принципов построения заданий, мыслительных операций, к которым «обращены» задания, сгруппированные в одной серии.
Краткая характеристика основных принципов построения заданий

Серия А. «Принцип взаимосвязи в структуре матриц»

От обследуемого требуется дополнение недостающей части изображения. Считается, что при работе с матрицами этой серии реализуются следующие основные мыслительные процессы: а) дифференциация основных элементов структуры и раскрытие связей между ними; б) идентификация недостающей части структуры и сличение ее с представленными образцами. В серии А использован принцип установления взаимосвязи в структуре матриц. Здесь задание заключается в дополнении недостающей части основного изображения одним из приведенных в каждой таблице фрагментов. Выполнение задания требует от обследуемого тщательного анализа структуры основного изображения и обнаружения этих же особенностей в одном из нескольких фрагментов. Затем происходит слияние фрагмента, его сравнение с окружением основной части таблицы. При выполнении заданий этой серии актуализируется умение дифференцировать элементы и выявлять связи между элементами гештальта, дополнять недостающую часть структуры, сличая её с образцами.

Психологическое значение: решение зависит от уровня вни­мательности, уровня статистического представления, воображения и уровня визуального различия (дискриминации).

Серия В. «Принцип аналогии между парами фигур»

Сводится к нахождению аналогии между парами фигур. Обследуемый раскрывает этот принцип путем постепенной дифференциации элементов. При решении используется также способность постигать симметрию. Серия В построена по принципу аналогии между парами фигур. Обследуемый должен найти принцип, соответственно которому построена в каждом отдельном случае фигура и, исходя из этого, подобрать недостающий фрагмент. При этом важно определить ось симметрии, соответственно которой расположены фигуры в основном образце. На основании результативности выполнения заданий серии В оценивается способность находить аналогии между парами фигур, дифференцируя их элементы. Задание серии В состоит в нахождении аналогии между двумя парами фигур (дополнение отношений).

Психологическое значение: способность линейной диф­ференциации и суждение (умозаключение) на основе линейных взаимосвязей.

Серия С. «Принцип прогрессивных изменений в фигурах матриц»

Задания этой серии содержат сложные изменения фигур в соответствии с принципом их непрерывного развития, «обогащения» по вертикали и горизонтали. При выполнении этой серии обследуемый должен проследить закономерности изменения фигур по горизонтали и вертикали и суммировать результат в искомой фигуре. Серия С построена по принципу прогрессивных изменений в фигурах матриц. Эти фигуры в пределах одной матрицы все больше усложняются, происходит как бы непрерывное их развитие. Обогащение фигур новыми элементами подчиняется четкому принципу, обнаружив который, можно подобрать недостающую фигуру.

Психологическое значение: проявляется способность к динамической (быстрой) наблюдательности и прослеживанию непрерывных изменений, динамическая внимательность и воображение, способность представлять.

Серия D. «Принцип перегруппировки фигур»

Серия составлена по принципу перестановки фигур в матрице по горизонтальному и вертикальному направлениям. Успешность решения зависит от способности обследуемого выявлять количественные и качественные закономерности построения, как матрицы в целом, так и ее отдельных столбцов и строк. Серия D построена по принципу перегруппировки фигур в матрице. Обследуемый должен найти эту перегруппировку, происходящую в горизонтальном и вертикальном положениях.

Психологическое значение: решение зависит от способностей схватывать количественные и качественные изменения в упорядочении (составлении) фигур согласно закономерности используемых изменений.

Серия Е. «Принцип разложения фигур на элементы»

Априорно данная серия считается наиболее сложной. Процесс решения заданий этой серии заключается в анализе фигур основного изображения, выявления значимых признаков, которые могут варьироваться, и последующей «сборки» недостающей фигуры по частям. Выполнение этой серии ориентировано на выявление способности к аналитико-синтетической деятельности. Серия Е основана на принципе разложения фигур основного изображения на элементы. Недостающие фигуры можно найти, поняв принцип анализа и синтеза фигур. Серия Е является самой сложной из всех и позволяет судить о развитости у испытуемых способности к аналитико-синтетической деятельности. Здесь требуется складывать и вычитать элементы фигур, смешивать части согласно алгебраическому принципу. Недостающий член структуры находят с помощью алгебраических операций с остальными членами структуры.

Психологическое значение: способность наблюдать сложное количественное и качественное различие кинетических, динамических рядов. Высшая форма абстракции и динамического синтеза.

Как видно из приведённого описания, материал теста «обращён» в целом к традиционным логическим операциям (сравнение и различие, анализ и др.). Невербальный характер материала значительно «высвобождает» весь текст от влияния социокультурных особенностей жизнедеятельности конкретного обследуемого и предоставляет возможность определить (с определённой долей вероятности) его «чистую» способность к целенаправленному поиску необходимого решения.

При интерпретации результатов индивидуального тестирования важным направлением анализа является определение способа решения, которого придерживался испытуемый (логическое рассуждение, угадывание, работа вслепую, интуитивный метод, отказ). Кроме того, при неоднородности содержательной и непоследовательной, но колеблющейся трудности отдельных серий и заданий (не линейная, а прогрессирующая ритмика), нельзя по результатам Равена составить последовательный график утомляемости или продуктивности.

Прогрессивные матрицы Равена.

Тест для детей. Построен на основе гештальтпсихологии. Существует в двух вариантах.

  1. черно-белые матрицы Равена — от 8 лет до 65 лет. Интерпретация результатов для каждого возраста. Материал — черно-белый, состоит из 5 серий по 12 примеров.
  2. цветные матрицы Равена — от 5 до 11 лет. Материал — цветной, 3 серии по 12 заданий.

Прогрессивные матрицы Равена — принцип прогрессивности: каждое задание методики готовит испытуемого для следующего более сложного задания.

Каждое задание в каждой серии сложнее предыдущего. Выполнение каждого задания готовит к выполнению следующего.

Каждая серия построена так:

Серия A — дополнить недостающие части изображения. Умение дифференцировать отдельные компоненты структуры, умение устанавливать связи между разными компонентами структуры, умение идентифицировать недостающие части структуры, сличать ее с представленными вариантами.

Серия B — требуется найти аналогии между парами фигур. Диагностируется мышление по аналогии и понимание симметрии.

Серия C — задания содержат сложное изменение фигур в соответствии с принципом их непрерывного развития. Задача — установить принцип развития. Найти ответ.

Серия D — задания составлены по принципу перестановки фигур в матрицы по горизонтали и вертикали.

Серия E — в задании заложен принцип разложения фигур на отдельные элементы. Требуется проявить умение по разложению на элементы, потом синтезировать в целое.

Показатель: индекс вариабельности (подсчитывается на Западе).

Для подсчета в руководствах методики таблицы, в которых представлено распределение сырых балов по сериям. Каждый из возможных балов по сериям.

Для подсчета индекса вариабельности сопоставить с таблицей, подсчитать разницу между табличным значением и реальным. Разница берется без учета знака. Сумма разниц по всем 5 сериям.

Для чего индекс вариабельности? Для достоверности результата испытуемого. Испытуемый может выполнить задания методом угадывания. Не используя возможностей наглядного мышления.

Если индекс вариабельности от 0 до 4 — результаты достоверны.

Если индекс вариабельности от 5 до 6 — то результаты можно подвергнуть сомнению.

Если индекс вариабельности от 7 и выше — результаты испытуемого недостоверны.

Цветные матрицы Равена.

Используются дефектологами, психологами для детей от 5 до 11 лет. Диагностируются отклонения от нормы в мышлении ребенка. Диагностика проводится индивидуально.

1. Первое задание открывается перед ребенком и объясняется, как делать, дается инструкция.

Например: наверху коврик с дырочкой, какую заплатку нужно поставить?

Психолог должен объяснить, почему остальные 5 кусочков не подходят (какие линии, какой узор…)

Психолог должен продумать объяснение, чтобы научить ребенка думать и дальше выполнять последующие задания. Ребенку дается возможность ответить. Если правильно, то 1 бал за первое задание. Если ответ неправильный, то предлагается подумать еще. За вторую попытку ребенок получает половинку бала. Если верная попытка третья, то он получает одну четвертую бала. Стимулирующая помощь: психолог напоминает, объясняет на линиях, ковриках, узорах… Если помощь не помогает, то у психолога наготове должна быть вырезана эта матрица и все 6 кусочков. Решение переходит из наглядно-образного в наглядно-действенный образ. Если ребенок не может сделать, то психолог показывает сам. Баллы начисляются только в случае первых трех попыток.

2. Аналогии между парами фигур

3. Серия Б-аналогия между парами фигур. Для выявления категории детей с отклонениями.

Розанова провела этот эксперимент в школе 1, 2 классов. Выделены 4 уровня успешности выполнения этой методики.

  • 4-ый, высший уровень выполнения. Если ребенок набрал от 28 балов и больше.
  • 3-ий, высокий уровень. Если ребенок набрал от 23 до 28 балов.
  • 2-ой уровень, низкая успешность. Если ребенок набрал от 17 до 23 балов.
  • 1-ый уровень, меньше 17 балов.

Оценка развития ребенка 1, 2 классов. Если выполнение на 3 и 4 уровне, следовательно, ребенок нормальный по интеллектуальному развитию. Если на 1 или 2 уровне, следовательно, возможны отклонения в развитии. Если ребенок дал 13 балов или меньше, следовательно, умственная отсталость. Время не ограничивается.

Стандартизация у нас в России только для 1, 2 классов цветных матриц Равена!!!

Цветные прогрессивные матрицы Равена

Цветной вариант Прогрессивных Матриц Равена предназначен для обследования детей от 5 до 9 лет.

Инструкции по проведению обследования дошкольников с помощью Цветных Прогрессивных Матриц Равена

Процедура индивидуального тестирования по Прогрессивным Матрицам Равена чрезвычайно проста. В отличие от многих других тестов, здесь нет необходимости жестко придерживаться какой-либо специальной словесной инструкции. Основные требования состоят в том, чтобы, во-первых, удостовериться, что испытуемые понимают, что и как они должны сделать. Во-вторых, следует обеспечить соответствие принятой в данном обследовании процедуры общепринятым стандартам, чтобы была возможность сравнивать полученные данные с нормативными.

При использовании книжной формы теста нельзя увидеть, как будет выглядеть матрица с вставленным в ее вырез тем или иным фрагментом, следствием чего могут быть не очень ответственное отношение некоторых детей к заданию. Поэтому важно всякий раз удостовериться, что ребенок внимательно посмотрел на рисунок и что он убежден, что указанный им фрагмент является единственным, который правильно дополняет матрицу.

Тому, кто проводит тест, необходимо иметь следующие материалы: инструкции, экземпляр тестового буклета. Не допускается делать никаких пометок в тестовом буклете с ЦПМ. В процессе предварительной беседы занесите данные об испытуемом в бланк ответов, удостоверившись, что указанный возраст соответствует дате рождения.

Откройте буклет на первом задании А1.
— Посмотри сюда.
Укажите на верхнюю фигуру
— Ты видишь, что из этой картинки вырезан кусочек. Каждый из этих кусочков внизу…
Укажите на каждый из фрагментов по очереди
— …имеет подходящую форму, чтобы заполнить вырез, но только один из них подходит по рисунку. Номер 1 имеет правильную форму, но неправильный рисунок. Номер 2 вообще не имеет рисунка. Номер 3 совсем неправильный. Номер 6 почти правильный, но вот здесь не подходит.
Укажите на белое пятно на фрагменте номер 6.
— Только один из кусочков правильный. Покажи, какой из них подходит, чтобы дополнить рисунок.

Если испытуемый не показывает на правильный фрагмент, продолжайте объяснение, пока суть задания не будет им полностью уяснена.
Переходите к заданию A2.
— А теперь покажи кусочек, который подойдет сюда.
Если испытуемый не справляется, продемонстрируйте ему снова задание А1, а затем опять попросите решить задание А2. Если задание выполнено правильно, переходите к заданию A3, работая по той же схеме.
Перейдя к заданию А4, перед тем как предоставить испытуемому возможность подумать и указать на один из фрагментов скажите:
— Посмотри внимательно на эти кусочки.
Укажите пальцем поочередно на каждый из фрагментов.
— Только один из этих кусочков подходит для завершения рисунка. Будь внимателен. Сначала посмотри на каждый из этих шести кусочков.
Снова укажите на каждый из шести фрагментов.
— Теперь покажи на кусочек, который подойдет сюда.
Укажите на рисунке место, куда должен подойти фрагмент.
Когда испытуемый укажет на один из фрагментов, независимо от правильности его ответа, скажите. ..
— Этот кусочек действительно подходит сюда?
Если испытуемый скажет «да», примите его выбор с одобрением независимо от того, правильный он или неправильный. Если он захочет изменить свой выбор, скажите…
— Хорошо. Тогда покажи на правильный кусочек,
Независимо от правильности ответа снова спросите…
— Этот подходит?
Если испытуемый удовлетворен своим решением, примите его выбор независимо от правильности, но, если вам кажется, что он все еще сомневается, спросите…
— Ну так какой же из кусочков, по твоему мнению, действительно правильный?
Отметьте номер окончательного выбора в соответствующей части бланка.

Предъявите задание А5 тем же способом, что и задание А4.
На любой стадии тестирования в интервале между А1 и А5 задание А1 может быть использовано заново, чтобы еще раз показать испытуемому, что надо сделать, с последующей просьбой к нему попробовать снова выполнить соответствующее задание. Если испытуемый не справляется с заданиями А1A3, следует перейти к планшетной форме теста.

Если эти пять заданий решены, переходите к заданию А6.
— Посмотри внимательно на этот рисунок. Какой из этих кусочков…
Укажите на каждый фрагмент по очереди.
— …подходит сюда?
Покажите на свободное место, которое следует заполнить.
— Будь внимателен, подходящий кусочек только один. Какой? Если ты действительно уверен, что нашел правильный кусочек, укажи на него.
Запишите окончательный ответ.

По мере предъявления следующих заданий продолжайте использовать те же инструкции до тех пор, пока в них есть необходимость.
Если ребенок проявляет беспокойство по поводу небольших дефектов на рисунках, убедите его, что об этом не стоит беспокоиться.

Если ребенок «застрял» на конкретном задании, предложите ему двинуться дальше и посмотреть, не справится ли он со следующими заданиями, а затем вернитесь к заданию, вызвавшему трудности.
Если вы сочтете это нужным, то можно предложить ребенку просто угадать ответ, так как «догадки иногда бывают правильными».

Завершив серию А, предъявите первое задание Серии АB, снова указывая по очереди на каждую из трех фигур на матрице и на пространство, подлежащее заполнению.
— Ты видишь, как они расположены. Так. Так. Так. Что тут должно получиться? Какой из кусочков подходит сюда? Будь внимателен. Посмотри на каждый из них по очереди. Правильный — только один. Который?

При выполнении заданий от АB1до АB5, после того как ребенок указал на один из фрагментов, правильный или неправильный…
— Он действительно подходит, чтобы дополнить рисунок?
Укажите на рисунок на матрице и на вырез в ней.
Как и прежде, если испытуемый отвечает «да», примите (и запишите) его вы­бор с одобрением. Если ребенок хочет изменить свой выбор, действуйте так же, как в Серии А, и примите его окончательный выбор.
При выполнении шестого задания ребенка не следует спрашивать, правильный ли выбор он сделал. Просто скажите …
— Посмотри внимательно на картинку.
Укажите по очереди на каждую фигуру на матрице и на пространство, подлежащее заполнению.
— Будь внимателен, только один из этих кусочков правильно дополняет картинку.
Укажите по очереди на каждый из фрагментов.
— Какой из них?
Зафиксируйте окончательный выбор на бланке, либо записывая номер выбранного фрагмента рядом с номером задания, либо для бланка легкого подсчете зачеркивая номер выбранного ответа одной короткой линией.

Если была сделана ошибка или испытуемый хочет изменить свой ответ, зачеркните ранее записанный номер, а затем запишите номер окончательного выбора. При работе с бланком легкого подсчета зачеркните отмененный ответ еще одной чертой.
Не пытайтесь стирать неправильно отмеченные ответы. Те же указания можно использовать при работе с остальными заданиями Серий АB и В, пока это является целесообразным.

Планшетная форма тестового буклета . Серия А.

Cкачать буклеты Серии A, AB, B в PDF-формате

Оценка и интерпретация

Подсчет баллов

За каждый правильный ответ начисляется один балл. Будьте внимательны и старайтесь не допустить потери бланков — чистых или использованных, поскольку каждый из них содержит ключ для подсчета баллов по тесту.

Если обследуемый делает ошибки в первых пяти задачах Серии А , то нельзя считать, что он понял идею задачи. Полученные при этих условиях баллы, как правило, нужно признать недостоверными, несмотря на то, что общий балл при этом может оказаться и больше десяти за счет решения задач путем случайного угадывания правильного ответа среди шести альтернативных вариантов.

При использовании планшетной формы теста некоторые дети после того, как они положили правильный фрагмент теста на место, беспокоятся, что он не вполне хорошо совпал с вырезом, и хотят его заменить. По этой причине, а также потому, что «смышленые» дети хотят поиграть с тестовым материалом, желательно спросить ребенка, по какой причине он сдвигает или перемещает фрагмент. При необходимости задание теста может быть разъяснено еще раз, чтобы ребенок понял, что в первую очередь надо положить на место правильный фрагмент, а потом, попробовав другие, вернуть правильный на место и что мелкие несовпадения фрагмента с вырезом не имеют никакого значения.

Если дети не в состоянии выразить свои суждения словами, это не значит, что они не могут решить задачу интуитивно. Правильное решение никогда не следует фиксировать как «ошибку», если ребенок не может его объяснить. Напротив, неверные ответы, исправляемые в результате проб и ошибок, дают значимую психологическую информацию, хотя обычно они не включаются в общий балл по тесту из соображений строгости интерпретации процентильных результатов данного ребенка по таблице нормативов. В тех случаях, однако, когда ребенок осознанно обнаружил и исправил свою ошибку, окончательно вставленный фрагмент может быть учтен.

Когда тест проводится индивидуально по книжной форме , засчитывается как «верный» или «ошибочный» тот фрагмент, на который испытуемый указывает как на свой окончательный выбор.

Когда книжная форма используется для самотестирования или при групповом тестировании с использованием открытых бланков регистрации ответов, всякому, кто записывает больше, чем одну цифру против номера любого задания, необходимо сказать, чтобы он вычеркнул все, кроме одной. Если это обнаружено после завершения процедуры тестирования, рассматривается только последний номер справа независимо от того, верны или ошибочны другие ответы.

Когда используется бланк легкого подсчета, испытуемым необходимо показать, как исправлять ошибки, зачеркивая крестом (X) неправильные ответы и оставляя перечеркнутым одной короткой чертой номер своего окончательного выбора.

Несогласованности и ошибки.

Когда используется книжная форма теста, несогласованность в распределении баллов испытуемого можно оценить вычитанием его балла по каждой серии из баллов, ожидаемых при таком же общем балле.

Представление результатов

Наиболее адекватным способом интерпретации значимости полученной индивидом общей оценки является ее соотнесение с выраженной в процентах относительной частотой, с которой эту оценку получают испытуемые той же возрастной группы. Преимущество этого способа над другими состоит в том, что он не использует никаких априорных допущений о развитии интеллектуальных способностей в детстве вроде идей о его равномерном или симметричном распределении. В практических целях удобно рассматривать определенные процентные доли населения и в соответствии с этим группировать баллы респондентов. Это позволяет отнести респондента в соответствии с полученным баллом к той или иной группе.

УРОВЕНЬ I. «Супер-интеллектуал», если оценка равна или больше 95% для данной возрастной группы.
УРОВЕНЬ II. «Интеллектуальные возможности явно выше среднего», если оценка равна или больше 75%; II+ , если оценка равна или больше 90%.
УРОВЕНЬ III. «Средний интеллект», если оценка лежит между 25% и 75%; III+, если оценка выше, чем медиана или 50%; III-, если оценка ниже , чем медиана.
УРОВЕНЬ IV. «Интеллектуальные возможности явно ниже среднего», если оценка равна или меньше 25%; IV-, если оценка равна или меньше 10%.
УРОВЕНЬ V. «Существенное снижение интеллекта», если оценка равна или меньше 5% для соответствующей возрастной группы.

Общий балл, согласованность оценки и достигнутый уровень развития удобно представлять в следующем виде:
Общий балл 24
Несогласованности -1,0,+1
Уровень II +
Количество ошибок: Нормальное.

Усредненные возрастные нормативы выполнения Цветных прогрессивных матриц (вся серия — А + АВ + В)
Возраст ребёнка Среднее значение
(баллы)
Разброс (в баллах)
4,5 — 5,5 лет 14 8-22
5,5 — 6 лет 17 12-24
6 — 6,5 лет 18 13-27
6,5 — 7 лет 20 14-29
7 — 7,5 лет 22 15-30
7,5 — 8 лет 23 16-31
8 — 8,5 лет 24 17-32
8,5 — 9 лет 26 18-34
9 — 10 лет 29 20-35
10 — 11 лет 32 21-35

Цветные прогрессивные матрицы Дж.

Равена. Перевод серых баллов в IQ.

     Познакомилась я с цветными матрицами будучи на последнем курсе института в процессе написания выпускной квалификационной работы. Методика мне понравилась своей относительной простотой. Использовала я ее в модификации Т.В. Розановой. Но столкнулась с трудностью: я нигде не могла найти таблицы (или хотя бы намека на эти таблицы) перевода серых баллов, которые получаются по методике, в IQ.  На просторах Интернета этой информации просто не было. Это затруднение мне не помешало успешно защитится. Но, однажды, совершенно случайно ко мне в руки попали заветные таблицы… И теперь я спешу поделиться ими со своими коллегами.

Немножко об опыте использования методики: что лично для меня значимо?

     Цветные прогрессивные матрицы Дж.Равена могут быть использованы для обследования познавательной сферы детей от 4,5 до 9 лет (5-11,5 лет). В первую очередь, методика в большей степени предназначена для оценки интеллекта детей в указанном выше возрастном диапазоне. Но если взглянуть на стимульный материал, то что мы видим? Для решения предъявленной задачи ребенок оперирует образами в плане представлений, и решает задачу без участия практических действий.  Характер стимульного материала говорит о том, что методика предназначена, в первую очередь, на изучение наглядно-образного мышления. Но мне не давал покоя принцип «прогрессивности», который заключается в том, что сначала ребенку предлагаются совсем уж легкие задания, которые являются основой для выполнения последующих заданий.  То есть реализуется принцип «от простого к сложному». Фактически, можно заключить, что методика направлена на изучение способности к выявлению закономерностей (по аналогии). Следовательно, можно заключить, что она исследует мыслительные операции (словесно-логическое мышление). Таким образом, после обследования ребенка с помощью цветных прогрессивных матриц можно сделать некоторые выводы о развитии двух видов мышления.

     Далее, привожу цитату из «Индивидуальная и психологическая диагностика дошкольника» А. Н. Веракса.

      Впервые нормы для этой методики были разработаны в 1949 году в Шотландии, а затем в 1982 г. (см. таблицу № 1). Эти нормы, охватывают меньший возрастной диапазон, чем нормы, полученные в результате стандартизации методики в США между 1983 и 1993 годами (см. таблицу № 2). Нормы для США ниже шотландских норм, однако при проведении исследований в России предпочтительнее использовать именно их, поскольку Россия – многонациональная страна, а в исследованиях, проведенных в США, участвовали представители разных народностей.

Таблица 11

Нормы Дамфриз, Шотландия (1982 год)

Возраст в годах (месяцах)

Процентиль 6(3)- 6(8) 6(9)- 7(2) 7(3)- 7(8) 7(9)- 8(2) 8(9)- 9(2) 8(9)- 9(2)
95

90

75

50

25

10

5

26

23

20

17

14

12

11

26

26

21

18

15

12

11

28

25

21

18

16

13

12

25

24

22

18

14

13

12

31

28

23

20

17

14

13

28

27

23

21

17

15

14

32

30

25

22

18

15

14

29

28

25

22

19

16

15

33

32

27

24

20

16

14

33

32

28

24

20

17

14

34

33

29

26

22

17

15

33

31

28

26

20

17

16

п 42 47 54 38 55 30 44 33 48 47 52 41

Таблица 21

Нормы США (1986 год)

Возраст в годах (месяцах)

Процентиль 5(3)- 5(8) 5(9)- 6(2) 5(3)- 6(8) 6(9)- 7(2) 7(3)- 7(8) 7(9)- 8(2) 8(3)- 8(8) 8(9)- 9(2) 9(3)- 9(8) 9(9)- 10(2) 10(3)- 10(8) 7(3)- 11(2) 10(3)- 11 (8)
95

90

75

50

25

10

5

23

21

17

12

11

9

8

25

23

19

14

12

10

9

28

25

21

16

13

11

9

30

27

23

18

14

12

10

31

29

25

20

15

13

11

32

30

27

22

17

14

12

33

31

29

24

19

15

12

34

32

30

26

21

16

13

35

33

31

27

22

17

14

35

33

32

28

23

18

15

35

34

32

29

24

19

16

35

34

33

30

25

20

17

35

35

34

31

26

21

18

Особенности проведения методики

     Действия испытуемого в ходе методики однотипны: он должен найти некоторую закономерность и выбрать из предложенных элементов недостающий фрагмент узора.

     Последовательность предъявления заданий не подлежит изменению. Тестовая процедура предполагает отсутствие какой-либо обратной связи со стороны психолога. Если испытуемый сомневается в выборе правильного ответа, нужно добиться, чтобы он высказал какое-то мнение, в крайнем случае в качестве ответа принимается последний вариант. При этом испытуемый не должен объяснять свой выбор – вполне достаточно словесного или жестового указания на фрагмент.

Интерпретация методики

За каждый правильный ответ испытуемому начисляется один балл. Если ребенок неправильно выполнил первые пять заданий, о выполнение методики прекращается, поскольку считается, что испытуемый не понял принцип решения.

После подсчёта баллов полученный результат сравнивается с показателем процентильной (относительной) частоты (процент испытуемых того же возраста, которые правильно решили столько же задач, то есть получили такой же балл).

По результатам теста Равена можно выделить  пять уровней развития интеллекта (см. табл. 3)

Таблица 3

Показатель процентильной частоты (р)

Уровень развития интеллекта

Уровень развития интеллекта

в баллах (IQ)

Более 95

75-95

25-75

5-25

Менее 5

Высокий

Выше среднего

Средний (норма)

Низкий

Сниженный интеллект

Более 124

110-124

90-110

75-90

Менее 75

     Допустим, что по результатам методики Дж. Равена ребенок в возрасте 6 лет 7 месяцев набрал 22 балла. В этом случае в таблице 2 мы находим возраст ребенка, который попадает в интервал 6 лет 3 месяца – 6 лет 8 месяцев. Далее, в вертикальном столбце мы находим количество баллов, которые набрал ребенок.  Нашем случае 22 балла попадают в интервал 21-25 баллов, что, как видно из таблицы, соответствуют процентному интервалу 75-90. По таблице 3 мы можем дать характеристику этого интервала IQ – 110-124, что соответствует уровню развития интеллекта выше среднего.

     Таким образом, данная методика позволяет получить количественную характеристику (выраженную в показателе процентильной частоты, которой соответствует определённый уровень развития интеллекта) уровня развития основного средства мышления – интеллекта.

Литература:

  • 1 Равен Дж. К., Курт Дж. Х., Равен Дж. Руководство к прогрессивным матрицам Равена и словарным шкалам. – М., 1996.
  • Веракса А.Н. Индивидуальная психологическая диагностика дошкольника: Для занятий с детьми 5-7 лет. – М.: МОЗАИКА-СИНТЕЗ, 2014. – 144 с.

Ворон тест интерпретация результатов / Психометрические тесты

тест прогрессивных матриц Равена это психометрический тест, основной целью которого является измерить уровень интеллекта, также известный как фактор G. Этот тест был разработан Джоном С. Рейвеном и впервые был проведен в 1938 году. Тест основан на выяснении того, какой элемент отсутствует в матрице..

Результаты теста Равена могут быть использованы для психометрического теста, психологического теста или для процесса отбора персонала. Если вы хотите знать все, что скрывает этот любопытный человек Тест Равена и его интерпретация результатов, В Psychology-Online мы предлагаем вам полный отчет. Кроме того, мы предлагаем вам технический лист в конце, чтобы вы могли подготовиться к выполнению этого теста интеллекта.

Вы также можете быть заинтересованы в: Типы тестов интеллекта Индекс

  1. Что такое тест Ворон и что он измеряет
  2. Интерпретация результатов теста Ворон
  3. Технический паспорт теста прогрессивных матриц Raven
  4. Ворон онлайн тест

Что такое тест Ворон и что он измеряет

Как следует из названия, психометрические тесты тесты и анкеты, цель которых измерение душа (Ум). Эти методы возникли как инструменты, позволяющие определять различные способности, которыми обладают люди, и, таким образом, узнавать нас немного больше в разных аспектах нашей жизни..

Тест Равена является частью набора психометрических тестов, предназначенных для оценки интеллекта, в частности, преувеличить G-фактор.

¿Что такое фактор G??

Чарльз Спирмен, Профессор автора этого теста Рейвена сделал теорию, известную как «эклектическая теория двух факторов». Эта теория утверждала, что все способности человека имеют определенный фактор (фактор е) и, в свою очередь, общий фактор (фактор g). Исходя из этой теории, Джон С. Рейвен разработал этот тест для измерения общего интеллекта человека. Согласно двухфакторной модели Sprearman, мы можем измерять интеллект по-разному, Raven использовал вычет отношений и коррелятов в вашем тесте, чтобы иметь возможность измерить фактор G.

В настоящее время вместо измерения этого фактора мы обычно используем другие типы тестов, чтобы иметь возможность измерить IQ или IQ. Тем не менее, тест прогрессивных матриц продолжает использоваться значительной частью общения психологов и психиатров..

Ворон тест: ¿что это измеряет?

Согласно теории Спирмена, Рэйвена и других теоретиков это психометрическое течение. G-фактор эквивалентен способности решать логические, математические задачи и общеобразовательный потенциал человека.

Исходя из решения матриц и выяснения, какой части изображения не хватает, тест Равена измеряет вышеупомянутый фактор G. Кроме того, этот тест измеряет не только логические рассуждения, поскольку это невербальный тест, основанный на изображениях., он также измеряет способность к абстракции.

Интерпретация результатов теста Ворон

Тест Равена основан на администрировании 60 матриц или задач, разделенных на 5 серий. Эти матрицы имеют границу или геометрическую композицию с зазором, который должен быть заполнен любым из вариантов, показанных в нижней части тестовых таблиц Raven..

Тест ворона решен: ¿как оценить?

Каждая решенная задача удовлетворительно считается успехом, исправить тест можно с помощью корректирующего листа или вручную. Существуют разные версии и шкалы одного и того же теста для измерения интеллекта в разных группах населения:

  • SPM: По исходной шкале психометрического теста Ворон, максимальный балл равен количеству матриц в сумме, в данном случае 60.
  • CPM: Шкала рассчитана на детей от 4 до 10 лет, максимальная оценка в этом случае составляет 36 баллов.
  • APM: Шкала, адаптированная для обследования интеллекта у подростков и взрослых с высокими способностями, серия I содержит максимальный балл 12 баллов.
  • AMP II: предыдущая адаптация, но с максимальной оценкой 36 баллов

После того, как вы добавите все правильные ответы, например, угадав 40 из 60 прогрессивных матриц, вы должны проверить соответствие этого результата. Для этого нужно наблюдать, если в 5 серии количество ошибок примерно одинаково. Согласно Тестовая таблица Raven, не может быть разницы более двух ошибок в каждой серии.

После того, как у нас будет результат, мы должны сверяться с таблицей процентилей в зависимости от того, какой у нас возраст или у того, кто прошел тест. Получив процентиль, мы должны сравнить его с таблицей интеллекта, которая связывает каждый ранг с интеллектуальным потенциалом. Если у вас есть какие-либо сомнения относительно этих концепций, вы можете взглянуть на эту статью о введении в психометрию..

Интерпретация результатов

Далее мы предлагаем вам вкладка со шкалами и процентилями так что вы можете научиться интерпретировать ответы на этот тест:

Технический паспорт теста прогрессивных матриц Raven

Как только мы увидим, как тест Равена можно интерпретировать, давайте подытожим его психометрические характеристики с техническим листом.

  • Наименование теста: Тест прогрессивных матриц, общая шкала ворона
  • цель: это невербальный тест, целью которого является измерение IQ или G-фактора интеллекта. .
  • Материал: 60 листов прогрессивной матрицы, карандаш и лист ответов для измерения результатов.
  • администрация: человека, который собирается выполнить тест Ворона, просят проанализировать представленную ему матрицу и выбрать один из вариантов, который наилучшим образом соответствует разрыву, наблюдаемому в каждой матрице, как по горизонтали, так и по вертикали..
  • ответы: каждый правильный ответ — это балл, где 0 — минимальная оценка, а 60 — максимальная..
  • листы: тест Ворон содержит 60 листов для ответа.
  • Надежность и обоснованность: индексы надежности и достоверности превышают оговоренные значения, что считается правильным тестом, поэтому их баллы можно экстраполировать на население и точно измерять то, что они намерены измерять.

Преимущества теста Ворон

Будучи невербальным тестом и стандартизированным для каждого сегмента населения, этот тест очень полезен для измерения интеллекта независимо от уровня образования. Кроме того, как мы заметили, интерпретация результатов очень проста и быстра.

Все эти характеристики делают тест прогрессивных матриц, психометрический тест, который все еще используется для его многих преимуществ.

Ворон онлайн тест

Чтобы закончить эту статью, мы предлагаем вам несколько примеров тестовых листов Raven.. ¿Вы можете решить эти матрицы, которые мы предлагаем?

Если вы хотите измерить свой IQ, мы предлагаем вам следующий тест: тест на интеллект.

Эта статья носит исключительно информативный характер: в онлайн-психологии у нас нет факультета, чтобы поставить диагноз или рекомендовать лечение. Мы приглашаем вас пойти к психологу для лечения вашего случая в частности.

Если вы хотите прочитать больше статей, похожих на Ворон тест: интерпретация результатов, Мы рекомендуем вам войти в нашу категорию психометрического теста.

Фотографии Raven Test: интерпретация результатов

Тест Равена уровень интеллекта прогрессивные матрицы

Тест Равена, предложенный ещё в далеком 1936 г, считается одним из самых «чистых» способов измерения фактора общего интеллекта g. За всю историю использования он постоянно подтверждает свою высокую валидность и включен в набор всех стандартных методик, используемых для психологической диагностики в самых разных сферах. Теоретической основой теста Равена является теория гештальтпсихологии о восприятии форм и теория неогенеза К.Спирмена.

Тест Равена представлен в 2-х вариантах: детском (с цветными матрицами) и черно-белом взрослом (для возраста от 14 лет).

Взрослый черно-белый тест Равена состоит из 60 матриц, в которых испытуемому нужно заполнить пропущенные элементы из предложенных вариантов. Все карточки разделены на 5 групп (А, В, С, D, Е), по 12 в каждой. Прогрессивными матрицы называют потому, что сложность заданий увеличивается как от первой до 12-й матрицы внутри каждой серии, так и от серии к серии в целом.

Попробуйте пройти тест Равена и определить уровень g. Сразу отметим, что решение задач требует концентрированного внимания как в объеме, так и в распределении. Поэтому этот тест отражает не только интеллектуальные способности, но и эмоциональное состояние обследуемого в момент эксперимента (см. тест уровень тревожности Ч. Д. Спилбергера и Ю. Л. Ханина).

Исследование прогрессивными матрицами Равена (как и тесты Айзенка и др. подобные) не является инструментом измерения «общего интеллекта», а в первую очередь инструментом исследования остроты и точности внимания, ясности мышления, способности концентрироваться, системно, планомерно и методично мыслить. В отличие от многих вербальных тестов (наподобие сканвордов-ребусов), тест Равена является чистым невербальным, «трансязыковым» и «транскультурным» исследованием, получающим доступ к мыслительным процессам, на которые не влияет вербализация.

Тест равена:

описание серий

Серия А. Исследует способность дифференциации основных элементов структуры и раскрытие связи между ними, идентификации недостающей части структуры и сравнения их с образцами. Уровень оценок в этой серии зависит от уровня внимательности, уровня статистического представления, воображения и уровня визуального различия (дискриминации).

Серия В. Исследует способность дифференциации основных элементов, способность находить симметричность фигур, способность к линейной дифференциации и выводам на основе линейных взаимосвязей.

Серия С. Исследует способность испытуемого к динамической (моментальной) наблюдательности, прослеживанию непрерывных изменений, динамической внимательности и воображению. В матрицах этой серии предлагаются варианты со сложными изменениями фигур по принципу непрерывного превращения и изменения в вертикальном и горизонтальном направлении с суммированием/вычитанием этих изменений, которые нужно определить в недостающей фигуре.

Серия D. Исследует способность испытуемого обнаруживать количественные и качественные изменения, лежащие в основе алгоритма упорядочения фигур.

Серия Е. Исследуется аналитико-синтетическая деятельность мозга как высшей формы абстракции и динамического синтеза, способность испытуемого складывать и вычитать элементы фигур, смешивать части согласно алгебраическим алгоритмам, так как в решении задачи нужно анализировать фигуру основного изображения и собирать недостающую фигуру по частям (складывая, смешивая или вычитая элементы фигур).

Интерпретация результатов — по завершении теста!

Смотрите еще тесты:

Опросник Русалова (ОФДСИ и В-ОСТ): структура темперамента онлайн

Уровень тревожности Ч. Д. Спилбергера и Ю. Л. Ханина

Тест — опросник Г. Шмишека, К. Леонгарда. Акцентуации характера и темперамента личности

Диагностика акцентуаций характера «Чертова дюжина» (А.С. Прутченков, А.А. Сиялов)

Тест личностная шкала проявления тревоги (Дж. Тейлор)

Опросник Филлипса диагностика школьной тревожности

Восемь тестов Айзенка проверки IQ

Читайте больше по теме:

Понимание результатов тестирования | Педагогическая психология

Для понимания результатов стандартизированных тестов важно знать различные термины и концепции, которые являются фундаментальными для «теории измерения», академического исследования измерения и оценивания. В предыдущей главе обсуждались две основные области теории измерений: надежность и достоверность; В этой главе мы сосредоточимся на концепциях и терминах, связанных с оценками за тесты.

Основы

Распределения частот

Частотное распределение — это список количества студентов, набравших каждый балл по тесту.Если 31 учащийся сдает тест, а оценки варьируются от 11 до 30, то частотное распределение может выглядеть как в таблице 1. Мы также показываем тот же набор оценок на гистограмме или гистограмме на рисунке 1. Горизонтальная (или x ) -axis) представляет собой результат теста, а вертикальная ось ( y -axis) представляет количество или частоту учащихся. Построение частотного распределения помогает нам увидеть, какие оценки являются типичными и насколько они изменчивы. Далее мы опишем более точные способы определения типичных оценок и вариабельности.

Таблица 1: Распределение частот для 30 баллов
Оценка по тесту Частота Меры центральной тенденции
17 1
18 1
19 0
20 3
21 2
22 6 Режим
23 3 Медиана
24 2 Среднее
25 0
26 2
27 6 Режим
28 2
29 2
30 1
ИТОГО 31

Рисунок 1: Результаты тестов из таблицы 1, представленные в виде гистограммы

Центральная тенденция и изменчивость

Есть три распространенных способа измерения центральной тенденции или типичных оценок. Среднее значение вычисляется путем сложения всех оценок и деления на количество оценок. В примере, приведенном в таблице 1, среднее значение равно 24. Медиана — это «средний» балл распределения, то есть половина баллов выше медианы, а половина — ниже. Медиана распределения составляет 23, потому что 15 баллов выше 23 и 15 ниже. Режим — это наиболее часто встречающаяся оценка. В таблице 1 фактически два режима: 22 и 27. Таким образом, это распределение описывается как бимодальное .Вычисление среднего, медианы и режима важны, поскольку каждый из них предоставляет учителям разную информацию. Медиана представляет собой оценку «средних» учеников с половинными баллами выше и ниже, но не говорит нам о наиболее часто встречающихся результатах теста. Среднее значение важно для некоторых статистических расчетов, но на него сильно влияют несколько крайних значений (называемых выбросами), но не медиана. Чтобы проиллюстрировать это, представьте себе тест из 20 баллов, сданных 10 студентами, и большинство из них сдает очень хорошо, но один студент сдает очень плохо. Оценки могут быть 4, 18, 18, 19, 19, 19, 19, 19, 20, 20. Среднее значение составляет 17,5 (175/10), но если исключить самый низкий балл (4), среднее значение теперь составляет 1,5 балла. выше — 19 (171/9). Однако в этом примере медиана остается на уровне 19 независимо от того, включена ли самая низкая оценка. Когда есть несколько крайних значений, медиана часто более полезна для учителей, поскольку она указывает на центральную тенденцию частотного распределения.

Меры центральной тенденции помогают нам суммировать репрезентативные оценки, но они ничего не говорят нам о том, насколько переменны или насколько разбросаны оценки.На рис. 2 показаны наборы результатов двух разных школ по одному и тому же тесту для четвероклассников. Обратите внимание, что среднее значение для каждого составляет 40, но в школе А разброс оценок гораздо меньше. Простой способ суммировать вариативность — это диапазон , который представляет собой наименьший балл, вычитаемый из самого низкого балла. В школе А с низкой вариабельностью диапазон (45 — 35) = 10; в школе B диапазон равен (55 — 22 = 33).

Рисунок 2: Баллы по математике в четвертом классе в двух разных школах с одинаковым средним, но разной вариабельностью

Однако диапазон основан только на двух оценках в распределении, наивысшем и самом низком, и поэтому не отражает вариабельность всех оценок.Стандартное отклонение основано на том, насколько в среднем все оценки отклоняются от среднего значения. В примере на Рисунке 2 стандартные отклонения составляют 7,73 для школы A и 2,01 для школы B. На Приложении 1 ниже мы демонстрируем, как рассчитать стандартное отклонение.

Приложение 1: Расчет стандартного отклонения

11 учеников набрали викторину 4, 7, 6, 3, 10, 7, 3, 7, 5, 5 и 9. Выполните следующие шаги:

  1. Орденские баллы.
  2. Рассчитайте средний балл.
  3. Рассчитайте отклонения от среднего.
  4. Возведите отклонения от среднего в квадрат.
  5. Вычислить среднее квадратов отклонений от среднего (т. е. суммировать квадраты отклонений от среднего, а затем разделить на количество баллов). Это число называется дисперсией.
  6. Извлеките квадратный корень, и вы рассчитали стандартное отклонение.
Завершение шагов
Оценка (Шаг 1: Порядок) Отклонение от среднего Квадратное отклонение от среднего
3 −3 9
3 −3 9
4 -2 4
5 -1 1
5 -1 1
6 0 0
7 1 1
7 1 1
7 1 1
9 3 9
10 4 4
Итого: 66 52
Шаг 2: вычислить среднее значение

[латекс] displaystyle text {mean} = frac {66} {11} = 6 \ [/ latex]

Шаг 3: Расчет отклонений

[латекс] displaystyle text {mean} = frac {40} {11} = 4. 2}} {N} \ [/ latex]

N = Количество баллов

Шаг 6. Найдите стандартное отклонение

[латекс] displaystyle text {Стандартное отклонение} = sqrt {4.73} = 2,17 \ [/ latex]

Нормальное распределение

Знание стандартного отклонения особенно важно, когда распределение баллов соответствует нормальному распределению. Когда стандартизированный тест проводится с очень большим количеством студентов, распределение баллов обычно схоже: многие студенты имеют баллы, близкие к среднему, а меньшее количество баллов намного выше или ниже среднего.Когда распределение оценок выглядит как колоколообразная форма, показанная на рисунке 3, это называется нормальным распределением. На диаграмме мы не отображали оценки отдельных студентов, как на рисунке 2, потому что распределения обычно попадают на нормальную кривую только при большом количестве студентов; слишком много, чтобы показать по отдельности. Нормальное распределение является симметричным, а среднее значение, медиана и мода одинаковы.

Рисунок 3: Колоколообразная кривая нормального распределения

Нормальные кривые распределения очень важны в образовании и психологии из-за взаимосвязи между средним значением, стандартным отклонением и процентилями.Во всех нормальных распределениях 34 процента баллов находятся между средним значением и одним стандартным отклонением среднего. Тесты интеллекта часто строятся так, чтобы иметь среднее значение 100 и стандартное отклонение 15, и мы проиллюстрировали это на рисунке 4.

Рисунок 4: Нормальное распределение для теста IQ со средним значением 100 и стандартным отклонением 15

На Рисунке 4 34 процента оценок находятся между 100 и 115, а также 34 процента оценок находятся между 85 и 100. Это означает, что 68 процентов оценок находятся в диапазоне от -1 до +1 стандартного отклонения среднего. (я.е. 85 и 115). Обратите внимание, что только 14 процентов оценок находятся между +1 и +2 стандартными отклонениями среднего и только 2 процента падают выше +2 стандартных отклонений среднего.

При нормальном распределении учащийся, набравший среднее значение, всегда находится в пятидесятом процентиле, потому что среднее и медиана одинаковы. Оценка +1 стандартное отклонение выше среднего (например, 115 на рисунке 4) составляет плитку 84% (50% и 34% оценок были ниже 115). В Приложении 10 мы представляем процентильные эквиваленты нормальной кривой, а также показываем стандартные баллы.

Виды результатов тестов

Стандартная оценка выражает результативность теста в единицах стандартного отклонения выше или ниже среднего (Linn & Miller, 2005). Существует множество стандартных баллов, включая z-баллы, T-баллы и станины.

Одним из типов стандартной оценки является z-оценка , в которой среднее значение равно 0, а стандартное отклонение — 1. Это означает, что z-оценка напрямую сообщает нам, на сколько стандартных отклонений оценка выше или ниже среднего.Например, если студент получает z-оценку 2, ее оценка на два стандартных отклонения выше среднего или восемьдесят четвертого процентиля. Учащийся, получивший z-балл -1,5, набрал на полтора отклонения ниже среднего. Любая оценка из нормального распределения может быть преобразована в оценку z, если известны среднее значение и стандартное отклонение. Формула:

[латекс] displaystyle text {z-score} = frac { text {score} — text {средний результат}} { text {стандартное отклонение}} \ [/ latex]

Итак, если оценка 130, среднее значение 100 и стандартное отклонение 15, вычисление будет:

[латекс] displaystyle text {Z} = frac {130-100} {15} = 2 \ [/ latex]

Если вы посмотрите на рисунок 4, то увидите, что это правильно — оценка 130 на 2 стандартных отклонения выше среднего, поэтому оценка по z равна 2.

A T-score имеет среднее значение 50 и стандартное отклонение 10. Это означает, что T-score 70 на два стандартных отклонения выше среднего и, таким образом, эквивалентен z-баллу 2.

Станины (произносится как «стайнины») часто используются для сообщения оценок учащихся и основаны на стандартной девятибалльной шкале со средним значением 5 и стандартным отклонением 2. Они представлены только в виде целых чисел и рис. -10 показывает их отношение к нормальной кривой.

Язвы, эквивалентные степени

Оценка, эквивалентная классу, дает оценку успеваемости в зависимости от класса и месяцев учебного года (Popham, 2005, стр. 288). Эквивалентная оценка 3,7 означает, что успеваемость ученика третьего класса на седьмом месяце учебного года соответствует ожиданиям. Эквиваленты оценок обеспечивают постоянный диапазон ступеней обучения и поэтому могут считаться оценками развития. Эквивалентные оценки популярны и кажутся легкими для понимания, однако, как правило, их понимают неправильно.Если Джеймс, ученик четвертого класса, сдает тест по чтению, и его оценка эквивалентна 6,0; это не означает, что Джеймс может выполнять работу в шестом классе . Это означает, что Джеймс выполнил тест для четвертого класса , поскольку ожидается, что его будет выполнять шестиклассник.

Тестирующие компании рассчитывают эквиваленты оценок, давая один тест нескольким классам. Например, тест, предназначенный для четвероклассников, также может быть предоставлен учащимся третьего и пятого классов. Построены необработанные оценки и установлена ​​линия тренда, которая используется для определения эквивалентов оценок.Обратите внимание, что на Рисунке 5 линия тренда выходит за пределы фактически протестированных уровней оценок, поэтому эквивалент оценки выше 5,0 или ниже 3,0 основан исключительно на предполагаемых линиях тренда.

Рис. 5. Использование линий тренда для оценки оценок эквивалентных оценок.

Эквивалентные баллы

также предполагают, что тестируемый предмет подчеркивается на каждом уровне обучения в одинаковой степени и что овладение содержанием накапливается в основном с постоянной скоростью (Popham, 2005). Многие эксперты по тестированию предупреждают, что оценки эквивалентных оценок следует интерпретировать со значительным скептицизмом и что родители часто имеют серьезные неправильные представления об оценках эквивалентных оценок.Родители хорошо успевающих учеников могут преувеличивать уровень успеваемости своего ребенка.

Список литературы

Линн Р. Л. и Миллер М. Д. (2005). Измерение и оценка в обучении 9-е изд. Верхняя Сэдл-Ривер, Нью-Джерси: Пирсон.

Попхэм, У. Дж. (2005). Оценка в классе: что нужно знать учителям. Бостон, Массачусетс: Пирсон.

Интерпретация результатов тестов | UT Testing and Evaluation Services

Понимание того, как интерпретировать три полезные статистические данные, касающиеся результатов тестов ваших учеников с множественным выбором, поможет вам составить хорошо продуманные тесты и улучшить обучение.

Сложность задания или P: процент учащихся, правильно ответивших на вопрос.

  • Также называется p-значением
  • Диапазон от 0% до 100% или, как правило, выражается как пропорция от 0,00 до 1,00
  • Чем выше значение, тем легче товар
  • P-значения выше 0,90 указывают на очень простые элементы, которые вам не следует использовать в последующих тестах. Если почти все учащиеся ответили правильно, в задании рассматривается концепция, которую, вероятно, не стоит проверять.
  • P-значения ниже 0,20 указывают на очень сложные задания. Если почти все учащиеся ответили неправильно, это означает, что в задании есть недостатки или учащиеся не поняли концепцию. Подумайте о том, чтобы изменить запутанный язык, удалить элемент из последующих тестов или нацелить концепцию на повторное обучение.

Для максимального потенциала различения желательные уровни сложности немного выше, чем на полпути между шансом (1,00, деленным на количество вариантов выбора) и идеальной оценкой (1.00) для позиции:

Формат Идеальная Сложность

  • Множественный выбор с пятью ответами .60
  • Множественный выбор с четырьмя ответами .62
  • Множественный выбор с тремя ответами .66
  • Истина-ложь (два ответа, множественный выбор) .75

Дискриминация по заданию или R (IT): взаимосвязь между тем, насколько хорошо учащиеся выполнили задание, и их общим баллом за тест.

Также называется точечно-бисериальной корреляцией (PBS)

  • Диапазон от 0. 00 до 1.00
  • Чем выше значение, тем более разборчивый товар
  • Элемент с высокой степенью различения указывает на то, что учащиеся с высокими баллами по тестам ответили правильно, тогда как учащиеся с низкими баллами ответили неправильно.

Удалите элементы, значения дискриминации которых близки или меньше нуля, поскольку это означает, что учащиеся, которые плохо справились с тестом, справились с заданием лучше, чем учащиеся, которые сдали тест хорошо. Этот пункт в некотором роде сбивает с толку ваших учеников, набирающих больше очков.

Оценивайте задания, используя четыре руководства для значений распознавания в классных тестах:

  • 0,40 или выше очень хорошие позиции
  • от 0,30 до 0,39 хорошие вещи
  • от 0,20 до 0,29 довольно хорошие позиции
  • 0,19 или менее плохие позиции

Коэффициент надежности или АЛЬФА: мера величины ошибки измерения, связанной с результатом теста.

  • Диапазон от 0,00 до 1,00
  • Чем выше значение, тем надежнее результат теста
  • Обычно это показатель внутренней согласованности, показывающий, насколько хорошо элементы коррелированы друг с другом
  • Высокая надежность указывает на то, что элементы измеряют одну и ту же конструкцию (например,г. , знание того, как вычислять интегралы)
  • Два способа повысить надежность теста: 1) увеличить количество элементов или 2) использовать элементы с высокими значениями дискриминации

Интерпретация надежности

  • .90 и выше Превосходная надежность; на уровне лучших стандартизированных тестов
  • .80 — .90 Очень хорошо для школьного теста
  • .70 — .80 Хорошо для школьного теста; в ассортименте большинство. Вероятно, есть несколько элементов, которые можно улучшить.
  • .60 — .70 Немного ниже. Этот тест следует дополнить другими мерами для определения оценок. Вероятно, есть некоторые элементы, которые можно улучшить.
  • .50 — .60 Предлагает пересмотреть тест, если он не слишком короткий (десять или меньше пунктов). Тест должен быть дополнен другими мерами выставления оценок.
  • .50 или ниже Сомнительная надежность. Этот тест не должен сильно влиять на оценку за курс, и его необходимо пересмотреть.

Оценка дистрактора

Еще один полезный метод обзора заданий — оценка с помощью дистрактора.

Вы должны рассматривать каждый отвлекающий фактор как важную часть задания ввиду почти 50-летнего исследования, которое показывает, что существует связь между отвлекающими факторами, которые выбирают учащиеся, и общей оценкой теста. Качество отвлекающих факторов влияет на успеваемость учащихся по заданию теста.

Хотя правильные ответы должны быть действительно правильными, не менее важно, чтобы отвлекающие факторы были явно неправильными, обращаясь скорее к тем, кто не усвоил материал, а к тем, кто набрал больше очков.Вам следует просмотреть все варианты элементов, чтобы предвидеть возможные ошибки в суждениях и неадекватную работу, чтобы вы могли пересмотреть, заменить или удалить плохие отвлекающие факторы.

Один из способов изучения реакции на отвлекающие факторы — использовать таблицу частот, в которой указывается доля учащихся, выбравших данный отвлекающий фактор. Удалите или замените отвлекающие факторы, выбранные несколькими учениками или ни одним из них, потому что ученики считают их неправдоподобными.

Осторожно при интерпретации результатов анализа предметов

Mehrens and Lehmann (1973) предлагают три предостережения относительно использования результатов анализа предметов:

  • Данные анализа предмета не являются синонимом действительности предмета.Внешний критерий необходим для точной оценки валидности тестовых заданий. Используя внутренний критерий общей оценки за тест, анализ заданий отражает внутреннюю согласованность заданий, а не их валидность.
  • Индекс дискриминации не всегда является показателем качества задания. Существует множество причин, по которым предмет может иметь низкую способность распознавания:

o чрезвычайно сложные или легкие предметы будут иметь низкую способность различать, но такие предметы часто необходимы для адекватной выборки содержания курса и целей.
o элемент может показывать низкую дискриминацию, если тест измеряет многие области содержания и когнитивные навыки. Например, если в большинстве тестов измеряется «знание фактов», то элемент, оценивающий «способность применять принципы», может иметь низкую корреляцию с общим баллом теста, однако оба типа элементов необходимы для измерения достижения целей курса.

  • Данные по предметному анализу предварительные. На такие данные влияют тип и количество студентов, проходящих тестирование, используемые учебные процедуры и случайные ошибки.Если возможно повторное использование предметов, статистические данные следует регистрировать для каждого применения каждого предмета.

Список литературы

ДеВеллис, Р. Ф. (1991). Масштаб развития: теория и приложения. Парк Ньюбери: Публикации Сейджа.

Галадина. Т. М. (1999). Разработка и проверка тестовых заданий с множественным выбором (2-е изд.). Махва, Нью-Джерси: Лоуренс Эрлбаум Ассошиэйтс.

Лорд, Ф. (1952). Связь надежности теста с множественным выбором с распределением трудностей заданий.Психометрика, 18, 181–194.

Mehrens, W. A., & Lehmann, I. J. (1973). Измерение и оценка в образовании и психологии. Нью-Йорк: Холт, Райнхарт и Уинстон, 333–334.

Суен, Х. К. (1990). Принципы тестовых теорий. Хиллсдейл, Нью-Джерси: Лоуренс Эрлбаум Ассошиэйтс.

Анализ теста и заданий: интерпретация результатов теста

После того, как тест выставлен на оценку, учитель должен интерпретировать результаты и использовать эти интерпретации для оценки, выбора, размещения или других решений.Чтобы точно интерпретировать результаты теста, учителю необходимо проанализировать выполнение теста в целом и отдельных тестовых заданий и использовать эти данные, чтобы сделать обоснованные выводы об успеваемости учащихся. Эта информация также помогает учителям подготовиться к обсуждениям экзамена со студентами после тестирования. В этой главе обсуждается процесс выполнения теста и анализа заданий. Он также предлагает способы, с помощью которых учителя могут использовать обсуждения после тестирования, чтобы способствовать обучению учащихся, и получать отзывы учащихся, которые могут привести к улучшению тестовых заданий.

Как инструмент измерения, тест дает оценку — число. Число, однако, не имеет внутреннего значения и должно сравниваться с чем-то, что имеет значение, чтобы интерпретировать его значение. Чтобы результат теста был полезен при принятии решения относительно теста, учитель должен интерпретировать результат. Независимо от того, является ли интерпретация ссылкой на норму или критерий, базовые знания статистических концепций необходимы для оценки качества тестов (независимо от того, составлены они учителями или опубликованы), понимания стандартизированных результатов тестов, обобщения результатов оценки и объяснения результатов тестов другим.

Некоторая информация о том, как тест выполняется в качестве измерительного прибора, может быть получена из отчетов об анализе тестов и заданий, сгенерированных компьютером. В дополнение к предоставлению данных анализа заданий, таких как индексы сложности и дискриминации, такие отчеты часто суммируют характеристики распределения баллов. Если у учителя нет доступа к электронному подсчету баллов и компьютерному программному обеспечению для тестирования и анализа заданий, многие из этих анализов можно проводить вручную, хотя и медленнее.

222 Когда тест выставлен на оценку, учитель остается с набором исходных оценок.Часто эти баллы записываются в соответствии с именами учащихся, в алфавитном порядке или по номерам учащихся. В качестве примера предположим, что баллы, представленные в таблице 12.1, были получены в результате проведения теста с 65 баллами для 16 студентов медсестер. Взглянув на этот набор чисел, учитель затруднился бы ответить на такие вопросы, как:

1. Получило ли большинство учеников высокие или низкие баллы на тесте?

2. Набрали ли какие-либо ученики намного больше или меньше, чем у большинства студентов?

3.Оценки сильно разбросаны или сгруппированы?

4. Каков диапазон оценок, полученных большинством студентов? (Brookhart & Nitko, 2019)

Чтобы упростить просмотр схожих характеристик оценок, учитель должен расположить их в порядке ранжирования, от самого высокого до самого низкого (Miller, Linn, & Gronlund, 2013), как в таблице 12.2. Такой порядок оценок позволяет сделать очевидным, что они варьировались от 42 до 60, и что оценка одного ученика была намного ниже, чем у других учеников. Но учитель по-прежнему не может легко представить себе, как типичный ученик справился с тестом, или общие характеристики полученных баллов. Удаление имен учащихся, перечисление каждой оценки по одному и подсчет количества повторений каждой оценки приводит к распределению частот, как в Таблице 12.3. Отображая баллы таким образом, учителю легче определить, насколько хорошо группа учащихся выполнила экзамен.

223

ТАБЛИЦА 12.3 Частотное распределение исходных оценок из таблицы 12.1

RAW SCORE ЧАСТОТА
61 0
60
60 0
58 0
57 1
56 1
55
54 3
53 2
52 3
51 0
0
49 0
48 1
47 1
46 0
45 0
0
43 0
42 1
41 0

1 9049 900 19

224 Представленная частота графически в виде гистограммы. На рис. 12.1 оценки отсортированы от наименьшего к наибольшему по горизонтальной линии слева направо, а количество звездочек над каждой оценкой указывает частоту этой оценки. Частоты также могут быть обозначены на гистограмме полосами, высота каждой полосы которых представляет частоту соответствующей оценки, как на рисунке 12.2.

Полигон частот — это еще один способ графического отображения распределения оценок. Над каждым значением оценки ставится точка, чтобы указать частоту, с которой эта оценка была получена; если никто не набрал конкретного балла, точка ставится на базовой линии, равной 0.Затем точки соединяются прямыми линиями, образуя многоугольник или кривую. На рис. 12.3 показан многоугольник частот, основанный на гистограмме на рис. 12.1. Таким образом, гистограммы и частотные многоугольники показывают общие характеристики, такие как наиболее часто встречающиеся оценки, форма распределения оценок и диапазон оценок.

РИСУНОК 12.1 Гистограмма, изображающая частотное распределение исходных оценок из таблицы 12. 1.

РИСУНОК 12.2 Гистограмма, показывающая частотное распределение исходных оценок из таблицы 12.1.

Примечание: f , частота; х , баллы.

РИСУНОК 12.3 Полигон частот, отображающий частотное распределение исходных оценок из таблицы 12.1.

Примечание: f , частота; х , баллы.

225 Характеристики распределения баллов можно описать на основе его симметрии, асимметрии, модальности и эксцесса. Эти характеристики показаны на рисунке 12.4. Симметричное распределение или кривая — это такое распределение, в котором есть две равные половины, зеркальные изображения друг друга.Несимметричные или асимметричные кривые имеют группу оценок или пик на одном конце и хвост, идущий к другому концу. Этот тип кривой называется скошенной; направление, в котором простирается хвост, указывает, смещено ли распределение в положительную или отрицательную сторону. Хвост кривой с положительным наклоном тянется вправо в направлении положительных чисел на шкале, а конец кривой с отрицательным наклоном идет влево в направлении отрицательных чисел. Таким образом, положительно искаженное распределение имеет самый большой кластер оценок на нижнем конце распределения, что кажется нелогичным.Распределение результатов тестов из Таблицы 12.1 несимметрично и имеет отрицательный перекос. Помните, что минимально возможный балл в этом тесте был 0, а максимально возможный — 65; оценки были сгруппированы между 42 и 60.

Полигоны частот и гистограммы могут различаться по количеству содержащихся в них пиков; эта характеристика называется модальностью , относится к режиму или наиболее часто встречающейся оценке в распределении. Если кривая имеет один пик, она одномодальная; если он содержит два пика, он является бимодальным.Кривая с множеством пиков является мультимодальной. Относительная плоскостность или пик кривой обозначается как эксцесс . Плоские кривые обозначены как platykurtic , умеренные кривые — как mesokurtic , а кривые с острыми вершинами — как leptokurtic (Waltz, Strickland, & Lenz, 2010). Гистограмма на рисунке 12.1 показывает бимодальное платикуртическое распределение.

РИСУНОК 12.4 Характеристики распределения баллов.

226

РИСУНОК 12.5 Нормальное распределение.

Форма распределения баллов зависит от характеристик теста, а также от способностей учащихся, прошедших тестирование (Brookhart & Nitko, 2019). Некоторые учителя принимают решения о выставлении оценок, как если бы все распределения тестовых баллов напоминали нормальную кривую, то есть они пытаются «изогнуть» оценки. Понимание характеристик нормальной кривой развеет это представление. Нормальное распределение — это колоколообразная кривая, которая является симметричной, унимодальной и мезокуртической.На рисунке 12.5 показано нормальное распределение.

Многие человеческие характеристики, такие как интеллект, вес и рост, распространяются нормально; измерение любого из этих атрибутов в популяции приведет к большему количеству баллов в среднем диапазоне, чем в любом крайнем. Тем не менее, большинство распределений баллов, полученных в результате тестов, подготовленных учителями, не соответствуют нормальному распределению. Это верно по нескольким причинам. Характеристики теста сильно влияют на итоговое распределение баллов; очень сложный тест имеет тенденцию давать положительно наклонную кривую.Точно так же способности учащихся влияют на распределение результатов теста. Независимо от распределения признака интеллекта среди человеческой популяции, эта характеристика вряд ли будет нормально распределена среди класса студентов-медсестер или группы вновь нанятых медсестер. Поскольку решения о приеме и приеме на работу, как правило, выбирают тех людей, которые с наибольшей вероятностью преуспеют в программе или работе медсестер, распределение оценок IQ для класса из 16 студентов-медсестер или 16 вновь нанятых медсестер будет иметь тенденцию к отрицательному перекосу.Точно так же знания медсестер вряд ли будут распространяться нормально, потому что те, кто был допущен к программе обучения медсестер или нанят в качестве штатных медсестер, не являются репрезентативными для населения в целом. Следовательно, процедуры выставления оценок, которые пытаются применить характеристики нормальной кривой к распределению результатов теста, могут привести к неразумным и несправедливым решениям.

Меры центральной тенденции

Один из вопросов, на который необходимо ответить при интерпретации результатов тестов: «Какая оценка является наиболее характерной или типичной для этого распределения?» Типичная оценка, вероятно, находится в середине распределения, а другие оценки сгруппированы вокруг нее; показатели центральной тенденции дают значение, вокруг которого сгруппированы баллы теста.Для интерпретации результатов тестов обычно используются три показателя центральной тенденции: мода, медиана и среднее значение.

Режим, иногда обозначаемый сокращенно Mo , является наиболее часто встречающейся оценкой в ​​распределении; это должен быть результат, фактически полученный студентом. Его можно легко определить по частотному распределению или графическому дисплею без математических расчетов. Таким образом, он дает приблизительное указание на центральную тенденцию. Однако мода является наименее стабильным показателем центральной тенденции, поскольку она имеет тенденцию значительно колебаться от одной выборки к другой, взятой из одной и той же популяции (Miller et al., 2013). То есть, если один и тот же тест из 65 пунктов, который дал баллы в таблице 12.1, был проведен для другой группы из 16 студентов-медсестер по той же программе, которые прошли один и тот же курс, режим мог бы значительно отличаться. Кроме того, как и в распределении, изображенном на рисунке 12.1, режим имеет два или более значений в некоторых распределениях, что затрудняет указание одной типичной оценки. Равномерное распределение баллов не имеет режима; такое распределение, вероятно, будет получено, когда количество студентов невелико, диапазон баллов большой и каждый балл получает только один студент.

Медиана (сокращенно Mdn или P 50 ) — это точка, которая делит распределение баллов на равные половины (Miller et al., 2013). Это значение, выше которого падают 50% оценок, а ниже которого падают 50% оценок; таким образом, он представляет 50-й процентиль. Медиана не обязательно должна быть фактически полученным баллом. При четном количестве баллов медиана находится посередине между двумя средними баллами; при нечетном количестве баллов медиана — это средний балл.Поскольку медиана является показателем местоположения, на нее не влияет значение каждой оценки в распределении. Таким образом, это обычно является хорошим показателем типичного балла в искаженном распределении, содержащем чрезвычайно высокие или низкие баллы (Miller et al., 2013).

Среднее значение часто называют «средним» баллом в распределении, что отражает математический расчет, определяющий эту меру центральной тенденции. Обычно это сокращенно M или. Среднее значение вычисляется путем суммирования каждой индивидуальной оценки и деления на общее количество оценок, как в следующей формуле:

, где M — среднее значение, ∑ X — сумма индивидуальных оценок и N — общее количество баллов.Таким образом, на значение среднего влияет каждый балл в распределении (Miller et al., 2013). Это свойство делает его предпочтительным показателем центральной тенденции, когда требуется мера общего распределения. Однако среднее значение чувствительно к влиянию чрезвычайно высоких или низких оценок в распределении и, как таковое, может не отражать типичную успеваемость группы студентов.

Существует взаимосвязь между формой распределения баллов и относительным расположением этих показателей центральной тенденции.В нормальном распределении среднее значение, медиана и мода имеют одно и то же значение, как показано на рисунке 12.5. При положительно асимметричном распределении среднее значение даст самый высокий показатель центральной тенденции, а мода — самый низкий; в отрицательно искаженном распределении режим будет иметь самое высокое значение, а среднее — самое низкое. На рисунке 12.6 показано относительное положение трех показателей центральной тенденции в искаженных распределениях.

228

РИСУНОК 12.6 Меры центральной тенденции в положительно и отрицательно искаженных распределениях.

Среднее значение распределения баллов из таблицы 12.1 составляет 52,75; медиана — 53,5. Тот факт, что медиана немного выше среднего, подтверждает, что медиана является показателем местоположения или положения и нечувствительна к фактическим значениям оценок в распределении. На среднее, поскольку на него влияет каждый балл в распределении, повлиял один крайне низкий балл. Поскольку форма этого распределения оценок имела отрицательный перекос, ожидается, что медиана будет выше среднего, потому что среднее всегда тянется в направлении хвоста.

Меры изменчивости

Два распределения баллов могут иметь одинаковые меры центральной тенденции, но при этом сильно отличаться. Оценки в одном распределении могут быть сильно сгруппированы вокруг среднего, а в другом распределении оценки могут быть сильно разбросаны по диапазону значений. Меры вариабельности используются для определения того, насколько студенты похожи или различаются по своим оценкам на тесте.

Простейшей мерой изменчивости является диапазон, разница между наивысшим и наименьшим баллами в распределении.Для распределения результатов теста в Таблице 12.3 диапазон составляет 18 (60–42 = 18). Иногда диапазон выражается как наивысший и самый низкий баллы, а не как разница в баллах. Поскольку диапазон основан только на двух значениях, он может быть очень нестабильным. Диапазон также имеет тенденцию увеличиваться с увеличением размера выборки; то есть результаты тестов большой группы студентов, вероятно, будут разбросаны по широкому диапазону из-за вероятности получения экстремальных баллов (Miller et al., 2013).

Стандартное отклонение (сокращенно SD , s или σ) является наиболее распространенной и полезной мерой изменчивости.Как и среднее значение, здесь учитываются все баллы в распределении. Стандартное отклонение основано на различиях между каждой оценкой и средним значением. Таким образом, он характеризует среднюю величину, на которую баллы отличаются от среднего. Стандартное отклонение рассчитывается в четыре этапа:

1. Вычтите среднее значение из каждой оценки ( X M ), чтобы вычислить оценку отклонения ( x ), которая может быть положительной или отрицательной.

2. Возвести в квадрат каждую оценку отклонения ( x 2 ), что исключает любые отрицательные значения.Суммируйте все оценки квадратичного отклонения ( x 2 ).

3. Разделите эту сумму на количество результатов теста, чтобы получить дисперсию.

4. Вычислите квадратный корень из дисперсии.

Хотя для расчета стандартного отклонения можно использовать и другие формулы, следующая формула определения представляет эти четыре шага:

, где SD — стандартное отклонение, x 2 — это сумма квадратов отклонений, а N — количество баллов (Miller et al., 2013).

Стандартное отклонение распределения баллов из таблицы 12.1 составляет 4,1. Что означает это значение? Стандартное отклонение 4,1 представляет собой среднее отклонение оценок от среднего. В 65-балльном тесте 4 балла — это небольшая средняя разница в баллах. Если оценки плотно сгруппированы вокруг среднего, стандартное отклонение будет относительно небольшим числом; если они разбросаны по большому диапазону баллов, стандартное отклонение будет большим.

Другие характеристики теста

В дополнение к интерпретации распределения результатов теста и показателей центральной тенденции и изменчивости учителя должны проверять тестовые задания в совокупности на предмет наличия предвзятости.Например, хотя явной гендерной предвзятости в каком-либо отдельном элементе теста может не быть, такое смещение может быть очевидным, когда все элементы рассматриваются как группа. Подобные случаи этнической, расовой, религиозной и культурной предвзятости могут быть обнаружены, когда предметы группируются и исследуются вместе. Влияние предвзятости на тестирование и оценку подробно обсуждается в главе 16 «Социальные, этические и юридические вопросы».

Интерпретация индивидуальной оценки

Интерпретация результатов тестов, проводимых учителем

Способность интерпретировать характеристики распределения оценок поможет учителю делать ориентированные на нормы интерпретации значения любой индивидуальной оценки в этом распределении.Например, как учитель должен интерпретировать 53 балла П. Парди на тесте, результаты которого сведены в Таблицу 12.1? При среднем показателе 230 из 53,5, среднем значении 52,75 и стандартном отклонении 4,1 оценка 53 является примерно «средней». Все оценки от 49 до 57 попадают в одно стандартное отклонение от среднего и, таким образом, существенно не отличаются друг от друга. С другой стороны, Н. Нардоцци может радоваться, потому что оценка 60 почти на два стандартных отклонения выше среднего; таким образом, эта оценка представляет собой достижение, которое намного лучше, чем у других в группе.Учителю, вероятно, следует спланировать консультацию Л. Линча, потому что результат 42 — это более чем на два стандартных отклонения ниже среднего, что намного ниже, чем у других в группе.

Тем не менее, большинству медсестер-преподавателей необходимо интерпретировать индивидуальные результаты тестов на основе критериев. Оценка учащегося за тест сравнивается с заранее установленным стандартом или критерием, а оценки других учащихся не учитываются. Оценка в процентах правильных ответов — это производная оценка, которая часто используется для сообщения результатов тестов, предназначенных для интерпретации на основе критериев.Правильный процент — это сравнение балла учащегося с максимально возможным баллом; он рассчитывается путем деления исходной оценки на общее количество заданий в тесте (Miller et al., 2013). Хотя многие учителя считают, что процентные правильные оценки являются объективным показателем того, насколько учащиеся действительно знают предмет, на самом деле они могут значительно измениться в зависимости от сложности тестовых заданий. Поскольку процентные правильные оценки часто используются в качестве основы для присвоения буквенных оценок в соответствии с заранее определенной системой оценок, важно понимать, что они определяются больше трудностью теста, чем истинным качеством выполнения.Для тестов, которые являются более сложными, чем ожидалось, учитель может захотеть скорректировать исходные баллы, прежде чем вычислять процент правильных ответов по этому тесту.

Не следует путать процент правильных оценок с процентильным рангом, который часто используется для сообщения результатов стандартизированных тестов. Процентильный ранг описывает относительное положение ученика в группе и, следовательно, является нормативной интерпретацией. Процентильный ранг данного необработанного балла — это процент баллов в распределении, которые соответствуют этому баллу или ниже него.Таким образом, процентильный рейтинг 83 означает, что баллы студента равны или выше, чем баллы 83% студентов в этой группе; Однако нельзя предположить, что ученик правильно ответил на 83% заданий. Поскольку существует 99 точек, которые делят распределение на 100 групп равного размера, наивысший процентильный ранг, который может быть получен, — 99-й. Медиана находится на 50-м процентиле. Различия между процентильными рангами означают больше на самом высоком и самом низком крайних значениях, чем около медианы.

Интерпретация результатов стандартизированных тестов

Результаты стандартизированных тестов обычно предназначены для использования для интерпретации, основанной на нормах. Прежде чем делать такие интерпретации, учитель должен иметь в виду, что стандартизированные тесты больше соответствуют общим, а не конкретным учебным целям. Кроме того, результаты стандартизированных тестов больше подходят для оценки групп, а не отдельных лиц. Следовательно, стандартные результаты тестов не должны использоваться для определения оценок по конкретному курсу или для принятия решения о найме, продвижении по службе или увольнении сотрудника.Как и большинство образовательных мероприятий, стандартизированные тесты предоставляют грубые, а не точные данные об успеваемости. Фактические различия в показателях и достижениях отражаются в больших различиях в баллах.

Результаты стандартизированных тестов обычно представляются в виде производных баллов, таких как процентильные ранги, стандартные баллы и баллы по группе норм. Поскольку все эти производные оценки следует интерпретировать в соответствии с нормами, важно указать соответствующую группу норм для сравнения. В руководстве пользователя для любого стандартизированного теста обычно представлены таблицы норм, в которых каждый исходный балл сопоставляется с эквивалентным производным баллом.Стандартизированные руководства по испытаниям могут содержать несколько таблиц норм; группа норм, на которой основана каждая таблица, должна быть полностью описана. Учитель должен позаботиться о том, чтобы выбрать группу норм, которая наиболее точно соответствует группе, результаты которой будут сравниваться с ней (Miller et al., 2013). Например, при интерпретации результатов стандартизированных тестов по сестринскому делу следует сравнивать успеваемость группы студентов-медсестер со степенью бакалавра с нормальной группой студентов-медсестер со степенью бакалавра. Таблицы норм иногда допускают более тонкие различия, такие как размер программы, географический регион и государственная и частная принадлежность.

Анализ заданий

Помимо статистики теста, учителя также должны проверять показатели качества выполнения по каждому заданию экзамена. При совместном использовании несколько точек данных — индекс сложности, индекс дискриминации и точечный коэффициент бисериальной корреляции — предоставляют богатый источник информации о качестве выполнения тестовых заданий (Ermie, n.d.). Однако учителя не должны полагаться только на эти статистические данные при оценке качества экзаменационных заданий. Решения по отдельным тестовым заданиям должны приниматься в контексте содержания и структуры задания, ожиданий учителя в отношении того, как задания будут выполняться, и точной интерпретации статистических данных по заданию (Brookhart & Nitko, 2019).

Компьютерное программное обеспечение для анализа заданий широко доступно для использования с оборудованием для сканирования электронных листов ответов. Имеющиеся в продаже приложения для компьютерного тестирования обычно также предоставляют услуги, которые создают пользовательские отчеты со статистикой анализа элементов. Для учителей, не имеющих доступа к такому оборудованию и программному обеспечению, процедуры ручного анализа ответов учащихся на тестовые задания подробно описаны ниже в этом разделе. Независимо от метода, используемого для анализа, учителя должны быть достаточно знакомы со значением каждой статистики анализа, чтобы правильно интерпретировать результаты.

Приложение 12.1 предлагает пример компьютерного отчета об анализе элементов. В этом примере перечислены только данные анализа заданий для каждого из экзаменационных заданий, без включения формулировок заданий и любых кодов, которые учитель мог использовать для классификации содержания пунктов (например, предметная область, когнитивный уровень, клиент потребности). Этот формат полезен для быстрого сканирования данных для выявления потенциальных проблем. В последующих примерах будут показаны отчеты об анализе заданий, отображающие содержание заданий, любые коды классификации и дополнительную статистику, относящуюся к эффективности вариантов ответов каждого элемента.

Только золотые участники могут продолжить чтение. Войдите или зарегистрируйтесь, чтобы продолжить

Связанные

Накладные расходы на Блок 10 Глава 19 (Интерпретация результатов стандартизированных тестов)

Накладные расходы
для Раздела 10, Глава 19 (Интерпретация результатов стандартизированных тестов)

Вызов

Технический вызов

Воспитательные и психологические меры, не такие как фунты или
в дюймах

  • Нет
    нулевая точка
  • квартир
    измерения не равно

Разработаны методы преодоления этого ограничения

  • Автор
    предоставление значимых систем отсчета для интерпретации результатов
  • Автор
    обеспечение способов, дающих одинаковые единицы измерения
  • Автор
    обеспечение способов сравнения и сложения очень разных оценок

Профессиональный стандарт

Должен уметь интерпретировать обычно сообщаемые
баллы: [например] процентильные ранги, баллы процентильных диапазонов, стандартные баллы,
и эквиваленты оценок.(Стандарт 3 компетентности учителя в образовательной сфере).
Оценка)

ОН 2

Методы интерпретации результатов тестов

Общий балл


Количество баллов при начислении
следуя указаниям

  • Нет
    собственное значение (ни то, ни другое не% правильного)

Интерпретации, основанные на критериях и стандартах

  1. Определение
    1. студента
      оценка относится к четкому описанию конкретных задач, которые студент может
      выполнить
    2. тех
      задачи, в свою очередь, относящиеся к заданным стандартам мастерства
    3. нет
      необходимо учитывать баллы других студентов
  2. Мост
    полезно при тестировании, предназначенном для этой цели
    1. набор
      четко сформулированных целей обучения
    2. достаточно
      элементы, позволяющие сделать вывод о степени владения или отсутствия владения этим доменом
    3. экспоната
      выбран для фактического измерения этого домена
  3. Руководящие принципы
    когда можно (осторожно) интерпретировать нормативные тесты в
    термины, привязанные к критериям
    1. доменов достижений (e.г., цели) являются
      однородные, разделенные и четко определенные?

в противном случае избегайте конкретных описательных заявлений

    1. достаточно предметов (скажем, 10) для каждого типа
      интерпретация?

в противном случае объедините элементы в более крупные кластеры или
выносить только предварительные суждения

    1. простых элемента были опущены, чтобы увеличить дискриминацию?

если да, то баллы не описывают, какой низкий
успевающие могут сделать

    1. использовали только элементы типа выбора?

если да, то баллы зависят от угадывания

    1. тестовых задания обеспечивают непосредственно релевантную меру
      цели?

если нет, основывайте интерпретацию на , что они действительно измеряют

Интерпретация со ссылкой на нормы

  1. Определение
    1. студента
      балл относительно других студентов (в группе нормы)
    2. норма
      группа тщательно определена
    3. нет
      нужно смотреть на уровень мастерства
  2. Получено
    баллов
    1. определение:
      необработанные оценки, преобразованные в числа, которые имеют значение в определенном
      группа сравнения
    2. производное
      баллы необходимы, потому что простые рейтинги имеют ограниченную ценность
    3. большинство
      общие типы: эквиваленты оценок, процентили, стандартные баллы
    4. простой
      для расчета и преобразования часто предусмотрены таблицы
    5. много
      типов стандартных баллов
      (е.g., T-score, NCE, стандартные возрастные баллы) на основе той же логики с использованием
      нормальная кривая
    6. другое
      типы шкал развития помимо GE (например, возрастные эквиваленты)

Таблицы ожиданий
(Глава 4)

  1. Определение:
    двусторонняя диаграмма, показывающая, как часто учащиеся с каждым уровнем оценки (скажем,
    SAT math) выполнить на каждом уровне другое ценное выполнение (скажем,
    оценки первокурсников в колледже)
  2. Не надо
    нужны любые нормы

Эквивалентные баллы

Описание

Определение: уровень обучения, при котором типичный
студент набирает

баллов

Примерная интерпретация: у студента было такое же сырье
средний балл для учащихся 5 класса.6 в средней школе

Типичный балл определяется за каждый месяц в
оценка: 5.0-5.9

Таблицы предоставлены, так что просто посмотрите, какой класс
уровень соответствует набранному баллу ученика

Широко используется, особенно в начальной школе

Широко неверно истолковано!

  1. Нет
    путают нормы GE со стандартами, которых должны достичь все учащиеся
  2. Не надо
    интерпретировать GE как оценку оценки, которую студент должен быть помещен в
  3. Не надо
    ожидайте, что все ученики наберут 1.0 золотых ежегодно (в среднем). Не
    реалистичная цель
  4. Не предполагайте, что единицы равны
    разные части шкалы (одна и та же разница может означать чуть выше или
    значительно выше среднего)
  5. Не надо
    предположить, что баллы по разным тестам сопоставимы
  • Разное
    издатели тестируют более широкий круг студентов, чем другие
  • Выкройки
    роста (разница в баллах) может различаться для разных субъектов
  • Не
    интерпретировать экстремальные баллы как надежные оценки успеваемости учащихся
    (обычно экстраполируется)
  • Полезность

    • Мост
      полезно для сообщения о росте базовых навыков в начальной школе
    • Наименее
      полезно для сравнения производительности на разных тестах
    • Неравенство
      в единицах оценок будет путаница в интерпретации, если вы не будете четко придерживаться
      разум

    Процентиль Рейтинг

    Описание

    Определение: процент студентов в
    оценка группы нормы ниже определенного исходного балла (относительное положение в
    группа)

    Широко используется и легко понимается

    Требования к применению

    • А
      таблица преобразования (из исходных баллов в процентили) на основе группы норм
    • А
      группа норм (таблица преобразования), подходящая для студентов, изучающих
      тест: класс или возраст, время года
    • А
      группа норм (таблица преобразования), которая также характерна для конкретного теста
      выдаются: тест, субтест, форма или (сложность) уровень теста
    • Многие
      тесты или студенческие группы означает много таблиц преобразования
    • Разное
      цели (сравнения одного и того же ребенка с разными группами) требуют
      разные нормы

    Ограничения

    1. Должен
      всегда относитесь к процентильному рангу учащихся по отношению к конкретному
      группа норм
    2. Обычно
      требуется несколько наборов норм, особенно в средней школе и за ее пределами
    3. квартир
      не равны, особенно на крайностях

    Структура неравенства предсказуема, однако

    Одинаковая разница в процентилях (скажем, 5 баллов)
    отражает гораздо большую разницу в производительности в крайних точках, чем в среднем
    (напомним форму нормальной кривой)

    Стандартные баллы

    Определение

    • Стандартный
      на сколько выше или ниже среднего ученик набрал
    • Расстояние
      рассчитывается в единицах стандартного отклонения (SD) (стандартное отклонение
      мера разброса или изменчивости)
    • The
      среднее значение и стандартное отклонение для конкретной группы норм

    Преимущества

    На основе нормальной кривой, что означает:

    1. Очки
      распределены симметрично вокруг среднего (среднего)
    2. каждый
      SD представляет фиксированный (но другой) процент случаев
    3. Почти
      все включены между 3.0 и 3.0 SD
      среднее
    4. The
      SD позволяет преобразовывать самые разные необработанные оценки в общий

      шкала, которая имеет (а) равные единицы и (б) может быть легко интерпретирована в терминах
      нормальной кривой
    5. Когда
      мы можем предположить, что результаты соответствуют нормальной кривой (тесты в классе обычно
      нет, но стандартные тесты делают), мы можем перевести стандартные баллы в
      процентиль очень полезен!

    Типы стандартных оценок

    Все стандартные баллы

    • Поделиться
      общая логика
    • Банка
      быть переведены друг в друга (см. рисунок 19.2, стр. 494)

    z-счет

    • Самый простой
    • The
      тот, на котором основаны все остальные
    • Формула:
      z = (X-M) / SD, где X — оценка человека, M — среднее значение по группе, а SD —
      разброс групп (стандартное отклонение в баллах
    • Z — это
      отрицательный для оценок ниже среднего, поэтому zs
      обычно преобразуются в другую систему, в которой все положительные числа

    T- Оценка

    • Обычно
      распределенные стандартные баллы
    • M = 50,
      SD = 10
    • Банка
      можно получить из z значений: T = 50 +
      10 (z)

    Нормированные стандартные баллы

    • Запускается
      с оценками, которые вы хотите привести в соответствие с нормальной кривой
    • Получить
      процентильные ранги для каждой оценки
    • Преобразование
      процентили в z-баллы с помощью таблицы преобразования (я раздал один
      класс)
    • Тогда
      преобразовать в любую другую стандартную оценку по вашему желанию (например,г., Т-балл, IQ
      эквиваленты)
    • Надежда
      что ваше предположение было правильным, а именно, что оценки действительно соответствуют
      естественно следовать нормальной кривой. Если нет, ваши интерпретации (скажем,
      равных единиц) может несколько ошибаться

    Станины

    • Очень
      простой тип нормализованной стандартной оценки
    • Диапазоны
      от 1 до 9 (стандартные девятки)
    • каждый
      станин из 2-8 обложек SD
    • Станин 5 = процентили 40-59 (средние 20 процентов)
    • А
      разница в 2 станина обычно сигнализирует о реальном
      разница
    • Сильные стороны

    1.без труда
    объяснил ученикам и родителям

    2. нормализованный,
    так что можете сравнить разные тесты

    3. банка
    добавьте станины, чтобы получить общий балл

    4. легко
    записано (только одна колонка)

    1. нравится
    все стандартные баллы, рост не может быть зафиксирован

    2. сырая,
    но предотвращает чрезмерное толкование

    Нормальная кривая
    Эквиваленты (NCE)

    • Обычно
      распределенные стандартные баллы
    • M = 50
    • SD = 21.06
    • Результаты
      в баллах от 1 до 99
    • Нравится
      процентили, ожидайте, что они имеют равные единицы (это означает, что они производят меньше
      различия в середине кривой и больше на крайних точках)

    Стандартный возраст
    Результаты (SAS)

    • Обычно
      распределенные стандартные баллы
    • Положить
      в метрику IQ, где
    • M = 100
    • SD = 15
      (Тест IQ Векслера) или SD = 16 (IQ Стэнфорда-Бине
      Тест)

    Преобразование в стандартные баллы

    Простота трансформации

    • Все
      разные способы сказать одно и то же
    • Все
      представляют равные единицы в разных диапазонах баллов
    • Все
      можно усреднить (между собой)
    • Банка
      легко преобразовать одно в другое
    • Рисунок
      19.2 на стр. 494 показывает, как они сочетаются друг с другом
    • Но
      интерпретируемый, только когда баллы на самом деле
      нормально распределенный (обычно стандартизированные тесты)
    • Даунсайднот
      учащиеся и родители так же легко понимают, как и процентили

    Использование стандартных баллов для изучения профилей

    использует

    • Вы
      можете сравнивать результаты учащихся по разным тестам и субтестам, когда вы
      преобразовать все оценки в один и тот же тип стандартной оценки
    • Но
      во всех тестах должна использоваться одна и та же группа норм
    • Участок
      профили могут показать их относительные сильные и слабые стороны
    • Должен
      быть построенным как доверительные интервалы , чтобы проиллюстрировать границу ошибки
    • Интерпретировать
      оцениваются как разные только тогда, когда их диапазоны не перекрываются
    • Иногда
      построены отдельно по мужчинам и женщинам (скажем, на тестах по профессиональному интересу),
      но это спорная практика
    • Тесты
      иногда поставляются с табличными или описательными отчетами о профилях (см.496)

    Использование стандартных баллов для проверки уровня владения навыками

    • Некоторые
      стандартизированные тесты пытаются предоставить некоторую информацию, основанную на критериях, с помощью
      выставление оценок по конкретным наборам навыков (см. рис. 19.4 на стр. 498)
    • Be
      очень осторожно используйте их только как подсказки, потому что каждая область умений
      обычно очень мало

    Оценка соответствия норм для стандартных баллов

    Помни о своей цели!

    • Кому
      интерпретировать эффективность относительно четко определенной контрольной группы

    Критерии оценки норм

    1. Соответствующий
    • Есть
      эта конкретная группа норм подходит для (а) решения, которое вы хотите принять
      сделать и (б) набором учащихся?
  • Представитель
    • Был
      нормальная группа, созданная на основе случайной выборки или стратифицированной случайной выборки?
      Соответствует ли он данным переписи (по расе, полу, возрасту, месту жительства и т. Д.)) для
      рассматривается население в целом?
  • Актуально
    • Нет
      полагайтесь на дату авторского права в руководстве по тестированию. Прочтите руководство, чтобы узнать, как
      старый норм
    • Остерегайтесь
      эффекта LakeWobegon!
  • сопоставимо
  • Если вы хотите сравнить результаты тестов с
    разные группы норм, проверьте руководства по тестам, насколько сопоставимы группы

    1. Достаточно
      описан поиск:

    Метод отбора проб

    Количество и распределение случаев в нормировании
    образец

    Возраст, раса, пол, география и т. Д.образца нормы

    Степень, в которой стандартизированные условия были
    поддерживается в тестировании

    Предпочитаю тесты, которые описаны более подробно

    Предостережения при интерпретации результатов стандартизированных тестов

    Очки должны быть
    переводчик:

    1. с
      четкое знание того, что измеряет тест.Не полагайтесь на титулы;
      изучить содержание (широта и т. д.)
    2. В
      свет других факторов (способности, образовательный опыт, культурные
      фон, здоровье, мотивация и т. д.), которые могли повлиять на тест
      производительность
    3. Согласно
      к типу принимаемого решения (высокий или низкий для какого ?)
    4. Как
      диапазон баллов, а не конкретное значение. Всегда вычитайте и прибавляйте 1 SEM
      от счета, чтобы получить диапазон, чтобы избежать чрезмерного толкования
    5. В
      свет всех ваших доказательств.Ищите подтверждающие или противоречивые доказательства
    6. Никогда
      полагаться на один счет, чтобы принять важное решение

    Интерпретация результатов лабораторных исследований


    Введение

    В больницах из года в год заказывается все больше лабораторных исследований, и это расширение, похоже, еще не достигло своего верхнего предела. Учитывая большой объем лабораторных тестов, кажется, что их ценность становится все более очевидной для врачей и пациентов.Еще более важным является высокий уровень доверия врачей к лабораторным данным.

    Выбор диагностических лабораторных параметров во многом зависит от рассматриваемой медицинской проблемы, но в лаборатории мы часто видим множество различных тестов, заказываемых для каждого отдельного образца. Некритичный заказ слишком большого количества тестов не обязательно предоставит врачу дополнительную информацию, а иногда может даже затруднить интерпретацию результатов.

    Следовательно, при выборе теста важно, чтобы клиницист знал, насколько тест подходит для предполагаемого использования, и не в последнюю очередь знал, насколько надежным является результат теста.В этом отношении важной задачей лаборатории является предоставление необходимой информации о методах и результатах тестов, тем самым поддерживая клинициста в процессе принятия решений.

    Рациональное использование клинического биохимического анализа требует понимания того, что фактически включают лабораторные результаты. Поэтому важно понимать следующие концепции:

    • Референтный интервал
    • Смещение (точность)
    • точность
    • Чувствительность
    • Специфичность
    • Прогнозируемое значение

    Референтный интервал

    Интерпретация лабораторных результатов требует, чтобы результат можно было соотнести с соответствующим эталонным значением.Это могут быть более ранние результаты того же пациента, если это возможно, или сравнение с данными из «нормальной» популяции. В последнем случае, чтобы использовать результат теста, необходимо указать контрольную область для рассматриваемого анализа.

    Контрольную зону устанавливают путем сбора образца материала от нормального здорового населения, по крайней мере, 100 человек, предпочтительно нескольких сотен человек. Это могут быть собственные исследования лаборатории, основанные на образцах крови доноров или, например, от персонала больницы, или с использованием данных из литературы.Для установления четко определенного референтного интервала доступны протоколы IFCC [1].

    Измерение образцов от разных людей, как и следовало ожидать, не даст точно одинаковых результатов. Это связано с естественной биологической изменчивостью и неопределенностью самого измерения. Таким образом, эталонный интервал, основанный на нормальной совокупности, будет группироваться вокруг среднего и часто показывает нормальное распределение или распределение Гаусса. Форма распределения зависит от биологической изменчивости рассматриваемого аналита, отбора проб и обработки материала, а также от неопределенности измерения.

    Чтобы использовать это эталонное распределение в клинической практике, вам необходимо ограничить площадь, введя эталонный интервал. Если измеряемая переменная имеет нормальное распределение, статистически приблизительно 95% (95,6%) значений будут находиться в пределах диапазона, определяемого средним значением ± 2 стандартных отклонения. Измерения в этих пределах часто используются для описания тестовых значений, обычно наблюдаемых у здорового населения, и их часто называют «нормальным диапазоном». Аналогичным образом, приблизительно 99% будут в пределах среднего ± 3 стандартных отклонения.

    Таким образом, эталонный интервал, включающий 95% значений, ограничен нижним и верхним эталонным пределом, соответствующим 2,5% и 97,5%. Значения по обе стороны от этих контрольных пределов, таким образом, не входят в «нормальный диапазон». Статистически это означает, что 5% населения или один из двадцати должны считаться ненормальными!

    Если заказаны два теста, вероятность того, что второй тест будет в пределах нормальной популяции, также будет 95%, но вероятность того, что оба теста будут нормальными, равна 0.95 2 = 0,90. Если заказано 10 тестов, что часто случается, вероятность того, что все они находятся в пределах 95% -ного интервала, составляет 0,60. С другой стороны, некоторые биохимические параметры демонстрируют значительные биологические вариации, поэтому у пациента с патологическим состоянием также возможно получить результат теста в пределах референтного интервала (рис. 1).

    Нажмите для увеличения

    Рис. 1: Нормальные распределения, со средним значением = 10 и средним значением = 18, стандартным отклонением = 2. 95% значений находятся в пределах ± 2 × SD.

    Таким образом, ненормальные результаты не всегда указывают на болезнь или патологическую ситуацию, а нормальный результат не всегда указывает на отсутствие болезни. Конечно, чем более ненормальный результат, тем больше вероятность того, что он связан с патологическим состоянием.

    При установлении референсного интервала некоторые биохимические параметры не будут иметь нормального распределения. Часто встречаются так называемые асимметричные распределения, но данные часто можно преобразовать в нормальное распределение, применив логарифмическое преобразование.Без преобразования около 95% наблюдений по-прежнему будут находиться в пределах 2 стандартных отклонений, но те 5% вне пределов вполне могут оказаться на одном конце.

    Чтобы избежать этого, можно использовать непараметрическую статистику для определения 2,5-го и 97,5-го процентилей, или, проще говоря, вам может потребоваться определить контрольные пределы, чтобы 2,5% результатов было вырезано с каждой стороны распределения. Для некоторых параметров было решено использовать 99-й процентиль, чтобы 1% результатов находился в верхнем диапазоне.

    Интервал может часто отличаться в зависимости от возраста, пола, размера или этнического происхождения, поэтому сбор данных из огромного количества лабораторных тестов для установления референсного интервала — трудоемкое и дорогостоящее дело. Для многих коммерческих аналитических методов производитель устанавливает референсный интервал. Чтобы использовать это, необходимо подчеркнуть, что интервал должен быть четко определен и подходить для демографического населения.

    В последние годы в крупных проектах с участием нескольких лабораторий из разных стран участвовали в сборе и измерении образцов с целью установления общих референсных интервалов.Таким образом, референсные интервалы для наиболее распространенных аналитов были установлены на основе большого количества данных, например Северный эталонный интервальный проект (NORIP).

    ТАБЛИЦА I: Референсные интервалы для креатинина

    Референтный интервал

    0–1 неделя
    1 неделя – 1 месяц
    1–12 месяцев
    1–14 лет
    > 14 лет
    > 14 лет

    53-97 мкмоль / л
    27-62 мкмоль / л
    18-35 мкмоль / л
    18-66 мкмоль / л
    50-90 мкмоль / л
    60-100 мкмоль / л

    Установление референсного интервала, таким образом, позволяет клиницисту сравнивать результаты, полученные от индивидуума, с результатами, полученными от популяции, и тем самым использовать тот факт, что внутрииндивидуальные биологические вариации, даже если они могут быть значительными, намного меньше, чем вариация для рассматриваемой популяции.


    Внутрииндивидуальная биологическая изменчивость

    Несмотря на то, что индивидуум может значительно отличаться от нормальной популяции, тем не менее важно учитывать внутрииндивидуальные вариации рассматриваемого биохимического параметра. Многие аналиты измеряются с более высоким или более низким результатом, в зависимости от колебаний компонентов жидкости тела вокруг заданного гомеостатического значения. Таким образом, сезонные колебания, биологические циклы или ритмы, потребление пищи, упражнения или просто время суток могут повлиять на измеряемый параметр.

    Это, конечно, представляет особый интерес при сравнении результатов теста пациента с предыдущим, например в связи с оценкой лечения. При этом клиницист должен принимать во внимание биологические вариации и проводить критическую оценку изменений, наблюдаемых в результатах.

    Не всегда существует четкая граница между здоровьем и болезнью, но, тем не менее, существует тенденция интерпретировать лабораторные тесты как здоровье или болезнь. Таким образом, при использовании пределов эталонного интервала будут некоторые случаи, которые вызовут ненужные ложные тревоги.

    Например, во время развития болезни, на первых стадиях или в процессе прогрессирования, биологическая изменчивость представляет собой потенциальный риск ложной интерпретации. Аналогичным образом, для некоторых количеств биологическая изменчивость в патологических состояниях выше, чем в здоровом состоянии, и диагностическая ценность теста снижается.

    Биологическая вариация может быть оценена на основе измеренных значений аналитической вариации (CV):

    CV всего 2 = CV аналитический 2 + CV биологический 2 и, следовательно:

    CV биологический =

    Биологическая вариация для биохимического параметра — это мера того, насколько большое увеличение / уменьшение, как можно ожидать, внесет вклад в аналитическую вариацию в нормальной ситуации.

    Зная биологические и аналитические вариации внутри индивидуума (промежуточные), можно определить, можете ли вы интерпретировать результат теста как существенно отличающийся от предыдущего, полученного пациентом, и можно принять во внимание так называемое критическое различие. Определяя статистическую вероятность, критическую разницу (CD) можно рассчитать как:

    CD =

    CD = 2,77 *

    Фактор 2,77 равен разности z-статистики, равной 1.96 для этого примера с вероятностью 0,05 (5%), что результат вызван случайным отклонением. Z-оценка зависит исключительно от вероятности, выбранной для значимости, и от того, являются ли изменения однонаправленными (рост ИЛИ падение) или двунаправленными. Примеры значений z можно найти у Фрейзера [2].

    Чаще всего клинициста интересуют двунаправленные изменения с вероятностью 5%, что означает, что, как правило, мы будем искать различия, превышающие 2,8 * CV.

    Таким образом, знание биологических вариаций внутри индивида имеет абсолютное значение для оценки лабораторных результатов.

    Пример:

    Глюкоза измеряется как в плазме, так и в глюкозе цельной крови. Внутрииндивидуальная биологическая вариация для глюкозы составляет CV биологическая ~ 6%, тогда как аналитическая вариация CV аналитическая ~ 2% для глюкозы в плазме и 3-4% для цельной крови. Тогда ежедневная вариация пациента будет:

    CV глюкозы = =

    6,3% для глюкозы плазмы

    Теперь вычисляем критическую разницу CD = 2.77 * = 18% означает, что два значения теста на глюкозу, которые расходятся более чем на 18%, будут значительно отличаться.

    При мониторинге диабета или нарушения толерантности к глюкозе (IGT) существуют рекомендуемые значения концентрации глюкозы в плазме натощак (FPG):

    • FPG
    • 7,0 ммоль / л> FPG ≥ 5,6 ммоль / л ~ IGT
    • FPG ≥ 7,0 ммоль / л ~ диабет.

    При сравнении результатов теста с рекомендованными пределами необходимо учитывать биологические и аналитические ошибки.


    Точность и прецизионность

    Когда образец измеряется несколько раз, редко получают одинаковые результаты каждый раз. Вместо этого результаты будут более или менее отклоняться в зависимости от точности метода измерения. Точно так же измерение образца двумя разными методами редко дает точно такие же результаты, но различаются более или менее в зависимости от точности методов.

    Таким образом, два основных фактора, влияющих на аналитическую неопределенность, — это точность (неточность) и точность (систематическая ошибка), каждая из которых вносит вклад в случайные ошибки и систематические ошибки.Точность определяется как степень, в которой повторные измерения в неизменных условиях показывают одинаковые результаты. В лаборатории термин неточность чаще используется для обозначения случайных аналитических ошибок, влияющих на результаты.

    Точность определяется как степень близости измерений величины к ее фактическому или принятому значению. Однако чаще всего термин систематическая погрешность используется в лаборатории для описания систематических различий между методами измерения или между методом и эталонным значением.

    При определении точности важно использовать концентрации аналита, близкие к пределам клинического решения. Для каждой концентрации рассчитывается среднее значение (M) и стандартное отклонение (SD):

    SD =

    Стандартное отклонение или так называемый коэффициент вариации (CV), который представляет собой стандартное отклонение в процентах от среднего, является мерой точности:

    CV =

    SD представляет собой сумму всех изменений, влияющих на анализ.Это, например, испытательный прибор, различные технологи, занимающиеся анализом, условия окружающей среды и просто повседневные изменения. Тогда SD является мерой межсерийной точности.

    При определении систематической ошибки среднее значение серии измерений на образце сравнивается с известной концентрацией аналита в образце или с ожидаемым значением. Величину смещения можно определить с помощью соответствующего стандартного материала (например, сертифицированного стандартного материала), содержащего известную концентрацию аналита.

    В лаборатории клинической химии систематическая ошибка метода обычно определяется путем сравнения результатов с результатами ряда других лабораторий, измеряющих тот же материал образца. Это межлабораторное сравнение, известное как проверка квалификации, подразумевает, что лаборатория регулярно получает образцы с неизвестной концентрацией аналита.

    Обычно сравнение проводится с лабораториями, использующими ту же методологию, и затем сравнение показывает способность лаборатории достичь правильного результата теста.Как указано, смещение вызвано систематическими ошибками, такими как калибровка, изменение реагента (номер партии) и т. Д., И соответствующие неточности, SD или CV по отношению к эталонному значению или межлабораторное сравнение является мерой смещения метода. Эти типы ошибок независимы в том смысле, что вы можете проводить анализ с высокой точностью, но с низкой точностью, и наоборот.

    Обычно в лаборатории, когда два или более прибора используются для одного анализа, регулярное сравнение методов и проверка систематической ошибки проводятся путем параллельного анализа.Оборудование, используемое для тестирования в местах оказания медицинской помощи (POCT), является хорошим примером с довольно большим количеством инструментов по всей больнице. Таким образом, для результата пациента не должно иметь значения, был ли образец проанализирован на приборе №1, приборе №2, №3 или №10.

    Часто точность и предвзятость иллюстрируются стрельбой в цель. Отклонение от центра соответствует смещению, а точность соответствует расширению пулевых отверстий.

    Аналитическая вариация может значительно повлиять на надежность лабораторного теста, в частности, когда биологическая вариация мала по сравнению с аналитической ошибкой.При интерпретации результата теста врач должен иметь возможность знать систематическую ошибку и точность метода или общую ошибку (TE) для метода:

    TE = B + 1.96 * I

    B = систематическая ошибка, I = неточность, уровень значимости 95%). Это может быть сопроводительный или легко доступный метод или таблица данных (в лабораторной информационной системе или в Интернете). Для многих лабораторных тестов программы внешней оценки качества или правительственные постановления (например, CLIA) предоставляют значения для приемлемой аналитической вариации, так называемые общие допустимые ошибки (TE a ), которые включают неточность и систематическую ошибку измерения.

    Обратите внимание, что систематическая ошибка как систематическое различие между тестом и эталонным (истинным) значением не имеет отношения к тесту, который не стандартизирован; примером может служить тест D-димера.

    Примером важности аналитической ошибки является измерение С-реактивного белка (СРБ) в качестве реагента острой фазы и в качестве теста на риск сердечно-сосудистых заболеваний. Как реагент острой фазы СРБ может резко увеличиваться в ответ, например, на инфекции, и тест измеряет более широкий диапазон уровней CRP.

    Из-за высокой неточности нижних диапазонов этого метода недостаточно для проверки риска сердечно-сосудистых заболеваний. Для прогнозирования сердечно-сосудистых заболеваний анализ должен уметь различать значения CRP:

    • > 1,0 мг / л и
    • > 3,0 мг / л (высокий риск)

    (Американская кардиологическая ассоциация и Центры США по контролю и профилактике заболеваний). Безусловно, очень важна точность выполнения аналитического метода.Однако несколько высокочувствительных анализов CRP показывают аналитическую погрешность в диапазоне 5-10%, и этого, вероятно, будет недостаточно. Согласно Westgard [3] допустимое значение CV действительно должно быть около нуля.


    Чувствительность и специфичность

    В терминологии клинической биохимии чувствительный метод обычно означает, что анализ может измерять низкие концентрации аналита, а специфичность означает способность метода измерять сам аналит без вмешательства других веществ в исследуемой пробе.Таким образом, терминология здесь относится к аналитической чувствительности и аналитической специфичности.

    При интерпретации лабораторных тестов мы говорим о клинической или диагностической чувствительности и специфичности, которые касаются возможности того, есть ли у пациента заболевание или нет. Для клинициста диагностическая чувствительность и специфичность являются важными вопросами, которые показывают, насколько надежен тест и насколько он подходит для предполагаемой цели.

    Когда лабораторный результат показывает значение, соответствующее определенному болезненному состоянию, есть две возможности: болезнь может присутствовать или болезнь может отсутствовать.В первом случае мы имеем дело с истинно положительным (TP) результатом, а во втором — с ложноположительным (FP) результатом для заболевания. Точно так же, если результат показывает отсутствие болезни, человек может быть свободен от болезни или действительно болен. В этом случае у нас есть истинно отрицательные (TN) или ложноотрицательные (FN) соответственно.

    Диагностическая чувствительность — это мера доли фактических положительных результатов, которые правильно определены как положительные. Таким образом, это мера способности аналитического метода идентифицировать конкретное заболевание.Чувствительность рассчитывается как процент истинно положительных результатов (TP) среди всех больных (рис. 2):

    Нажмите для увеличения

    Рис. 2: Нормальные распределения, со средним значением = 10 и средним значением = 18, стандартным отклонением = 2. 95% значений находятся в пределах ± 2 × SD.
    Для отсечки на 95% красный = ложноотрицательный, синий = ложноположительный

    TP / (TP + FN)

    Таким же образом диагностическая специфичность измеряет долю правильно идентифицированных негативов и, таким образом, является мерой способности метода исключить конкретное заболевание.Затем рассчитывается специфичность как процент истинно отрицательных результатов (TN) среди всех без заболевания:

    TN / (TN + FP)

    Тест, показывающий, что женщина не беременна, когда она на самом деле беременна, является примером теста с низкой чувствительностью, тогда как тест с низкой специфичностью — это тест, показывающий беременность, когда женщина не беременна.

    Несмотря на то, что метод тестирования обладает высокой специфичностью и высокой чувствительностью, вы не обязательно получите правильный ответ для постановки диагноза.Это в значительной степени зависит от распространенности заболевания; это количество людей с заболеванием в данной популяции, особенно при низкой распространенности.

    Например, очень редкое заболевание и лабораторный тест на это заболевание с чувствительностью и специфичностью менее 100%. Вероятность ложноположительных результатов высока, и, таким образом, получается низкая прогнозируемая ценность.

    Прогностическая ценность — это вероятность наличия заболевания при положительном результате теста или отсутствия заболевания при отрицательном результате теста.В формуле это можно отобразить так:

    Прогнозирующая ценность положительного результата теста: PPV = TP / (TP + FP)

    Прогнозирующая ценность отрицательного результата теста: NPV = TN / (TN + FN)

    Таким образом, прогностические значения зависят от чувствительности, специфичности и распространенности и, таким образом, представляют вероятность того, что положительный тест отражает основное состояние, на которое проводится тестирование.


    Заключение

    Некоторые параметры важны при интерпретации лабораторных результатов, и, кроме того, интерпретация также зависит от причины, по которой запрашивается тест — будь то диагностическая цель, мониторинг или скрининг.Если тест запрашивается для исключения диагноза, то требуется высокочувствительный тест; если это необходимо для диагностики заболевания высокого риска, то необходим высокоспецифичный параметр.

    Интерпретация лабораторных результатов фактически начинается с того, что клиницист запрашивает правильный тест для клинической проблемы, с которой он / она сталкивается. Ожидается, что результат предоставит информацию, которая поддержит решение о последующем лечении. Какие действия будут предприняты, зависит от понимания врачом лабораторных результатов и от того, как реагировать на эту информацию.Этот круг от рассмотрения лабораторных анализов до интерпретации и действий — это цикл от мозга к мозгу [4].

    Цикл от мозга к мозгу включает в себя знание:

    • Преаналитические параметры
    • Биохимический тест
    • Биологическая вариация
    • Подходящее время для взятия соответствующих проб
    • Аналитические параметры
    • Точность
    • Неточность
    • Диагностическая чувствительность и специфичность
    • Постаналитические параметры
    • Пределы клинического решения
    • Частота отказов
    • Клиническая интерпретация

    Многие исследования были сосредоточены на ошибках на преаналитической и аналитической фазах, но меньше на постаналитических ошибках.Можно предположить высокий уровень ошибок при сборе проб, идентификации и штрих-кодировании, анализе и отчетности, но эти ошибки кажутся менее частыми по сравнению с ошибками при выборе правильного теста и ошибками в интерпретации результата. Согласно Laposata [5], исследование показало, что при нарушении свертываемости крови примерно 75% случаев были связаны с неверной интерпретацией результатов теста в той или иной степени.

    По данным литературы 70-80% решений в диагностике основываются на лабораторных результатах.В лаборатории многое делается для помощи в интерпретации результатов, помимо эталонных значений, ошибок измерения, отмеченных результатов и т. Д.

    Однако очевидно, что еще многое предстоит сделать для улучшения представления данных — и информации; информация, которая может помочь медицинскому персоналу правильно использовать лабораторную информацию. Сетевые лабораторные информационные системы можно улучшить с помощью средств принятия решений и инструментов, которые учитывают знания, основанные на фактах.

    9.3 Интерпретация вывода

    9.3 Интерпретация вывода

    Первая таблица, Group Statistics , показана на рисунке 9.5. Эта таблица включает описательную статистику для каждой группы. В частности, таблица включает количество случаев (N), среднюю оценку эффективности лидера, стандартное отклонение и расчетную стандартную ошибку среднего (стандартное отклонение, деленное на N).

    Наибольший интерес представляют средние оценки успеваемости для мужчин (5.68) и для женщин (6.14). У вас может возникнуть соблазн заключить, что это означает, что у женщин средние показатели успеваемости значительно выше, чем у мужчин. Однако это было бы преждевременным — на самом деле, весь смысл t-теста состоит в том, чтобы определить, действительно ли это различие (статистически значимое) или оно может быть отнесено к случайности. Для этого нам нужно изучить следующую таблицу, Independent Samples Test (рисунок 9.6).

    • 9.3a Проверка на однородность дисперсии

    Первые два столбца, обозначенные как Тест Левена на равенство вариантов , обеспечивают проверку одного из допущений t-критерия, то есть, что дисперсия в двух группах одинакова (т. Е. Подобна или однородна). Если это предположение нарушается в данных, необходимо произвести статистическую корректировку. Этот тест обеспечивает статистика F в первом столбце и ее вероятность во втором столбце ( Sig. , сокращение значимости).Если вероятность значения F (т. Е. Sig. ) меньше или равна 0,05 , то дисперсии в сравниваемых группах различаются, и условие однородности дисперсии не был доволен.

    Результаты теста F определяют, использовать ли равные отклонения, предполагаемые строк, или равные отклонения, не предполагаемые строк, при оценке t-статистики. Правило принятия решения для определения, какие строки использовать, выглядит следующим образом:

    • Если отклонения для двух групп равны (т.e, Sig. > .05 ), затем используйте результат в равных отклонениях, предполагаемых строк. Эти строки представляют собой более традиционный метод оценки значения t на основе степеней свободы ( df ), равных общему количеству баллов минус 2 (этот метод описан в большинстве учебников по вводной статистике или методам исследования). .
    • Если отклонения для двух групп значительно различаются (т.e, Sig. <.05 ), затем используйте результат в строке Равные отклонения не предполагаются . Оценка статистики t в этой строке основана на скорректированных степенях свободы, которые учитывают несходные различия в двух группах.

    Поскольку вероятность ( Sig. = .000) для значения F меньше .05 . Таким образом, отклонения двух групп равны , не равным , и поэтому следует использовать результат в строке , равные отклонения , а не , предполагаемой строке .

    • 9.3b Проверка нулевой гипотезы: интерпретация значимости t-значения

    Чтобы определить, значительна ли разница в производительности между мужчинами и женщинами, нам нужно посмотреть в столбцах с пометкой t-тест на равенство средних значений . В настоящее время нас интересует только полученное значение t и его вероятность, которые можно увидеть в столбцах, обозначенных t и Sig. (Двусторонний) . В строке равных отклонений , а не предполагается , мы видим значение t , равное 1.46. ​​Вероятность в Sig. (Двусторонний) столбец в ( p = 0,146) больше, чем 0,05, что означает, что нам нужно сохранить нулевую гипотезу об отсутствии различий, сделав вывод о том, что не было значительной разницы в лидерских качествах между мужчинами и женщинами. Сотрудники EZ.

    Следующее предложение показывает, как эти результаты будут записаны в формате APA.

    Результаты показывают, что не было значительной разницы в производительности между женщинами и мужчинами, т (195) = 1.46, p = 0,15. То есть средняя оценка успеваемости женщин ( M = 6,14, SD = 1,94) существенно не отличалась от таковой у мужчин ( M = 5,69, SD = 2,74).

    Обратите внимание, что хотя исследователи обычно заинтересованы в обнаружении «значительных различий», иногда отсутствие значительного различия имеет либо теоретическое, либо практическое значение. Это, безусловно, так и здесь. В частности, эти результаты показывают, что нет достоверной разницы в производительности между мужчинами и женщинами в EZ Manufacturing.Это важно, потому что эта информация может быть полезна для успокоения беспокойства руководителей высшего звена, которые могут придерживаться стереотипа о том, что женщины менее способны по сравнению с мужчинами в ситуациях лидерства.

    • 9.3c Дополнительная информация в t-таблице

    В t-таблице есть дополнительная информация, которая может быть вам полезна. Первый — это средняя разность . Это просто разница между двумя средствами. Стандартная ошибка средней разницы — знаменатель, используемый при вычислении t-статистики.Наконец, 95% доверительный интервал для разницы состоит из двух чисел, обозначающих нижнюю и верхнюю границы доверительного интервала. Мы можем быть уверены на 95% в том, что разница между двумя средними находится между нижней и верхней границей.

    Как уже упоминалось, существует множество других гипотез, которые мы могли бы проверить с помощью t-критерия независимых выборок на данных нашего исследования EZ Manufacturing. Упражнение в конце главы иллюстрирует одно из них, и вам предлагается изучить другие самостоятельно.В следующей главе мы обсудим аналогичный подход к проверке гипотез с использованием t-теста коррелированных выборок .

    положительных и отрицательных результатов, диапазоны, точность и др.

    Если вы ждете результатов лабораторных анализов или пытаетесь понять, что они означают, процесс и все эти медицинские термины и цифры могут сбить с толку.

    Существуют тысячи лабораторных тестов, и их результаты могут означать разные вещи. Но несколько общих рекомендаций могут помочь пролить свет.

    Как врачи используют лабораторные анализы?

    Никто не любит, когда его ткнут иглой или пописывают в чашку. Но лабораторные тесты — важные инструменты, и врачи используют их по-разному:

    • Чтобы проверить, как вы себя чувствуете в целом, например, тесты на холестерин или сахар в крови, когда у вас есть физический
    • Чтобы ответить на конкретный вопрос, например «У вас фарингит?»
    • Чтобы отследить текущее состояние или посмотреть, как работает лечение

    Сколько времени нужно, чтобы получить результаты?

    Это зависит от теста.Некоторые из них можно сделать прямо в офисе или в ближайшей лаборатории, так что вы можете получить результаты сегодня или на следующий день. Другие тесты могут занять несколько дней или недель, особенно если их нужно отправить в определенную лабораторию.

    Прежде чем покинуть кабинет врача, спросите, когда вы узнаете результаты. И попросите сотрудников офиса сообщить вам, когда они появятся. (Некоторые офисы могут не звонить, если вы этого не запрашиваете, особенно если результаты находятся в нормальном диапазоне. В некоторых офисах также есть возможность разрешить доступ в вашу лабораторию. результаты на порталах пациентов)

    Что означают мои результаты?

    Вот несколько вещей, на которые следует обратить внимание:

    Положительный vs.Отрицательный. Некоторые лабораторные тесты дают ответ на вопросы типа «да» или «нет», например, беременны ли вы или имеете определенные виды инфекций. Эти результаты обычно записываются как «положительные» или «отрицательные». В этом случае положительный результат не обязательно означает «хорошо», а отрицательный — не обязательно означает «плохо». Вместо этого:

    • Положительный результат: Лаборатория нашла то, на что проверял ваш врач. Так что, если у вас был тест на фарингит, положительный результат означает, что у вас фарингит.
    • Отрицательный: Лаборатория не нашла то, на что вы проходили тестирование.Отрицательный результат для стрептококкового горла означает, что лаборатория не обнаружила в образце стрептококковых бактерий, так что у вас его, вероятно, нет.

    Иногда результат может быть «неубедительным». Это означает, что в лаборатории нет однозначного ответа «да» или «нет» на основе вашей выборки. Ваш врач может попросить вас сделать тест еще раз или провести другой тест.

    Справочные диапазоны. Многие результаты лабораторных тестов не дают четких ответов. Вместо этого они отображаются в виде числа — например, вашего уровня холестерина.

    Эти числа сами по себе ничего не значат, поэтому вам нужно сравнить ваше значение с нормальным диапазоном, который называется «эталонным диапазоном» или «эталонным значением». Вы увидите этот диапазон в результатах лабораторных тестов.

    Всегда ли верны результаты лабораторных тестов?

    Хотя они должны соответствовать очень высоким стандартам, иногда они могут ошибаться. Например, вы можете получить ложноположительный результат (результаты говорят, что у вас есть условие, на которое вы проходили тестирование, но на самом деле это не так) или ложноотрицательный результат (результаты говорят, что у вас нет условия, но оно действительно есть) .

    Многие вещи могут повлиять на результаты некоторых лабораторных тестов, например:

    Когда вы получите результаты, спросите своего врача, насколько точен тест. Если ваш врач считает, что ваши результаты могут быть неправильными, он может порекомендовать вам сделать тест еще раз или пройти другой тест.

    Что делать, если мои лабораторные результаты не «нормальные»?

    Если вы видите в своих результатах такие слова, как «ненормальный», легко забеспокоиться. Но в этом нет ничего необычного. Например, если ваши результаты выходят за пределы контрольного диапазона, это не обязательно может быть проблемой.

    Если вы беспокоитесь о своих результатах или у вас есть вопросы, позвоните в офис своего врача. Вы можете поговорить с медсестрой или назначить встречу с врачом, чтобы поговорить о них. Они могут помочь вам понять, что для вас значат ваши результаты.

    Советы по лабораторным тестам

    Всегда храните копию своих результатов. Это может быть полезно, если вы поменяете врачей, вам нужно показать их специалисту или просто захотите посмотреть на них позже.

    Напомните своему врачу, если вы принимаете лекарства или имеете заболевание, которое может повлиять на ваши результаты.Это должно быть в вашей записи, но все же стоит упомянуть об этом.

    Скажите честно, если вы не следовали инструкциям. В некоторых лабораторных исследованиях предполагается, что вы должны голодать (не есть) или не выполнять определенные действия, есть определенные продукты или принимать определенные лекарства.

    Методика прогрессивных матриц Равена для школьников и дошкольников

    Цветной вариант Прогрессивных Матриц Равена предназначен для обследования детей от 5 до 9 лет.

    Инструкции по проведению обследования дошкольников с помощью Цветных Прогрессивных Матриц Равена

    Процедура индивидуального тестирования по Прогрессивным Матрицам Равена чрезвычайно проста. В отличие от многих других тестов, здесь нет необходимости жестко придерживаться какой-либо специальной словесной инструкции.

    Основные требования состоят в том, чтобы, во-первых, удостовериться, что испытуемые понимают, что и как они должны сделать.

    Во-вторых, следует обеспечить соответствие принятой в данном обследовании процедуры общепринятым стандартам, чтобы была возможность сравнивать полученные данные с нормативными.

    При использовании книжной формы теста нельзя увидеть, как будет выглядеть матрица с вставленным в ее вырез тем или иным фрагментом, следствием чего могут быть не очень ответственное отношение некоторых детей к заданию. Поэтому важно всякий раз удостовериться, что ребенок внимательно посмотрел на рисунок и что он убежден, что указанный им фрагмент является единственным, который правильно дополняет матрицу.

    Тому, кто проводит тест, необходимо иметь следующие материалы: инструкции, экземпляр тестового буклета. Не допускается делать никаких пометок в тестовом буклете с ЦПМ. В процессе предварительной беседы занесите данные об испытуемом в бланк ответов, удостоверившись, что указанный возраст соответствует дате рождения.

    Откройте буклет на первом задании А1. — Посмотри сюда. Укажите на верхнюю фигуру

    — Ты видишь, что из этой картинки вырезан кусочек. Каждый из этих кусочков внизу…

    Укажите на каждый из фрагментов по очереди

    — …имеет подходящую форму, чтобы заполнить вырез, но только один из них подходит по рисунку. Номер 1 имеет правильную форму, но неправильный рисунок. Номер 2 вообще не имеет рисунка. Номер 3 совсем неправильный. Номер 6 почти правильный, но вот здесь не подходит.

    Укажите на белое пятно на фрагменте номер 6.

    — Только один из кусочков правильный. Покажи, какой из них подходит, чтобы дополнить рисунок.

    Если испытуемый не показывает на правильный фрагмент, продолжайте объяснение, пока суть задания не будет им полностью уяснена. Переходите к заданию A2. — А теперь покажи кусочек, который подойдет сюда.

    Если испытуемый не справляется, продемонстрируйте ему снова задание А1, а затем опять попросите решить задание А2. Если задание выполнено правильно, переходите к заданию A3, работая по той же схеме.

    Перейдя к заданию А4, перед тем как предоставить испытуемому возможность подумать и указать на один из фрагментов скажите: — Посмотри внимательно на эти кусочки. Укажите пальцем поочередно на каждый из фрагментов.

    — Только один из этих кусочков подходит для завершения рисунка. Будь внимателен. Сначала посмотри на каждый из этих шести кусочков.

    Снова укажите на каждый из шести фрагментов.

    • — Теперь покажи на кусочек, который подойдет сюда.
    • — Этот кусочек действительно подходит сюда?
    • — Хорошо. Тогда покажи на правильный кусочек,
    • — Этот подходит?
    • — Ну так какой же из кусочков, по твоему мнению, действительно правильный?

    Укажите на рисунке место, куда должен подойти фрагмент. Когда испытуемый укажет на один из фрагментов, независимо от правильности его ответа, скажите… Если испытуемый скажет «да», примите его выбор с одобрением независимо от того, правильный он или неправильный. Если он захочет изменить свой выбор, скажите… Независимо от правильности ответа снова спросите… Если испытуемый удовлетворен своим решением, примите его выбор независимо от правильности, но, если вам кажется, что он все еще сомневается, спросите… Отметьте номер окончательного выбора в соответствующей части бланка.

    Предъявите задание А5 тем же способом, что и задание А4.

    На любой стадии тестирования в интервале между А1 и А5 задание А1 может быть использовано заново, чтобы еще раз показать испытуемому, что надо сделать, с последующей просьбой к нему попробовать снова выполнить соответствующее задание. Если испытуемый не справляется с заданиями А1A3, следует перейти к планшетной форме теста.

    Если эти пять заданий решены, переходите к заданию А6. — Посмотри внимательно на этот рисунок. Какой из этих кусочков… Укажите на каждый фрагмент по очереди.

    — …подходит сюда?

    Покажите на свободное место, которое следует заполнить.

    — Будь внимателен, подходящий кусочек только один. Какой? Если ты действительно уверен, что нашел правильный кусочек, укажи на него.

    Запишите окончательный ответ.

    По мере предъявления следующих заданий продолжайте использовать те же инструкции до тех пор, пока в них есть необходимость. Если ребенок проявляет беспокойство по поводу небольших дефектов на рисунках, убедите его, что об этом не стоит беспокоиться.

    Если ребенок «застрял» на конкретном задании, предложите ему двинуться дальше и посмотреть, не справится ли он со следующими заданиями, а затем вернитесь к заданию, вызвавшему трудности. Если вы сочтете это нужным, то можно предложить ребенку просто угадать ответ, так как «догадки иногда бывают правильными».

    Завершив серию А, предъявите первое задание Серии АB, снова указывая по очереди на каждую из трех фигур на матрице и на пространство, подлежащее заполнению. — Ты видишь, как они расположены. Так. Так. Так. Что тут должно получиться? Какой из кусочков подходит сюда? Будь внимателен. Посмотри на каждый из них по очереди. Правильный — только один. Который?

    При выполнении заданий от АB1до АB5, после того как ребенок указал на один из фрагментов, правильный или неправильный… — Он действительно подходит, чтобы дополнить рисунок? Укажите на рисунок на матрице и на вырез в ней.

    Как и прежде, если испытуемый отвечает «да», примите (и запишите) его вы­бор с одобрением. Если ребенок хочет изменить свой выбор, действуйте так же, как в Серии А, и примите его окончательный выбор.

    При выполнении шестого задания ребенка не следует спрашивать, правильный ли выбор он сделал. Просто скажите …

    1. — Посмотри внимательно на картинку.
    2. — Будь внимателен, только один из этих кусочков правильно дополняет картинку.
    3. — Какой из них?

    Укажите по очереди на каждую фигуру на матрице и на пространство, подлежащее заполнению. Укажите по очереди на каждый из фрагментов. Зафиксируйте окончательный выбор на бланке, либо записывая номер выбранного фрагмента рядом с номером задания, либо для бланка легкого подсчете зачеркивая номер выбранного ответа одной короткой линией.

    Если была сделана ошибка или испытуемый хочет изменить свой ответ, зачеркните ранее записанный номер, а затем запишите номер окончательного выбора.

    При работе с бланком легкого подсчета зачеркните отмененный ответ еще одной чертой. Не пытайтесь стирать неправильно отмеченные ответы.

    Те же указания можно использовать при работе с остальными заданиями Серий АB и В, пока это является целесообразным.

    Планшетная форма тестового буклета . Серия А

    Cкачать буклеты Серии A, AB, B в PDF-формате Методика прогрессивных матриц Равена для школьников и дошкольников

    Оценка и интерпретация

    Подсчет баллов

    За каждый правильный ответ начисляется один балл. Будьте внимательны и старайтесь не допустить потери бланков — чистых или использованных, поскольку каждый из них содержит ключ для подсчета баллов по тесту.

    Если обследуемый делает ошибки в первых пяти задачах Серии А , то нельзя считать, что он понял идею задачи.

    Полученные при этих условиях баллы, как правило, нужно признать недостоверными, несмотря на то, что общий балл при этом может оказаться и больше десяти за счет решения задач путем случайного угадывания правильного ответа среди шести альтернативных вариантов.

    При использовании планшетной формы теста некоторые дети после того, как они положили правильный фрагмент теста на место, беспокоятся, что он не вполне хорошо совпал с вырезом, и хотят его заменить.

    По этой причине, а также потому, что «смышленые» дети хотят поиграть с тестовым материалом, желательно спросить ребенка, по какой причине он сдвигает или перемещает фрагмент.

    При необходимости задание теста может быть разъяснено еще раз, чтобы ребенок понял, что в первую очередь надо положить на место правильный фрагмент, а потом, попробовав другие, вернуть правильный на место и что мелкие несовпадения фрагмента с вырезом не имеют никакого значения.

    Если дети не в состоянии выразить свои суждения словами, это не значит, что они не могут решить задачу интуитивно. Правильное решение никогда не следует фиксировать как «ошибку», если ребенок не может его объяснить.

    Напротив, неверные ответы, исправляемые в результате проб и ошибок, дают значимую психологическую информацию, хотя обычно они не включаются в общий балл по тесту из соображений строгости интерпретации процентильных результатов данного ребенка по таблице нормативов.

    В тех случаях, однако, когда ребенок осознанно обнаружил и исправил свою ошибку, окончательно вставленный фрагмент может быть учтен.

    Когда тест проводится индивидуально по книжной форме , засчитывается как «верный» или «ошибочный» тот фрагмент, на который испытуемый указывает как на свой окончательный выбор.

    Когда книжная форма используется для самотестирования или при групповом тестировании с использованием открытых бланков регистрации ответов, всякому, кто записывает больше, чем одну цифру против номера любого задания, необходимо сказать, чтобы он вычеркнул все, кроме одной. Если это обнаружено после завершения процедуры тестирования, рассматривается только последний номер справа независимо от того, верны или ошибочны другие ответы.

    • Когда используется бланк легкого подсчета, испытуемым необходимо показать, как исправлять ошибки, зачеркивая крестом (X) неправильные ответы и оставляя перечеркнутым одной короткой чертой номер своего окончательного выбора.
    • Несогласованности и ошибки.
    • Когда используется книжная форма теста, несогласованность в распределении баллов испытуемого можно оценить вычитанием его балла по каждой серии из баллов, ожидаемых при таком же общем балле.

    Представление результатов

    Наиболее адекватным способом интерпретации значимости полученной индивидом общей оценки является ее соотнесение с выраженной в процентах относительной частотой, с которой эту оценку получают испытуемые той же возрастной группы.

    Преимущество этого способа над другими состоит в том, что он не использует никаких априорных допущений о развитии интеллектуальных способностей в детстве вроде идей о его равномерном или симметричном распределении.

    В практических целях удобно рассматривать определенные процентные доли населения и в соответствии с этим группировать баллы респондентов. Это позволяет отнести респондента в соответствии с полученным баллом к той или иной группе.

    УРОВЕНЬ I. «Супер-интеллектуал», если оценка равна или больше 95% для данной возрастной группы. УРОВЕНЬ II. «Интеллектуальные возможности явно выше среднего», если оценка равна или больше 75%; II+ , если оценка равна или больше 90%. УРОВЕНЬ III.

    «Средний интеллект», если оценка лежит между 25% и 75%; III+, если оценка выше, чем медиана или 50%; III-, если оценка ниже , чем медиана. УРОВЕНЬ IV.

    «Интеллектуальные возможности явно ниже среднего», если оценка равна или меньше 25%; IV-, если оценка равна или меньше 10%. УРОВЕНЬ V. «Существенное снижение интеллекта», если оценка равна или меньше 5% для соответствующей возрастной группы.

    Общий балл, согласованность оценки и достигнутый уровень развития удобно представлять в следующем виде: Общий балл 24 Несогласованности -1,0,+1 Уровень II +

    Количество ошибок: Нормальное.

    Усредненные возрастные нормативы выполнения Цветных прогрессивных матриц (вся серия — А + АВ + В)

    Возраст ребёнка Среднее значение(баллы) Разброс (в баллах)

    4,5 — 5,5 лет 14 8-22
    5,5 — 6 лет 17 12-24
    6 — 6,5 лет 18 13-27
    6,5 — 7 лет 20 14-29
    7 — 7,5 лет 22 15-30
    7,5 — 8 лет 23 16-31
    8 — 8,5 лет 24 17-32
    8,5 — 9 лет 26 18-34
    9 — 10 лет 29 20-35
    10 — 11 лет 32 21-35

    Источник: http://www.child-psy.ru/tests/276.html

    Прогрессивные матрицы Равена

    Методика прогрессивных матриц Равена для школьников и дошкольниковПрогрессивные матрицы Равена (Raven Progressive Matrices) — тест, предназначенный для измерения уровня интеллектуального развития. Предложен Л. Пенроузом и Дж. Равеном в 1936 г. Прогрессивные матрицы Равена разрабатывались в соответствии с традициями английской школы изучения интеллекта, согласно которым наилучшим способом измерения фактора «g» является выявление отношений между абстрактными фигурами. Согласно Равену – это тест испытания способностей воспринимать определенные формы, охватывать их особенности, характер, взаимные отношения или ансамбль, совокупность отношений, а поэтому он требует по отдельным задачам метода логических рассуждений. Автор не считает, что таким образом можно производить измерения некоего абсолютного интеллекта, однако существующие результаты дают понять, что измеренные тестом мнения и навыки в определенной мере репрезентируют интеллект. Перцептивная шкала матриц опирается или основана на 2-х теориях: а) на теории восприятия форм, развитой гештальтпсихологией; б) на теории неогенеза К.Спирмена.При решении заданий выступает 3 основных психических процесса:1) внимание, внимательность (внимание отделяется от восприятия и мышления);2) восприятие, восприимчивость;3) мышление, понятливость.При решении задач внимание сильно напряжено, поддерживает стремление (интерес) к решению. Оно требует концентрированного внимания в объеме и распределении. При снижении внимания всегда появляются ошибки. Кроме внимания, выступает воля и эмоции. Поэтому испытание прогрессивными матрицами Равена не является тестом «всеобщего интеллекта», а испытывает остроту и точность внимания и ясность мышления. В данном случае речь идет об определении способности к систематизации в мышлении и планомерности или методичности, а не о самом интеллекте. Тесты Равена – невербальные испытания, свидетельствующие о том, что вербализация как мыслительный процесс в их решении значения не имеет.Существует два варианта теста: 1. Цветной вариант (предназначен для детей от 5 до 11 лет и иногда рекомендуется для лиц старше 65 лет).2. Черно-белый (для обследования подростков 14-16 лет и взрослых от 16 до 65 лет).Материал черно-белого варианта состоит из 60 матриц с пропущенными элементами. Задания разделены на 5 серий (А, В, С, D, Е) по 12 однотипных, но возрастающих по сложности матриц в каждой серии. Трудность заданий возрастает также при переходе от серии к серии.

    Описание серий:

     Серия АОт испытуемого требуется дополнение недостающей части изображения. При работе с матрицами этой серии реализуются следующие мыслительные процессы:1) дифференциация основных элементов структуры и раскрытие связи между ними;2) идентификация недостающей части структуры и сличение их с образцами.

    Психологическое значение: решение зависит от уровня внимательности, уровня статистического представления, воображения и уровня визуального различия (дискриминации).

     Серия ВСводится к нахождению аналогий между двумя парами фигур. Испытуемый раскрывает этот принцип путем постепенной дифференциации элементов. При решении используется способность постигать симметричность между фигурами.

    Психологическое значение: способность к линейной дифференциации и суждение (умозаключение) на основе линейных взаимосвязей.

     Серия СЗадания этой серии содержат сложные изменения фигур в соответствии принципам их непрерывного превращения и развития по вертикали и горизонтали и суммирование этих новых элементов в конечной недостающей фигуре.

    Психологическое значение: проявляется способность к динамической (быстрой) наблюдательности и прослеживание непрерывных изменений, динамическая внимательность и воображение, способность представлять.

     Серия DСоставлена по принципу перестановки фигур матрицы по горизонтальному и вертикальному направлению. Решение требует проследить закономерную последовательность и чередование фигур в целостной структуре.

    Психологическое значение: решение зависит от способности схватывать количественные и качественные изменения в упорядочении (составлении) фигур согласно закономерности использованных изменений.

     Серия ЕПроцесс решения задач заключается в анализе фигур основного изображения и последующей сборки недостающей фигуры по частям (аналитико-синтетическая деятельность мозга). Здесь требуется складывать и вычитать элементы фигур, смешивать части согласно алгебраическому принципу. Недостающий член структуры находиться с помощью алгебраических операций с остальными членами структуры.

    Психологическое значение: способность наблюдать сложное количественное и качественное развитие кинетических, динамических рядов. Высшая форма абстракции и динамического синтеза.

    Источник: https://psychojournal.ru/tests_online/129-progressivnye-matricy-ravena.html

    МЕТОДИКА«ПРОГРЕССИВНЫЕ МАТРИЦЫ ДЖ. РАВЕНА» — PDF

    Подробнее

    Подробнее
    Подробнее

    Подробнее

    Подробнее

    Подробнее

    Подробнее

    Подробнее

    Подробнее

    Подробнее

    {jathumbnail off} Наряду со статистической нормой — используется процентиль — это процентная доля индивидов из выборки стандартизации, результаты которой равны процентильному показателю или ниже него.

    Подробнее

    Возрастание разнообразия и сложности процессов, возникающих в современном мире, обусловливает необходимость обучения, воспитания и развития людей, их творческого мышления и способности к нестандартному

    Подробнее

    Состояние интеллектуальных предпосылок формирования навыка письма у младших школьников с дисграфией Проблема интеллектуального развития детей, обучающихся в массовой школе, является важнейшей в управлении

    Подробнее

    СПЕЦИФИКА ВЫПОЛНЕНИЯ ЗАДАНИЙ МОДИФИЦИРОВАННОЙ МЕТОДИКИ «ЦВЕТНЫЕ ПРОГРЕССИВНЫЕ МАТРИЦЫ» ДЖ.РАВЕНА ДЕТЬМИ С ПОГРАНИЧНОЙ УМСТВЕННОЙ ОТСТАЛОСТЬЮ Маршалкин А. П., Прокопьев А. А. г. Екатеринбург Распределение

    Подробнее

    ЕГЭ по БИОЛОГИИ КИМ 2010 года. ФИПИ. 1 Документы, регламентирующие разработку КИМ ЕГЭ кодификатор перечень проверяемых знаний и умений; спецификация описание экзаменационной работы 2009 года; демонстрационная

    Подробнее

    Спецификация контрольных измерительных материалов для проведения промежуточной аттестации в 6.1-6.2 классе по математике в 2018 году (физико-математический профиль) 1. Назначение контрольных измерительных

    Подробнее

    СПРАВКА по результатам психологического исследования сформированности УУД у учащихся 4-х классов на конец второго полугодия 2013-2014 учебного года гимназии «Перспектива» городского округа Самара. Во втором

    Подробнее

    Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине (модулю): Общие сведения 1. Кафедра психологии 2. Направление подготовки 44.03.02 Психолого-педагогическое образование,

    Подробнее

    Рабочая программа внеурочной деятельности «Размышляем, играем, творим» (4-5 класс) разработчик: Карпова Юлия Валерьевна учитель Нижний Новгород 206 Планируемые результаты В результате реализации данной

    Подробнее

    Аннотация к рабочей программе по учебному предмету (курсу) Математика Рабочая программа по математике для 5 класса разработана в соответствии с требованиями Федерального государственного образовательного

    Подробнее

    О. С. Чаликова, А. В. Зайцев ВЗАИМОСВЯЗЬ ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ ПОДРОСТКОВ СО ШКОЛЬНОЙ УСПЕВАЕМОСТЬЮ Эмпирические исследования в области психологии интеллекта в той или иной степени сталкиваются с

    Подробнее

    NovaInfo.Ru — 40, 2016 г. Педагогические науки 1 СТАНДАРТИЗАЦИЯ ТЕСТА И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ Векслер Виталий Абрамович Стандартизацией теста называется комплекс взаимосвязанных между

    Подробнее

    СПЕЦИФИКАЦИЯ диагностической работы по математике для обучающихся 6 классов общеобразовательных организаций 1. Назначение диагностической работы оценить уровень учебных достижений по математике обучающихся

    Подробнее

    УДК 378.033 К ВОПРОСУ РАЗВИТИЯ ПРОСТРАНСТВЕННОГО МЫШЛЕНИЯ ПРИ ИЗУЧЕНИИ ИНЖЕНЕРНОЙ ГРАФИКИ С.В. Жилич, магистр техн. наук, ст. преподаватель, Г.А. Галенюк, ст. преподаватель Белорусский государственный

    Подробнее

    Прайс-лист на продукцию для проведения психологического тестирования п/п Наименование теста Назначение теста Состав комплекта теста Стоимость теста в рублях (вкл. НДС) 1 Тест Кеттелла Применяется для оценки

    Подробнее

    80-е годы 19 века — Гальтон выдвинул идею создания интеллектуальных тестов. Чтобы можно было отбирать людей с высоким интеллектом. Гальтон — сторонник евгеники — улучшение породы человека с помощью искусственного

    Подробнее

    О результатах участия МБОУ «Школа 1 имени В.И.Муравленко» в независимой оценке готовности обучающихся 5-ых классов к обучению в основной школе по математике Результаты готовности пятиклассников к обучению

    Подробнее

    Н.Б. Печатнова Контрольно-измерительные материалы ЕГЭ как механизм внешнего оценивания. Актуальность исследования. С начала 90-х годов XX века в российском образовании идет процесс обновления традиционной

    Подробнее

    «УТВЕРЖДАЮ» Руководитель школьного отделения 2 ГБОУ Школа 2121 Калмыкова Т.П. Информационно аналитическая справка психолога Зиганшиной Р.Р. по результатам диагностики готовности к школе первоклассников

    Подробнее

    Тема 1.2. Диагностика познавательной сферы дошкольника Прежде чем излагать конкретные методики психодиагностики познавательных процессов: восприятия, внимания, воображения, памяти, мышления и речи у дошкольников,

    Подробнее

    Источник Разработка комплекса тестовых заданий по обществознанию Помазкина О. Факультет Истории и права, 4 курс Научный руководитель: Сидоров С.В., к.п.н., доц. Знания, которые учащиеся получают в школе

    Подробнее

    Лекция 4: Оценивание тестирования Любое тестирование должно заканчиваться не только выставлением оценок (баллов), но и анализом результатов тестирования, выявлением уровня обучения и качества тестов. Оценку

    Подробнее

    Я-КОНЦЕПЦИЯ ПОДРОСТКОВ С РАЗНЫМ УРОВНЕМ КРЕАТИВНОСТИ И ПОЗНАВАТЕЛЬНОЙ АКТИВНОСТИ Е. Д. БЕСПАНСКАЯ В данной статье рассматриваются вопросы, связанные с изучением Я- концепции подростков, их познавательной

    Подробнее

    Metod-1kl-2011.indd 26 31.08.2011 11:34:29 26 Примерное тематическое планирование уроков математики ХАРАКТЕРИСТИКА ВИДОВ ДЕЯТЕЛЬНОСТИ УЧАЩИХСЯ Тема Признаки, расположение и счёт предметов (10 ч) 1 53

    Подробнее

    МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «КЕМЕРОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» в г. АНЖЕРО

    Подробнее

    Измерения в образовании, надежность и валидность оценок компетенций Сравнительная характеристика традиционного оценивания и измерения: Сходство одинаковый предмет и объект, одинаковая цель Различия: Традиционное

    Подробнее

    Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине (модулю): Общие сведения 1. Кафедра психологии 2. Направление подготовки 44.03.02 Психолого-педагогическое образование,

    Подробнее

    ТЕСТ КАК СОВРЕМЕННОЕ СРЕДСТВО ОЦЕНИВАНИЯ РЕЗУЛЬТАТОВ ОБУЧЕНИЯ Данькина А.А. БГПУ alena@uni-altai.ru На протяжении всего развития истории образования, как и в любой сфере деятельности, общество стремилось

    Подробнее

    МЕТОДИКА ПЕДАГОГИЧЕСКОГО ИЗМЕРЕНИЯ ГРАМОТНОСТИ ШКОЛЬНИКА В ПРЕДМЕТНЫХ ОБЛАСТЯХ (НА ПРИМЕРЕ «МАТЕ- МАТИКА», СТУПЕНЬ НАЧАЛЬНОГО ОБЩЕГО ОБРАЗОВАНИЯ) Бояшова С. А., доктор технических наук, научный руководитель

    Подробнее

    Спецификация контрольных измерительных материалов для проведения вступительных испытаний по МАТЕМАТИКЕ в 5 класс 09 год. Назначение контрольных измерительных материалов Определить уровень освоения обучающимися

    Подробнее

    НИКО 2014 Анализ результатов исследования качества математического образования в 5-7 классах Хабаровского края Краевое государственное бюджетное учреждение «Региональный центр оценки качества образования»

    Подробнее

    HTS Report BOMAT- SHORT BOMAT — advanced — short version Бохумский матричный тест АлБор ID 3172-78 icode АлБор Дата 07.02.2017 Форма B 1. Издание BOMAT-SHORT отчета 2 / 13 СОДЕРЖАНИЕ ОТЧЕТА

    Подробнее

    ТЕСТОВЫЙ КОНТРОЛЬ ПО МОДУЛЮ 2 1. Предположение, проверяемое при помощи научных методов а) научная гипотеза; б) статистическая гипотеза; в) гипотеза исследования; г) задача исследования. 2. Проверяемое

    Подробнее

    Теоретико-методические основы разработки и апробации педагогических тестов Педагогический тест как измерительная система Вопросы лекции Важнейшие характеристики теста как системы заданий и эффективного

    Подробнее

    Планируемые результаты изучения учебного предмета Предметные результаты ЧИСЛА И ВЕЛИЧИНЫ Учащийся научится: образовывать, называть, читать, записывать числа от 0 до 100; сравнивать числа и записывать результат

    Подробнее

    Спецификация контрольных измерительных материалов для проведения промежуточной аттестации в 7.3 классе по математике в 209 году (естественно-научный профиль). Назначение контрольных измерительных материалов:

    Подробнее

    УПРАВЛЕНИЕ ОБРАЗОВАНИЯ И НАУКИ ТАМБОВСКОЙ ОБЛАСТИ ТОГКУ «Центр экспертизы образовательной деятельности» АНАЛИТИЧЕСКИЙ ОТЧЕТ по результатам мониторинга качества математического образования обучающихся 7-8

    Подробнее

    Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине (модулю): Общие сведения 1. Кафедра психологии 2. Направление подготовки 44.03.02 Психолого-педагогическое образование,

    Подробнее

    Аннотация. Рабочая программа предмета «Математика» разработана на основе Федерального государственного образовательного стандарта начального общего образования, утвержденная приказом Министерства образования

    Подробнее

    ОСНОВЫ ТЕОРИИ И ПРАКТИКИ РАЗРАБОТКИ ТЕСТОВ ДЛЯ ОЦЕНКИ ЗНАНИЙ ШКОЛЬНИКОВ ИТОГОВАЯ РАБОТА ТЕМА ИТОГОВОЙ РАБОТЫ: «РАЗРАБОТКА КОМПЛЕКТА ТЕСТОВЫХ ЗАДАНИЙ» 1. Технологическая матрица отбора содержания образования

    Подробнее

    Планируемые результаты освоения учебного предмета Личностные результаты У учащегося будут сформированы: понимание того, что одна и та же математическая модель отражает одни и те же отношения между различными

    Подробнее

    Приложение 4 к приказу 29/3 от 03.03.2017 г. ПОЛОЖЕНИЕ о порядке разработки и утверждения контрольно-измерительных материалов муниципального бюджетного общеобразовательного учреждения «Средняя общеобразовательная

    Подробнее

    Аннотация. Рабочая программа по математике составлена на основе: *ООП НОО начального общего образования ГБОУ СОШ с. Летниково, утв. Приказом 98 от 1 сентября 2015 года. *Сборник программ к комплекту учебников

    Подробнее

    1. Паспорт фонда оценочных средств по дисциплине Контролируемые дидактические единицы Контролируемые компетенции Оценочные средства Диагностика интеллекта. овая батарея Векслера. ПК-2 способностью к отбору

    Подробнее

    ПОЯСНИТЕЛЬНАЯ ЗАПИСКА К РАБОЧЕЙ ПРОГРАММЕ ДЛЯ ОБУЧАЮЩИХСЯ С ОВЗ Класс: 1-4 Предмет: математика Учитель: Ущева Татьяна Александровна Ковалива Галина Евгеньевна Количество часов: 1 класс-всего 165 ч., в

    Подробнее

    1 Пояснительная записка Курс «лего-математика» позволяет на практике обучать выполнению математических заданий, связывая их с математическими фактами. В ходе индивидуального и группового выполнения заданий

    Подробнее

    организации проектной деятельности, моделирования и технического творчества обучающихся (Рекомендации Министерства образования и науки РФ от 24.11.2011. МД-1552/03) Планируемые результаты освоения учебного

    Подробнее

    Пояснительная записка 1. Цели и задачи дисциплины Цель дисциплины Формирование у бакалавров целостного представления об основах, процедуре психодиагностического процесса, диагностических средствах и особенностях

    Подробнее

    Спецификация контрольных измерительных материалов для проведения промежуточной аттестации в 6.1 классе по математике в 2019 году (технологический и естественно-научный профили) 1. Назначение контрольных

    Подробнее

    Аннотация. Рабочая программа по математике составлена на основе: *ООП НОО начального общего образования ГБОУ СОШ с. Летниково, утв. Приказом 98 от 31 августа 2016 года. *Сборника программ к комплекту учебников

    Подробнее

    Источник: https://docplayer.ru/34016628-Metodika-progressivnye-matricy-dzh-ravena.html

    Цветные прогрессивные матрицы Дж.Равена. Перевод серых баллов в IQ. | Про Деток Блог

         Познакомилась я с цветными матрицами будучи на последнем курсе института в процессе написания выпускной квалификационной работы. Методика мне понравилась своей относительной простотой. Использовала я ее в модификации Т.В. Розановой.

    Но столкнулась с трудностью: я нигде не могла найти таблицы (или хотя бы намека на эти таблицы) перевода серых баллов, которые получаются по методике, в IQ.  На просторах Интернета этой информации просто не было. Это затруднение мне не помешало успешно защитится.

    Но, однажды, совершенно случайно ко мне в руки попали заветные таблицы… И теперь я спешу поделиться ими со своими коллегами.

    Немножко об опыте использования методики: что лично для меня значимо?

         Цветные прогрессивные матрицы Дж.Равена могут быть использованы для обследования познавательной сферы детей от 4,5 до 9 лет (5-11,5 лет). В первую очередь, методика в большей степени предназначена для оценки интеллекта детей в указанном выше возрастном диапазоне.

    Но если взглянуть на стимульный материал, то что мы видим? Для решения предъявленной задачи ребенок оперирует образами в плане представлений, и решает задачу без участия практических действий.

      Характер стимульного материала говорит о том, что методика предназначена, в первую очередь, на изучение наглядно-образного мышления.

    Но мне не давал покоя принцип «прогрессивности», который заключается в том, что сначала ребенку предлагаются совсем уж легкие задания, которые являются основой для выполнения последующих заданий.  То есть реализуется принцип «от простого к сложному».

    Фактически, можно заключить, что методика направлена на изучение способности к выявлению закономерностей (по аналогии). Следовательно, можно заключить, что она исследует мыслительные операции (словесно-логическое мышление). Таким образом, после обследования ребенка с помощью цветных прогрессивных матриц можно сделать некоторые выводы о развитии двух видов мышления.

         Далее, привожу цитату из «Индивидуальная и психологическая диагностика дошкольника» А.Н. Веракса.

          Впервые нормы для этой методики были разработаны в 1949 году в Шотландии, а затем в 1982 г. (см. таблицу № 1). Эти нормы, охватывают меньший возрастной диапазон, чем нормы, полученные в результате стандартизации методики в США между 1983 и 1993 годами (см.

    таблицу № 2). Нормы для США ниже шотландских норм, однако при проведении исследований в России предпочтительнее использовать именно их, поскольку Россия – многонациональная страна, а в исследованиях, проведенных в США, участвовали представители разных народностей.

    Таблица 11

    Нормы Дамфриз, Шотландия (1982 год)

    Возраст в годах (месяцах)
    Процентиль 6(3)- 6(8) 6(9)- 7(2) 7(3)- 7(8) 7(9)- 8(2) 8(9)- 9(2) 8(9)- 9(2)
    95

    • 90
    • 75
    • 50
    • 25
    • 10
    • 5
    26

    1. 23
    2. 20
    3. 17
    4. 14
    5. 12
    6. 11
    26

    • 26
    • 21
    • 18
    • 15
    • 12
    • 11
    28

    1. 25
    2. 21
    3. 18
    4. 16
    5. 13
    6. 12
    25

    • 24
    • 22
    • 18
    • 14
    • 13
    • 12
    31

    1. 28
    2. 23
    3. 20
    4. 17
    5. 14
    6. 13
    28

    • 27
    • 23
    • 21
    • 17
    • 15
    • 14
    32

    1. 30
    2. 25
    3. 22
    4. 18
    5. 15
    6. 14
    29

    • 28
    • 25
    • 22
    • 19
    • 16
    • 15
    33

    1. 32
    2. 27
    3. 24
    4. 20
    5. 16
    6. 14
    33

    • 32
    • 28
    • 24
    • 20
    • 17
    • 14
    34

    1. 33
    2. 29
    3. 26
    4. 22
    5. 17
    6. 15
    33

    • 31
    • 28
    • 26
    • 20
    • 17
    • 16
    п 42 47 54 38 55 30 44 33 48 47 52 41

    Таблица 21

    Нормы США (1986 год)

    Возраст в годах (месяцах)
    Процентиль 5(3)- 5(8) 5(9)- 6(2) 5(3)- 6(8) 6(9)- 7(2) 7(3)- 7(8) 7(9)- 8(2) 8(3)- 8(8) 8(9)- 9(2) 9(3)- 9(8) 9(9)- 10(2) 10(3)- 10(8) 7(3)- 11(2) 10(3)- 11 (8)
    95

    1. 90
    2. 75
    3. 50
    4. 25
    5. 10
    6. 5
    23

    • 21
    • 17
    • 12
    • 11
    • 9
    • 8
    25

    1. 23
    2. 19
    3. 14
    4. 12
    5. 10
    6. 9
    28

    • 25
    • 21
    • 16
    • 13
    • 11
    • 9
    30

    1. 27
    2. 23
    3. 18
    4. 14
    5. 12
    6. 10
    31

    • 29
    • 25
    • 20
    • 15
    • 13
    • 11
    32

    1. 30
    2. 27
    3. 22
    4. 17
    5. 14
    6. 12
    33

    • 31
    • 29
    • 24
    • 19
    • 15
    • 12
    34

    1. 32
    2. 30
    3. 26
    4. 21
    5. 16
    6. 13
    35

    • 33
    • 31
    • 27
    • 22
    • 17
    • 14
    35

    1. 33
    2. 32
    3. 28
    4. 23
    5. 18
    6. 15
    35

    • 34
    • 32
    • 29
    • 24
    • 19
    • 16
    35

    1. 34
    2. 33
    3. 30
    4. 25
    5. 20
    6. 17
    35

    • 35
    • 34
    • 31
    • 26
    • 21
    • 18

    Особенности проведения методики

         Действия испытуемого в ходе методики однотипны: он должен найти некоторую закономерность и выбрать из предложенных элементов недостающий фрагмент узора.

         Последовательность предъявления заданий не подлежит изменению. Тестовая процедура предполагает отсутствие какой-либо обратной связи со стороны психолога.

    Если испытуемый сомневается в выборе правильного ответа, нужно добиться, чтобы он высказал какое-то мнение, в крайнем случае в качестве ответа принимается последний вариант.

    При этом испытуемый не должен объяснять свой выбор – вполне достаточно словесного или жестового указания на фрагмент.

    Интерпретация методики

    За каждый правильный ответ испытуемому начисляется один балл. Если ребенок неправильно выполнил первые пять заданий, о выполнение методики прекращается, поскольку считается, что испытуемый не понял принцип решения.

    После подсчёта баллов полученный результат сравнивается с показателем процентильной (относительной) частоты (процент испытуемых того же возраста, которые правильно решили столько же задач, то есть получили такой же балл).

    По результатам теста Равена можно выделить  пять уровней развития интеллекта (см. табл. 3)

    Таблица 3

    Показатель процентильной частоты (р) Уровень развития интеллекта Уровень развития интеллекта
    в баллах (IQ)
    Более 95

    1. 75-95
    2. 25-75
    3. 5-25
    4. Менее 5
    Высокий

    • Выше среднего
    • Средний (норма)
    • Низкий
    • Сниженный интеллект
    Более 124

    1. 110-124
    2. 90-110
    3. 75-90
    4. Менее 75

         Допустим, что по результатам методики Дж. Равена ребенок в возрасте 6 лет 7 месяцев набрал 22 балла. В этом случае в таблице 2 мы находим возраст ребенка, который попадает в интервал 6 лет 3 месяца – 6 лет 8 месяцев.

    Далее, в вертикальном столбце мы находим количество баллов, которые набрал ребенок.  Нашем случае 22 балла попадают в интервал 21-25 баллов, что, как видно из таблицы, соответствуют процентному интервалу 75-90.

    По таблице 3 мы можем дать характеристику этого интервала IQ – 110-124, что соответствует уровню развития интеллекта выше среднего.

         Таким образом, данная методика позволяет получить количественную характеристику (выраженную в показателе процентильной частоты, которой соответствует определённый уровень развития интеллекта) уровня развития основного средства мышления – интеллекта.

    Литература:

    • 1 Равен Дж. К., Курт Дж. Х., Равен Дж. Руководство к прогрессивным матрицам Равена и словарным шкалам. – М., 1996.
    • Веракса А.Н. Индивидуальная психологическая диагностика дошкольника: Для занятий с детьми 5-7 лет. – М.: МОЗАИКА-СИНТЕЗ, 2014. – 144 с.

    Источник: http://prodetokblog.ru/kollegam-psyhologam/cvetnye-progressivnye-matricy-ravena/

    «Применение методики «Цветные Прогрессивные Матрицы Равена» среди дошкольников и младших школьников»

    • СПб АППО
    • Санкт-Петербургская академия
    • постдипломного педагогического образования
    • Кафедра психологии
    • Краткосрочные курсы
    • «Диагностика и развитие способностей школьников и дошкольников».
    • Курсовая работа
    • «Применение методики «Цветные Прогрессивные Матрицы Равена» среди дошкольников и младших школьников».
    • Руководитель: кандидат наук,

    доцент кафедры психологии Туник Е. Е.

    Исполнитель: Галицкая Е. А.

    СПб 2012г.

    Краткое описание методики

    Тест «Цветные Прогрессивные Матрицы» (ЦПМ) включает 36 заданий, которые составляют три серии — А, Аb и В — по 12 заданий в каждой.

    Этот тест разработан для использования в работе с маленькими детьми и престарелыми людьми, в антропологических исследованиях и в клинической практике.

    Он может успешно применяться в работе с людьми, говорящими на любом языке, с теми людьми, кто имеет физические недостатки, страдает афазией, церебральным параличом или глухотой, а также врожденной или приобретенной интеллектуальной недостаточностью.

    Три серии по двенадцать заданий, составляющие ЦПМ, организованы так, что позволяют оценить главные когнитивные процессы, которые обычно формируются у детей до одиннадцати лет.

    Эти серии предоставляют испытуемому три возможности разработки единой мыслительной темы, а шкала по всем тридцати шести заданиям в целом предназначена для возможно более точной оценки умственного развития вплоть до уровня интеллектуальной зрелости.

    Задания в Цветных Прогрессивных Матрицах подобраны таким образом, чтобы оценить ход умственного развития вплоть до той стадии, когда человек начинает настолько успешно рассуждать по аналогии, что этот способ мышления становится основой для вывода логических умозаключений. Эта завершающая стадия постепенного развития интеллектуального созревания, несомненно, одной из первых страдает при органических поражениях мозга.

    Предъявление теста в виде напечатанных в книге цветных картинок или в виде планшетов с подвижными фрагментами позволяет сделать решаемую задачу наглядной и свести к минимуму необходимые словесные пояснения.

    Манипулирования изобразительным материалом не является здесь необходимым условием успешного решения задачи, поскольку от обследуемого требуется лишь указать ту фигуру, которую он выбирает для заполнения пробела в диаграмме.

    Описание выборки

    В исследовании принимали участие 52 ребенка  ГБОУ Прогимназии № 675 «Талант» Красносельского района Санкт-Петербурга (обычного типа): 30 девочек и 22 мальчика. Работа проводилась в двух возрастных группах: дети 6,5 -7,5 лет и 7,5-8,5 лет.

    1 группа (29 детей):

    Дети, посещающие подготовительные группы детского сада обычного типа (2-е группы) в возрасте от 6,5 до 7, 5 лет (в таблице указан возраст 7 лет): 17 девочек и 12 мальчиков.

    Этнический состав группы практически однороден  (28 детей русские; у одного мальчика отец сириец, ребенок с момента рождения проживает в России).

    Данные по результатам  тестирования этой группы  представлены в таблице № 1.

    2 группа (23 ребенка):

    Дети из 1 класса общеобразовательной школы обычного типа в возрасте от 7, 5 до 8,5 лет  (в таблице указан возраст 8 лет): 13 девочек и 10 мальчиков.

    Этнический состав группы практически однороден (21 ребенок – русские;  один мальчик – дагестанец, у одной девочки отец египтянин, оба ребенка с рождения проживают в России).

    Данные по результатам  тестирования этой группы  представлены в таблице № 2.

    1. Таблица № 1
    2. Цветные Прогрессивные Матрицы Равена
    3. (дети 6,5-7,5лет — подготовительная группа детского сада)
    № п/п ФИО возраст пол А Ав В сумма время/мин
    1 Кристина 7 ж 7 10 7 24 12
    2 Ксения 7 ж 12 11 11 34 8
    3 Маша 7 ж 11 10 6 27 9
    4 Белла 7 ж 11 12 10 33 9
    5 Настя 7 ж 11 8 6 25 11
    6 Света 7 ж 9 9 7 25 11
    7 Маша 7 ж 10 11 8 29 10
    8 Даша 7 ж 10 10 9 29 7
    9 Ксения 7 ж 11 11 11 33 7
    10 Наташа 7 ж 11 11 9 31 8
    11 Алина 7 ж 12 11 10 33 10
    12 Эвелина 7 ж 10 11 8 29 9
    13 Алина 7 ж 8 9 8 25 12
    14 Катя 7 ж 10 10 9 29 9
    15 Полина 7 ж 10 11 8 29 8
    16 Вика 7 ж 7 10 8 25 9
    17 Беата 7 ж 10 12 10 32 9
    18 Вома 7 м 11 11 10 32 7
    19 Коля 7 м 6 6 5 17 10
    20 Герман 7 м 9 11 8 28 8
    21 Егор 7 м 9 6 6 21 7
    22 Костя 7 м 10 11 7 28 10
    23 Леша 7 м 10 12 9 31 7
    24 Всеволод 7 м 10 10 11 31 8
    25 Матвей 7 м 11 11 10 32 8
    26 Антон 7 м 9 9 8 26 11
    27 Сергей 7 м 10 10 11 31 9
    28 Айман 7 м 12 12 10 34 7
    29 Савелий 7 м 7 6 6 19 10
    М-среднее 9,793103 10,06897 8,482759 28,34483 8,96551724
    Стандартное отклонение 1,181926 1,239001 1,464923 3,457788 1,21284185
    • Таблица № 2
    • Цветные Прогрессивные Матрицы Равена
    • (дети 7,5-8,5лет — 1 класс общеобразовательной школы)
    № п/п ФИО возраст пол А Ав В сумма время/мин
    1 Алина 8 ж 10 11 7 28 9
    2 Вика 8 ж 7 10 9 26 7
    3 Алиса 8 ж 12 12 11 35 9
    4 Алена 8 ж 10 12 7 29 14
    5 Ольга 8 ж 9 11 12 32 9
    6 Лиза 8 ж 12 11 11 34 12
    7 Алиса 8 ж 10 8 6 24 11
    8 Сабина 8 ж 10 10 11 31 7
    9 Алена 8 ж 9 10 11 30 7
    10 Василиса 8 ж 11 11 9 31 5
    11 Люба 8 ж 10 9 8 27 8
    12 Катя 8 ж 11 10 11 32 15
    13 Оксана 8 ж 9 9 8 26 9
    14 Егор 8 м 11 10 8 29 6
    15 Денис 8 м 8 8 6 22 5
    16 Амир 8 м 10 11 7 28 8
    17 Максим 8 м 11 11 10 32 10
    18 Володя 8 м 9 8 8 25 9
    19 Сенан 8 м 9 8 8 25 6
    20 Андрей 8 м 9 10 7 26 6
    21 Арсений 8 м 10 11 10 31 11
    22 Влад 8 м 11 12 11 34 6
    23 Антон 8 м 10 9 6 25 8
    М-среднее 9,913043 10,08696 8,782609 28,78261 8,56521739
    Стандартное отклонение 0,89603 1,05482 1,6862 3,009452 2,06805293

    Тестирование проводилось индивидуально. Все дети принимали участие в тестировании по методике ЦПМ Равена впервые.

    Дети выполняли задание с интересом. Работали быстро (минимальное время, затраченное на тест 5 минут, максимальное – 14 минут). Мальчики тратили на выполнение задания в среднем меньше времени, чем девочки (мальчики в возрасте 7 лет – 8,5 мин, в возрасте 8 лет – 7,5 мин.; девочки в возрасте 7  и 8 лет соответственно – 9,3 и 9,4 мин.).

    Никто, кроме одной девочки не возвращался к ранее пройденным заданиям с целью проверить, правильный ли вариант они выбрали. Ни один ребенок не отложил решение очередного задания на последующее время (не пропускали задания, решали подряд).

    Не меняли принятого решения 62% детей в возрасте 7 лет и 39% в возрасте 8 лет.  Меняли свое решение 1 раз  10% детей 7 лет и 26% детей 8 лет. Меняли свое решение более чем 1 раз (максимум 7 раз) 28% 7-милетних детей и 35% 8-милетних. Значимых различий между девочками и мальчиками по данному параметру не наблюдалось.

    Общий средний балл в выборках детей 7-ми и 8-ми лет оказался практически идентичным (28,34 и 28,78 соответственно).

    Девочки показали в среднем более высокие общий балл, чем мальчики (дети 7-ми лет: девочки – 29,1, мальчики – 27,3; дети 8-ми лет: девочки – 29,6, мальчики – 27,7 баллов).

    Максимальное количество баллов в обеих группах набрали девочки: в группе 7-милетних по 34 балла набрали 2 девочки, в группе 8-милетних 35 баллов – одна девочка.

    Максимальное количество баллов среди мальчиков в группе 7-ми лет 32 балла – 3 мальчика, в группе 8-ми лет 34 балла – один мальчик. Минимальное количество баллов в обеих группах набрали мальчики: в группе 7-ми лет один мальчик набрал 17 баллов, в группе 8-ми лет 22 балла – один мальчик. Минимальное количество баллов среди девочек (24 балла) получили 2 девочки по одной в каждой группе.

    Из всего вышеизложенного можно сделать вывод, что в группах обследованных детей:

    • мальчики тратили на выполнение задание в среднем меньше времени, чем девочки;
    • общее количество баллов, полученных девочками при выполнении задания в среднем, а так же по абсолютному максимуму больше, чем у мальчиков;
    • при сравнении групп обследованных детей 7-ми и 8-милетнего возраста, общее количество баллов, полученных при выполнении задания, не претерпело значительного изменения;
    • дети более старшего возраста чаще сомневаются в правильности принятого ими решения и склонны, в связи с этим, менять свои ответы.

    Источник: https://nsportal.ru/vuz/psikhologicheskie-nauki/library/2014/01/06/primenenie-metodiki-tsvetnye-progressivnye-matritsy

    Понравилась статья? Поделить с друзьями:
  • Обнаружены символы за пределами инструкции sql access
  • Руководство пользователя макет
  • Руководство в системе управления мчс
  • Pdf руководство по эксплуатации mercedes benz
  • Фаберлик phytopolis инструкция по применению отзывы