Вычисление индекса трудности (Итр). Трудность теста и тестовых заданий Что такое трудность теста
Показатель трудности тестового задания как важнейший тестообразующий фактор.
Крашенинникова Галина Геннадьевна
канд. пед. наук, Магаданский филиал РГГУ
Одной из основных характеристикой тестового задания является его трудность. Уровень трудности задания, а также уровень подготовленности тестированного – это латентные параметры, которые не поддаются непосредственному наблюдению. Для того, чтобы оценить эти параметры, требуется использовать тесно связанные с ними индикаторы. При тестировании знаний студентов в качестве индикатора выступают сами тестовые задания. Возникает задача: преобразовать значения индикаторов в значения латентных параметров. Существуют различные подходы к решению этой задачи. Классическая и современная теории тестирования предлагают свои методы оценивания латентных параметров.
Традиционной мерой трудности задания в классической теории тестов долгие годы остаётся отношение числа правильных ответов на данное задание к общему числу испытуемых в группе. Чем легче задание, тем выше процент справившихся с этим заданием .
Однако данное определение несёт в себе смысловую неточность: увеличение числового значения статистического показателя говорит об уменьшении уровня трудности задания, и наоборот. Поэтому в последнее время предпринимаются попытки введения новых единиц трудности. Классическая мера трудности заменяется на противоположную и представляет собой долю неправильных ответов в группе испытуемых, что, на наш взгляд, более точно отражает смысл параметра «трудность задания».
Современная теория тестирования – Item Response Theory (IRT) – основывается на созданной П. Лазарсфельдом теории латентно-структурного анализа (ЛСА). В IRT, в отличие от классической теории, латентный параметр трактуется не как постоянная величина, а как непрерывная переменная. Методы IRT можно классифицировать по числу используемых в них параметров. Наиболее известны однопараметрическая модель Г. Раша, двух- и трехпараметрические модели А. Бирнбаума.
Георг Раш разместил на одной шкале и уровень подготовленности тестируемого и уровень трудности задания, введя для них общую единицу измерения – логит. Один логит трудности задания равен натуральному логарифму отношения доли неправильных ответов на это задание к доле правильных ответов .
Несмотря на то, что IRT получила в последнее время широкое распространение, она, тем не менее, обладает множеством недостатков. В частности, при тестировании учебных достижений отмечаются значительные расхождения между расчетными значениями и эмпирическими данными. Доказана также высокая корреляция (около 0,9) между результатами, полученными по модели Раша и результатами, полученными классическими методами . Этот факт позволяет нам без ущерба точности вычислений пользоваться методами классической теории тестов для характеристики трудности тестовых заданий.
Хотя классическая формула расчета трудности задания достаточно удобна для исполнения и последующей трактовки полученных результатов, на наш взгляд, она не лишена некоторого субъективизма: трудность задания напрямую зависит от выборки тестируемых. В связи с этим рассмотрим еще один взгляд на оценку уровня трудности тестового задания, который, хотя и не является широко распространенным, но представляет для нас определенный интерес.
Чтобы подойти к сущности латентного параметра «трудность», обратимся к классификации уровней усвоения знаний, принятых в педагогической литературе. Можно заметить вполне объективное возрастание степени трудности усвоения для каждого последующего уровня усвоения знаний. Таким образом, мы можем сделать вывод о существовании прямой зависимости между уровнями усвоения и уровнями трудности заданий, соответствующих каждому уровню усвоения. Это позволяет нам отождествлять такие понятия как «уровень трудности» и «уровень усвоения» применительно к тестовым заданиям. Взяв за основу классификацию В.П. Беспалько , мы выделяем четыре уровня трудности: «ученический», типовой, эвристический, творческий.
В настоящее время в педагогике широко используются экспертные методы. Поэтому заслуживает внимание экспертное оценивание уровня трудности тестовых заданий как ещё один из вариантов оценки показателя трудности. Например, в работе А.П. Иванова приводится описание подобной оценки, когда до начала тестового эксперимента нескольким экспертам предлагается оценить трудность заданий всех вариантов теста в баллах. Для получения экспертной оценки автор приводит перечень из восьми факторов с соответствующими критериями оценивания от 1 до 5 баллов по каждому.
В хорошо составленном тесте на трудность задания не должна влиять ни форма, ни сама организация тестирования. Показатель трудности зависит только от содержания и уровня подготовленности тестируемых. Правда, встречается мнение, что на степень трудности задания оказывает влияние месторасположение этого задания в структуре теста. В этом случае рекомендуется использовать несколько вариантов теста, отличающихся последовательностью расположения заданий . В.С. Аванесов полагает основным принципом разработки содержания педагогических тестов возрастающую трудность тестовых заданий . По его мнению, только после определения степени трудности, задание имеет шанс стать тестовым. До этого оно остается просто заданием в тестовой форме.
Включение в тест большого числа заданий средней трудности повышает его надежность, но, приводит к снижению его содержательной валидности. Тест, состоящий из легких заданий, проверяющих минимальные знания, не может дать представления о реальном уровне знаний. Подбор тестовых заданий высокой степени трудности может способствовать усилению мотивации в учебе, но может повлиять и в обратную сторону. Таким образом, тесты из трудных заданий тоже искажают результаты тестирования. Кроме того, содержание теста должно варьироваться в зависимости от уровня подготовленности групп учащихся. Трудность теста для слабых студентов заметно отличается от уровня трудности теста, предлагаемого сильным студентам.
По А. Анастази и С. Урбиной выбор уровня трудности задания зависит от назначения теста, от того как предполагается использовать тестовые показатели. Для предметно-ориентированных тестов трудность заданий должна быть на уровне 0,8-0,9. Определяя по уровню трудности задания его информативность, авторы показывают, что наиболее информативно задание со средним уровнем трудности, равным 0,50.
Таким образом, можно сделать вывод, что наибольшей дифференцирующей способностью обладают задания со средним уровнем трудности. И, если целью тестирования является дифференциация тестируемых, сравнительная оценка их уровня знаний, то из теста следует исключать наиболее простые и наиболее трудные задания. Если же назначение теста определить, овладел ли обучаемый в достаточной мере определённым набором компетенций, необходимым для перехода к следующему этапу обучения, то в нём могут быть как самые лёгкие, так и самые трудные задания.
Библиографический список
1. Аванесов В.С. Применение заданий в тестовой форме в новых образовательных технологиях // Школьные технологии. – 2007. – № 3. – С. 146–163.
2. Анастази А., Урбина С. Психологическое тестирование. – СПб. : Питер, 2002. – 688 с.
3. Беспалько В.П. Слагаемые педагогической технологии. – М.: Педагогика, 1989. – 192 с.
4. Иванов А.П. Систематизация знаний по математике в профильных классах с использованием тестов. – М.: Физматкнига, 2004. – 416 с.
5. Ингенкамп К. Педагогическая диагностика. – М.: Педагогика, 1991. – 240 с.
6. Ким В.С. Анализ результатов тестирования в процессе Rasch measurement // Педагогические измерения. – 2005. – № 4. – С. 39–45.
7. Rasch G. Probabilistic Models for Some Intelligence and Attainment Tests. – Chicago & London, 1980. – 199 p.
валидность . Для повышения качества тест-материалов, начиная с этапа их проектирования и разработки, уже используется экспертиза.Тестовые задания, удовлетворяющие "внешним" формальным требованиям (правильность формулировки, логическая непротиворечивость , адекватная форма и др.) не являются всегда качественными, позволяющими рассматривать такие задания априори или апостериори как эффективное средство оценки уровня подготовки обучаемых.
Тестовые задания (тесты) измеряют свойства тех или иных выборок потенциальных испытуемых. Экспертиза качества заданий и всего теста – это оценка не только каждого его элемента (дистракторы, их количество и др.), но и всего теста, его структуры, взаимоотношений с другими заданиями.
Качество профессионального образования – это и уровень, объем знаний, их системность, устойчивость , ценность, перспективность, фундаментальность, способность получать и строить новые знания, применять их для решения задач. Эффективное управление качеством образования также невозможно без релевантной и оперативной информации об уровне обученности. Необходимо применение качественных тестовых материалов, достоверно оценивающих учебные достижения.
Применение принципов и средств квалиметрии, системного анализа акцентирует на целостность , эмерджентность, совместимость, адаптивность и другие системные признаки тестов. Качество тестов оценивают мерой соответствия характеристик тестовых заданий и составленных на их основе вариантов тестов. Комплексной оценкой теста (испытания) в целом.
У тестовых заданий, всего теста есть структурные элементы, характеризуемые внутренними и внешними свойствами, своей структурой. На эти свойства влияют определяющим образом много факторов:
- генеральная совокупность и выборки испытуемых;
- показатели качества;
- особенности технологии тестирования;
- особенности обработки, анализа результатов тестирования (в частности, используемые математико-статистический аппарат и эвристические процедуры);
- квалификация экспертов и профессиональность экспертной группы;
- системный подход к проведению и анализу тестирования.
Полный учет свойств позволяет сконструировать "желаемые" тесты – тесты с наперед задаваемыми (согласно гипотезе тестирования) качествами, статистическими свойствами, например, "параллельные" тесты, субтесты и др. Нужно учитывать также меру дифференциации, способность заданий (тестов) дифференцировать тестируемых, например, способность дифференцировать относительно максимального или минимального уровня обучения.
Первостепенно важны для анализа такие характеристики, как трудность (сложность) задания и его различающая способность. Трудность задания отражает уровень ее выполнимости в данной статистической выборке (стандартной). Ее оценивают часто отношением количества правильно выполнивших задание к количеству выборки испытуемых.
Чем ближе этот показатель к 1, тем выше трудность задания, чем ближе к 0 – тем ниже его трудность.
В качестве показателя трудности задания теста используют индекс трудности U вычисляемый по формуле:
где n – количество правильно ответивших на задание, N – общее количество испытуемых (выборки).
При построении критериально-ориентированного теста, для повышения его трудности добавляют задания более высокой трудности, для понижения – включают больше заданий низкой трудности.
Трудность задания (теста) бывает:
- субъективная, связанная с обстоятельствами типа лимит времени, знание технологии, понимание условий (сформированность знаний, умений и навыков), психическая готовность и т.д.;
- объективная (статистическая), связанная с долей испытуемых из выборки, решивших задание (тест).
Трудность – относительная величина, зависящая от возрастных, профессиональных и иных различий испытуемых, поэтому эти особенности влияют на результаты тестирования, на надежность теста. Необходимы меры выравнивания условий (минимизации таких воздействия на тестируемых). Для этого используют направленное комплектование выборки, стандартизацию процедуры тестирования, т.е. необходима эффективная диагностическая методика, приводящая к "золотой середине", балансу трудных, среднего уровня и простых заданий.
Слишком трудные задания ухудшают статистические характеристики оценивания (мало решающих, неудача на трудном задании может повлиять на решение других заданий и т.п.). Слишком простые задания ведут к малоинформативным однообразным результатам, затрудняющим анализ качества обучения, вызывают негативное отношение испытуемых к тесту и тестированию.
Пример. Критериально-ориентированный тест должен быть полным, отражающим по содержанию весь объем знаний, планируемый к усвоению. Нормативно-ориентированный тест может содержать лишь те разделы , которые требуются для дифференциации по уровню учебных достижений обучаемых, например, 50-70% заданий средней трудности (рис. 4.1 , рис. 4.2).
В критериально-ориентированных аттестационных тестах основная часть заданий легче, что ограничивает процент неаттестованных студентов.
Пример. Если прогнозный процент неаттестованных должен быть не больше 10%, а критерий "неуспеваемости" – 70% (выполнившие лишь до 30% заданий – не аттестованы), в тест следует включить от 70% легких заданий, посильных 90% тестируемых (рис. 4.2).
Рис. 4.1.
Рис. 4.2.
Поэтому важно выбрать тест, оптимальный по сложности заданий, группам сложности, структуре теста. Если на вопрос правильно отвечает большинство испытуемых, его обычно помещают в начале теста, а остальные вопросы – по мере роста их трудности. Такое расположение заданий позволяет оценить приблизительно порог трудности для каждого испытуемого, его место в рейтинге.
Практическое тестирование свидетельствует: максимально отражается индивидуальный уровень знаний, навыков, умений испытуемых при использовании заданий средней трудности с включением небольшого количества остальных заданий.
Есть специальная характеристика, называемая различающей способностью заданий. Она показывает меру эффективности различения тестируемых на группы: овладевшие учебным материалом и не овладевшие им.
Чем ближе R к нулю, тем меньше различение заданием испытуемых, овладевших или не овладевших учебным материалом.
Чем ближе R к значению –1, тем также больше различение, но в инверсном порядке: испытуемые, овладевшие материалом, ответили неправильно, и наоборот. Это редкий случай, он свидетельствует, например, о пробелах в методике, спонтанности ее.
В предыдущей статье были рассмотрены девять принципов разработки содержания педагогических тестов. В фокусе этой статьи - десятый принцип: возрастающая трудность заданий теста.
Если педагогический тест определить кратко как систему заданий равномерно возрастающей трудности, то станет понятно, что трудность заданий является важнейшим, скажем так, тест образующим показателем. Немало руководителей школ считают, что их учителя в состоянии "придумать" за короткое время могут сколько угодно "тестов". На самом же деле можно придумать довольно много заданий в тестовой форме. А совсем не тесты, а только задания. Их нельзя включать в настоящий тест до тех пор, пока не станет известной мера их трудности, а также и другие характеристики. Мера трудности проверяется эмпирически. Из этого требования становится понятной обязательность предварительной эмпирической проверки каждого задания, до начала тестирования. В процессе проверки многие задания не выдерживают предъявляемых к ним требований, и потому не включаются в тест. Первое требование к тестовым заданиям: в тесте задания должны различаться по уровню трудности, что вытекает из данного ранее определения теста и рассматриваемого принципа.
Внимательный читатель вероятно уже уловил различия в лексике трех как бы "незаметно" введенных здесь основных понятий теории педагогических измерений: понятие педагогического теста, задания в тестовой форме и тестового задания. Требования к первому из них уже было рассмотрено в статье "Определение педагогического теста" (УШ № 30, август 1999г.).
Требования ко второму понятию лучше ввести сейчас, сделав это хотя бы кратко перечислив их, для того чтобы не отвлечься от основной темы статьи. К заданиям в тестовой форме предъявляются следующие требования:
Краткость;
Технологичность;
Правильность формы;
Правильность содержания
Логическая форма высказывания;
Одинаковость правил оценки ответов;
Наличие определенного места для ответов;
Одинаковость инструкции для всех испытуемых;
Правильность расположения элементов задания;
Аванесов В.С. Основы педагогической теории измерений // Педагогические Измерения, 1, 2004г. С. 17.
Подробное истолкование этих требований последует в следующих статьях, а сейчас хотелось бы обратить внимание читателя на то, что здесь нет требования известной трудности задания, в то время как к тесту и к тестовому заданию такое требование предъявляется. Из размышления над этим и ранее опубликованным материалом можно сделать два вывода. Первый - что в тесте нет места заданиям с неизвестной мерой трудности. И второй - что не все предлагаемые задания в тестовой форме могут стать тестовыми заданиями: это разные понятия. В первом понятии самыми существенными являются требования содержания и формы. К тестовым же заданиям в первую очередь предъявляется требование известной трудности, то, что явно не требуется у заданий в тестовой форме. Можно повторить, что задания имеют шанс стать тестовыми только после эмпирической проверки меры их трудности, на типичных группах испытуемых.
Показатель трудности теста и тестовых заданий является содержательным и формальным одновременно. Содержательным, потому что в хорошем тесте трудность может зависеть только от трудности содержания заданий и от уровня подготовленности самих испытуемых. В то время как в плохом тесте на результаты начинают заметно влиять форма заданий (особенно если она не адекватна содержанию), плохая организация тестирования, если имеются возможности списывания, утечки информации. Особого упоминания в этой связи заслуживает вредная практика нацеленной подготовки учащихся единому государственному экзамену. Педагогов, занимавшихся таким делом, министр образования России 1907 года И.Толстой называл натаскивателями. Но педагоги виноваты менее всего. Виновата ошибочная система "егирования", которая подталкивает к такой ошибочной практике. Каков контроль, таково и образование.
Формальная составляющая сторона показателя трудности возникает при рассмотрении тестирования как процесса противоборства испытуемого с предлагаемым ему заданием. Получаемый при этом исход полезно рассматривать как результатменно такого противоборства. При упрощенном истолковании каждого случая предъявления задания часто, но совсем ен обязательно рассматриваются два исхода: победа испытуемого при правильном решении задания, где он получает один балл, или поражение, за что даётся ноль баллов. Оценка результата противоборства зависит от соотношения уровня знания тестируемого к уровню трудности задания, от избранной единицы измерения знаний и от заранее принятого правила (конвенции) - что считать "победой" испытуемого, и допустима ли ничья, если говорить языком спорта.
Принцип возрастающей трудности используется при изложении содержания многих учебников и пособий, особенно по тем учебным дисциплинам, которые построены по кумулятивному принципу, что означает: знание последующих элементов курса в явном виде зависит от знания предыдущих учебных элементов. Такое построение присуще учебникам по математике, логике, иностранным языкам, статистике, техническим и многим другим наукам. В них ранее изученные понятия активно используются в последующих темах. Поэтому изучать такие дисциплины нужно только с самого начала, и без пробелов.
Большинство авторов, особенно зарубежных, не делают различий между понятиями "трудность" и "сложность". Многие разработчики тестов - то же. Однако есть работы, в которых эти понятия определяются различно. Например, А.Н.Захаров и А.М.Матюшкин отмечают, что степень трудности учебного задания не совпадает с его сложностью. Степень сложности учебного материала характеризуется реальной (объективной) насыщенностью учебного задания и формой его изложения, а степень трудности всегда предполагает соотнесение подлежащего усвоению учебного материала с ранее усвоенным учебным материалом и интеллектуальными возможностями учащихся (1).
Л.Н. Ланда объяснял трудность учебной задачи тем, что учащиеся часто не знают тех операций, которые надо производить, чтобы найти решение. Если систему операций для решения некоторого класса задач назвать методом решения, то, по его мнению, трудность связана с незнанием метода, с незнанием, как нужно думать в процессе решения, как и в какой последовательности надо действовать с условиями задачи (2). Возникающие затруднения объясняются тем, что педагог часто старается дать знания о содержании изучаемого и значительно меньше заботится о том, как надо думать, рассуждать (там же). Подобное истолкование пересекается с идеей о связи сложности задания с числом операций, которые необходимо совершить для достижения успеха. Эти определения трудности и сложности являются, по большей части, психологическими; они полезны при психологическом анализе содержания тестовых заданий.
Традиционной мерой трудности каждого задания долгие годы была доля правильных ответов в группе испытуемых, изображаемая символом p j , где индекс j указывает на номер интересующего задания (1, 2 и т. д.). Например, если правильные ответы испытуемых на третье задание теста оценивать одним баллом, а неправильные - нулем, то значение показателя p 3 можно найти из элементарного отношения:
P 3 = R 3 /N,
где R 3 означает число правильных ответов на данное задание, а N - общее число испытуемых в группе. Общая формула расчета доли правильных ответов на любое задание (j) имеет соответственно вид
p j = R j / N
Показатель p j . долго использовался в качестве меры трудности в так называемой классической теории тестов (3). Позже была осознана содержащаяся в ней смысловая неточность: ведь увеличение значения p j указывает не на возрастание трудности, а, наоборот, на возрастание легкости, если можно использовать такое слово. Поэтому в последние годы с показателем трудности заданий стали ассоциировать противоположную статистику - долю неправильных ответов (q j). Эта доля вычисляется из отношения числа неправильных ответов (Wj- от англ слова Wrong - неправильный) к числу испытуемых (N):
q j = W j / N
Естественным образом принимается, что p j + q j = 1. В классической теории тестов многие годы рассматривались только эмпирические показатели трудности. В новых вариантах психологических и педагогических теорий тестов больше внимание стало уделяться характеру умственной деятельности учащихся в процессе выполнения тестовых заданий различных форм (4).
Содержание теста не может быть только легким, средним или трудным. Здесь в полной мере проявляется известная мысль о зависимости результатов применяемого метода. Легкие задания теста создают только видимость наличия знаний у учащихся, потому что ими проверяются минимальные знания. В этой связи можно заметить, что ориентация федерального органа управления образованием на проверку минимального уровня знаний не дает, и не может, даже по определению, дать представление о реальном уровне знаний, т.е. дать ту информацию, которая давно уже нужна обществу и органам управления. Искажает результаты тестирования и подбор заведомо трудных заданий, в результате чего у большинства школьников оказываются заниженные баллы. Ориентация на трудные задания нередко рассматривается как средство усиления мотивации к учебе. Однако это средство действует неоднозначно. Одних трудные задания могут подтолкнуть к учебе, других - оттолкнуть от нее. Подобная ориентация искажает результаты и в итоге, снижает качество педагогического измерения. Если тест построен строго из заданий возрастающей трудности, то этим открывается путь к созданию одной из самых интересных шкал измерения - шкалы Л. Гутмана.
При определении теста уже отмечалось, что все задания теста, хотелось бы подчеркнуть, независимо от содержания тем, разделов и от учебных дисциплин, располагаются в порядке возрастающей трудности. Распространенная, до недавнего времени, рекомендация включать в тест больше заданий средней трудности, оправдана с точки зрения определения надежности измерения по формулам т.н. классической теории тестов. Существующие в этой теории методы оценки надежности теста дают снижение надежности при включении в тест легких и трудных заданий. В то же время увлечение заданиями одной только средней трудности приводит к серьезной деформации содержания теста: последний теряет способность нормально отображать содержание изучаемой дисциплины, в которой всегда есть легкий и трудный материал. Таким образом, в погоне за абстрактной теоретически высокой надежностью теряется содержательная валидность тестовых результатов. Стремление же поднять валидность результатов теста нередко сопровождается снижением их точности. Этот феномен в теори известен как парадокс теоретика американской психометрики Ф.Лорда
Если тестируется слабая, по подготовленности, группа учащихся, то оказывается, что трудные задания теста просто не работают, потому что ни один учащийся не может правильно на них ответить. Такие задания из дальнейшей обработки данных изымаются. В адаптивных контролирующих системах они не предлагаются. Содержание теста для слабых учащихся будет заметно отличаться от содержания теста для сильных учащихся. У последних, наоборот, не работают легкие задания, так как все знающие испытуемые на легкие задания отвечают правильно. Таким образом, содержание традиционного теста существенным образом варьирует в зависимости от уровня подготовленности тех групп учащихся, на измерение знаний которых нацелен тест.
Оптимальное отображение содержания учебного материала в тестовые задания требуемого уровня трудности предполагает возможность выбора подходящей формы. Содержание теста выражается в одной из четырех основных форм заданий. Это: 1) задания с выбором одного или нескольких правильных ответов из числа предложенных; 2) задания открытой формы, где ответ испытуемый дописывает сам, в отведенном для этого месте; 3) задания на установление соответствия, и 4) задания на установление правильной последовательности действий.
Литература
1. Захаров А.И., Матюшкин А.М. Проблемы адаптивных систем обучения // Кибернетика и проблемы обучения. - М.: Прогресс, 1970.- 389с.
2. Ланда Л.Н. Алгоритмизация в обучении. М ., Просвещение , 1966
3. Gulliksen H. Theory of Mental Tests. N - Y. Wiley. 1950 - 486 p. и мн. др.
4. Tatsuoka, K.K. Item construction and psychometric models appropriate for constructed response. Prinston, N-J, 1993. - 56 pp; Frederiksen, N., Mislevy R.J., Bejar I. J. (Eds). Test theory for a new generations of tests. Lawrence Erlbaum Ass. Publ. 1993, Hillsdale, N-J, 404pp. и др .
В предыдущей статье было рассмотрено девять принципов разработки содержания педагогических тестов. Сегодня мы продолжаем рассмотрение десятого принципа - возрастающая трудность тестовых заданий.
Если педагогический тест определить кратко как систему заданий возрастающей трудности, то станет понятно, что трудность заданий является важнейшим, скажем так, тест образующим показателем. Немало руководителей школ считают, что их учителя в состоянии "придумать" за короткое время могут сколько угодно "тестов"; я сам читал приказ по школе, где учителям предписывалось в течение трех дней представить завучу "тесты". На самом же деле можно придумать сколько угодно заданий в тестовой форме (а это ещё не тесты). Их нельзя включать в настоящий тест до тех пор, пока не станет известной мера трудности, проверяемая опытным путем. Из этого требования становится понятной обязательность предварительной эмпирической проверки каждого задания, до начала тестирования. В процессе проверки многие задания (обычно больше половины) не выдерживают предъявляемых к ним требований и потому не включаются в тест. Первое требование к тестовым заданиям: в тесте задания должны различаться по уровню трудности, что вытекает из данного ранее определения теста и рассматриваемого принципа.
Внимательный читатель вероятно уже уловил различия в лексике трех как бы "незаметно" введенных здесь основных понятий теории тестов: педагогического теста, задания в тестовой форме и тестового задания. Требования к первому из них уже было рассмотрено в статье "Определение педагогического теста" (УШ № 30, август 1999г.).
Требования ко второму понятию лучше ввести сейчас, сделав это хотя бы кратко перечислив их, для того чтобы не отвлечься от основной темы статьи. К заданиям в тестовой форме предъявляются следующие требования:
- правильность содержания
- логическая форма высказывания;
- правильность формы;
- краткость;
- наличие определенного места для ответов;
- правильность расположения элементов задания;
- одинаковость правил оценки ответов;
- одинаковость инструкции для всех испытуемых;
- адекватность инструкции форме и содержанию задания.
Подробное истолкование этих требований последует в следующих статьях, а сейчас хотелось бы обратить внимание читателя на то, что здесь нет требования известной трудности задания, в то время как к тесту и к тестовому заданию такое требование предъявляется. Из размышления над этим и ранее опубликованным материалом можно сделать два вывода. Первый - что в тесте нет места заданиям с неизвестной мерой трудности. И второй - что не все предлагаемые задания в тестовой форме могут стать тестовыми заданиями: это разные понятия. В первом понятии самыми существенными являются требования содержания и формы. К тестовым же заданиям в первую очередь предъявляется требование известной трудности, то, что явно не требуется у заданий в тестовой форме. Задания имеют шанс стать тестовыми только после опытной, скажем строже, эмпирической проверки меры их трудности, на типичных группах испытуемых.
Показатель трудности теста и тестовых заданий является содержательным и формальным одновременно. Содержательным показателем, потому что в хорошем тесте трудность может зависеть только от содержания и от уровня подготовленности самих испытуемых, в то время как в плохом тесте на результаты начинают заметно влиять форма заданий (особенно если она не адекватна содержанию), плохая организация тестирования, если имеются возможности списывания, утечки информации. Особого упоминания в этой связи заслуживает спорная практика нацеленной подготовки к централизованному тестированию.
Формальная составляющая сторона показателя трудности возникает при рассмотрении тестирования как процесса противоборства каждого испытуемого с каждым предлагаемым ему заданием. Получаемый при этом исход полезно рассматривать как результат такого противоборства. При упрощенном истолковании каждого случая противоборства испытуемого с очередным заданием обычно рассматриваются только два исхода: победа испытуемого при правильном решении задания, где он получает один балл, или поражение, за что даётся ноль баллов. Оценка результата противоборства зависит от соотношения уровня знания тестируемого к уровню трудности задания, от избранной единицы измерения знаний и от заранее принятого правила (конвенции) - что считать "победой" испытуемого и допустима ли ничья, если говорить языком спорта.
Принцип возрастающей трудности используется при изложении содержания многих учебников и пособий, особенно по тем учебным дисциплинам, которые построены по кумулятивному принципу, что означает: знание последующих элементов курса в явном виде зависит от знания предыдущих учебных элементов. Такое построение присуще учебникам по математике, логике, иностранным языкам, статистике, техническим и многим другим наукам. В них ранее изученные понятия активно используются в последующих темах. Поэтому изучать такие дисциплины нужно только с самого начала, и без пробелов.
Большинство авторов, особенно зарубежных, не делают различий между понятиями "трудность" и "сложность". Многие разработчики тестов - то же. Однако есть работы, в которых эти понятия определяются различно. Например, А.Н.Захаров и А.М.Матюшкин отмечают, что степень трудности учебного задания не совпадает с его сложностью. Степень сложности учебного материала характеризуется реальной (объективной) насыщенностью учебного задания и формой его изложения, а степень трудности всегда предполагает соотнесение подлежащего усвоению учебного материала с ранее усвоенным учебным материалом и интеллектуальными возможностями учащихся (1).
Л.Н. Ланда объясняет трудность учебной задачи тем, что учащиеся часто не знают тех операций, которые надо производить, чтобы найти решение. Если систему операций для решения некоторого класса задач назвать методом решения, то, по его мнению, трудность связана с незнанием метода, с незнанием, как нужно думать в процессе решения, как и в какой последовательности надо действовать с условиями задачи (2). Возникающие затруднения объясняются тем, что педагог часто старается дать знания о содержании изучаемого и значительно меньше заботится о том, как надо думать, рассуждать (там же). Подобное истолкование пересекается с идеей о связи сложности задания с числом операций, которые необходимо совершить для достижения успеха. Эти определения трудности и сложности являются, по большей части, психологическими; они полезны при психологическом анализе содержания тестовых заданий.
Традиционной мерой трудности каждого задания долгие годы была доля правильных ответов в группе испытуемых, изображаемая символом pj, где индекс j указывает на номер интересующего задания (1, 2 и т. д.). Например, если правильные ответы испытуемых на третье задание теста оценивать одним баллом, а неправильные - нулем, то значение показателя p3 можно найти из элементарного отношения
где R3 означает число правильных ответов на данное задание, а N - общее число испытуемых в группе. Общая формула расчета доли правильных ответов на любое задание (j) имеет соответственно вид
Показатель pj. долго использовался в качестве меры трудности в так называемой классической теории тестов (3). Позже была осознана содержащаяся в ней смысловая неточность: ведь увеличение значения pj указывает не на возрастание трудности, а, наоборот, на возрастание легкости, если можно использовать такое слово. Поэтому в последние годы с показателем трудности заданий стали ассоциировать противоположную статистику - долю неправильных ответов (qj). Эта доля вычисляется из отношения числа неправильных ответов (Wj- от англ слова Wrong - неправильный) к числу испытуемых (N):
Естественным образом принимается, что pj + qj = 1. В классической теории тестов многие годы рассматривались только эмпирические показатели трудности. В новых вариантах психологических и педагогических теорий тестов больше внимание стало уделяться характеру умственной деятельности учащихся в процессе выполнения тестовых заданий различных форм (4).
Содержание теста не может быть только легким, средним или трудным. Здесь в полной мере проявляется известная мысль о зависимости результатов применяемого метода. Легкие задания теста создают только видимость наличия знаний у учащихся, потому что ими проверяются минимальные знания. В этой связи можно заметить, что ориентация федерального органа управления образованием на проверку минимального уровня знаний не дает, и не может, даже по определению, дать представление о реальном уровне знаний, т.е. дать ту информацию, которая давно уже нужна обществу и органам управления. Искажает результаты тестирования и подбор заведомо трудных заданий, в результате чего у большинства школьников оказываются заниженные баллы. Ориентация на трудные задания нередко рассматривается как средство усиления мотивации к учебе. Однако это средство действует неоднозначно. Одних трудные задания могут подтолкнуть к учебе, других - оттолкнуть от нее. Подобная ориентация искажает результаты и в итоге, снижает качество педагогического измерения. Если тест построен строго из заданий возрастающей трудности, то этим открывается путь к созданию одной из самых интересных шкал измерения - шкалы Л. Гутмана.
При определении теста уже отмечалось, что все задания теста, хотелось бы подчеркнуть, независимо от содержания тем, разделов и от учебных дисциплин, располагаются в порядке возрастающей трудности. Распространенная, до недавнего времени, рекомендация включать в тест больше заданий средней трудности, оправдана с точки зрения определения надежности измерения по формулам т.н. классической теории тестов. Существующие в этой теории методы оценки надежности теста дают снижение надежности при включении в тест легких и трудных заданий. В то же время увлечение заданиями одной только средней трудности приводит к серьезной деформации содержания теста: последний теряет способность нормально отображать содержание изучаемой дисциплины, в которой всегда есть легкий и трудный материал. Таким образом, в погоне за теоретически высокой надежностью теряется содержательная валидность тестовых результатов. Стремление же поднять валидность результатов теста нередко сопровождается снижением их точности.
Если тестируется слабая, по подготовленности, группа учащихся, то оказывается, что трудные задания теста просто не работают, потому что ни один учащийся не может правильно на них ответить. Такие задания из дальнейшей обработки данных изымаются. В адаптивных контролирующих системах они не предлагаются. Содержание теста для слабых учащихся будет заметно отличаться от содержания теста для сильных учащихся. У последних, наоборот, не работают легкие задания, так как все знающие испытуемые на легкие задания отвечают правильно. Таким образом, содержание традиционного теста существенным образом варьирует в зависимости от уровня подготовленности тех групп учащихся, на измерение знаний которых нацелен тест.
Оптимальное отображение содержания учебного материала в тестовые задания требуемого уровня трудности предполагает возможность выбора подходящей формы. Содержание теста выражается в одной из четырех основных форм заданий. Это: 1) задания с выбором одного или нескольких правильных ответов из числа предложенных; 2) задания открытой формы, где ответ испытуемый дописывает сам, в отведенном для этого месте; 3) задания на установление соответствия, и 4) задания на установление правильной последовательности действий.
Главная > ТестыСтатья 7. Трудность теста и тестовых заданий
В предыдущей статье было рассмотрено девять принципов разработки содержания педагогических тестов. Сегодня мы продолжаем рассмотрение десятого принципа - возрастающая трудность тестовых заданий. Если педагогический тест определить кратко как систему заданий возрастающей трудности, то станет понятно, что трудность заданий является важнейшим, скажем так, тест образующим показателем. Немало руководителей школ считают, что их учителя в состоянии «придумать» за короткое время могут сколько угодно «тестов»; я сам читал приказ по школе, где учителям предписывалось в течение трех дней представить завучу «тесты». На самом же деле можно придумать сколько угодно заданий в тестовой форме (а это ещё не тесты). Их нельзя включать в настоящий тест до тех пор, пока не станет известной мера трудности, проверяемая опытным путем. Из этого требования становится понятной обязательность предварительной эмпирической проверки каждого задания, до начала тестирования. В процессе проверки многие задания (обычно больше половины) не выдерживают предъявляемых к ним требований и потому не включаются в тест. Первое требование к тестовым заданиям: в тесте задания должны различаться по уровню трудности, что вытекает из данного ранее определения теста и рассматриваемого принципа. Внимательный читатель вероятно уже уловил различия в лексике трех как бы «незаметно» введенных здесь основных понятий теории тестов: педагогического теста, задания в тестовой форме и тестового задания. Требования к первому из них уже было рассмотрено в статье «Определение педагогического теста» (УШ № 30, август 1999г.). Требования ко второму понятию лучше ввести сейчас, сделав это хотя бы кратко перечислив их, для того чтобы не отвлечься от основной темы статьи. К заданиям в тестовой форме предъявляются следующие требования:
- правильность содержания; логическая форма высказывания; правильность формы; краткость; наличие определенного места для ответов; правильность расположения элементов задания; одинаковость правил оценки ответов; одинаковость инструкции для всех испытуемых; адекватность инструкции форме и содержанию задания.
Где Rsub>3 означает число правильных ответов на данное задание, а N – общее число испытуемых в группе. Общая формула расчета доли правильных ответов на любое задание (j) имеет соответственно вид:
Показатель P j . долго использовался в качестве меры трудности в так называемой классической теории тестов. Позже была осознана содержащаяся в ней смысловая неточность: ведь увеличение значения pj указывает не на возрастание трудности, а, наоборот, на возрастание легкости, если можно использовать такое слово. Поэтому в последние годы с показателем трудности заданий стали ассоциировать противоположную статистику - долю неправильных ответов (q j). Эта доля вычисляется из отношения числа неправильных ответов (W j – от англ слова Wrong - неправильный) к числу испытуемых (N):
Естественным образом принимается, что p j + q j = 1. В классической теории тестов многие годы рассматривались только эмпирические показатели трудности. В новых вариантах психологических и педагогических теорий тестов больше внимание стало уделяться характеру умственной деятельности учащихся в процессе выполнения тестовых заданий различных форм. Содержание теста не может быть только легким, средним или трудным. Здесь в полной мере проявляется известная мысль о зависимости результатов применяемого метода. Легкие задания теста создают только видимость наличия знаний у учащихся, потому что ими проверяются минимальные знания. В этой связи можно заметить, что ориентация федерального органа управления образованием на проверку минимального уровня знаний не дает, и не может, даже по определению, дать представление о реальном уровне знаний, т.е. дать ту информацию, которая давно уже нужна обществу и органам управления. Искажает результаты тестирования и подбор заведомо трудных заданий, в результате чего у большинства школьников оказываются заниженные баллы. Ориентация на трудные задания нередко рассматривается как средство усиления мотивации к учебе. Однако это средство действует неоднозначно. Одних трудные задания могут подтолкнуть к учебе, других - оттолкнуть от нее. Подобная ориентация искажает результаты и в итоге, снижает качество педагогического измерения. Если тест построен строго из заданий возрастающей трудности, то этим открывается путь к созданию одной из самых интересных шкал измерения - шкалы Л. Гутмана. При определении теста уже отмечалось, что все задания теста, хотелось бы подчеркнуть, независимо от содержания тем, разделов и от учебных дисциплин, располагаются в порядке возрастающей трудности. Распространенная, до недавнего времени, рекомендация включать в тест больше заданий средней трудности, оправдана с точки зрения определения надежности измерения по формулам т.н. классической теории тестов. Существующие в этой теории методы оценки надежности теста дают снижение надежности при включении в тест легких и трудных заданий. В то же время увлечение заданиями одной только средней трудности приводит к серьезной деформации содержания теста: последний теряет способность нормально отображать содержание изучаемой дисциплины, в которой всегда есть легкий и трудный материал. Таким образом, в погоне за теоретически высокой надежностью теряется содержательная валидность тестовых результатов. Стремление же поднять валидность результатов теста нередко сопровождается снижением их точности. Если тестируется слабая, по подготовленности, группа учащихся, то оказывается, что трудные задания теста просто не работают, потому что ни один учащийся не может правильно на них ответить. Такие задания из дальнейшей обработки данных изымаются. В адаптивных контролирующих системах они не предлагаются. Содержание теста для слабых учащихся будет заметно отличаться от содержания теста для сильных учащихся. У последних, наоборот, не работают легкие задания, так как все знающие испытуемые на легкие задания отвечают правильно. Таким образом, содержание традиционного теста существенным образом варьирует в зависимости от уровня подготовленности тех групп учащихся, на измерение знаний которых нацелен тест. Оптимальное отображение содержания учебного материала в тестовые задания требуемого уровня трудности предполагает возможность выбора подходящей формы. Содержание теста выражается в одной из четырех основных форм заданий. Это:
- задания с выбором одного или нескольких правильных ответов из числа предложенных; задания открытой формы, где ответ испытуемый дописывает сам, в отведенном для этого месте; задания на установление соответствия; задания на установление правильной последовательности действий.
Статья 8. Логические требования к содержанию теста
Тестовые задания отличаются от нетестовых не только по содержанию, но и по стилю построения предложения. Из тестового задания полностью устраняется двусмысленность, когда, например, подлежащее в именительном падеже легко путается с прямым дополнением в винительном падеже (типа “мать любит дочь”). Кроме того, иногда тестовое задание ошибочно отождествляется с загадкой. Хотя в обоих случаях ставится задача найти правильный ответ, отмеченного сходства недостаточно для отождествления загадки и тестового задания. Есть признаки, которые явно отделяют их. Для загадки наиболее важным, специфически отличительным признаком является метафоричность, образность загадки. Известно, что метафоричным выражение становится тогда, когда оно употребляется не в прямом, а в переносном значении. Тестовое задание, напротив, всегда автологично: в нем слова используются только в их прямом, непосредственном значении. Автологический стиль - это тот, о котором В.Маяковский писал: "Ищем речи точной и нагой". Тестовое задание формулируется из точных терминов и никогда не содержит метафоры, но лишнего слова и лишнего знака. Пример метафорично сформулированного задания в открытой тестовой форме: “Отцом русской физиологии считается ___________”. В предыдущих статьях рассматривались педагогические требования к содержанию теста. Теперь пришло время рассмотреть логические принципы определения содержания педагогического теста. В логике известны такие законы правильного мышления как законы тождества, непротиворечия, исключенного третьего и достаточного основания. Это позволяет выделить такие основные свойства правильного мышления, как определенность, непротиворечивость, обоснованность. Применительно к тестовой теории и практики эти общие свойства правильного мышления приобретают функции специфических регулятивов тестовой деятельности, вследствие чего приобретают значение принципов. Рассмотрим их подробнее. 1. Определенность содержания теста Определенность содержания теста образует предмет педагогического измерения. В случае гомогенного теста возникает вопрос об уверенности в том, что все задания теста проверяют знания именно по определенной учебной дисциплине, а не по какой-то другой. Довольно часто случается так, что правильные ответы на некоторые задания требуют знаний не только интересующей дисциплины, но и ряда других, обычно смежных и предшествовавших учебных дисциплин. Близость и связанность которых затрудняет точное определение предметной принадлежности измеряемых знаний. Например, в физических расчетах используется немало математических знаний и потому в систему физического знания обычно включается та математика, которая используется при решении физических задач. Неудача в математических расчетах порождает неудачу при ответах на задания физического теста. Отрицательный балл ставится, соответственно, за незнание физики, хотя испытуемый допустил ошибки математического толка. Если в такой тест включено много таких заданий, которые для правильного решения требуют не столько физических знаний, сколько умений выполнять усложненные расчеты, то это может быть примером неточно определенного содержания теста по физике. Чем меньше пересечение знаний одной учебной дисциплины со знаниями другой, тем определеннее выражается в тесте содержание учебной дисциплины. Определенность содержания требуется и во всех других тестах. В гетерогенном тесте это достигается посредством явного выделения заданий одной учебной дисциплины в отдельную шкалу. При этом нередко встречаются задания, хорошо работающие не только на одну, но и на две, три и даже большее число шкал. Во всяком тестовом задании заранее определяется, что однозначно считается ответом на задание, с какой степенью полноты должен быть правильный ответ. Не допускается определение понятия через перечисление элементов, не входящих в него. Рассмотрим пример задания открытой формы, где испытуемому предлагается, на месте прочерка, дополнить утверждение своим ответом: ТОЧКА ЕСТЬ ТО, ЧТО НЕ ИМЕЕТ ______________. В сознании возникает вопрос: “Не имеет чего? Ответ, по Евклиду – “точка не имеет частей", но это как раз случай неудачного определения содержания, как задания, так и самого понятия точки. Как известно, точка не имеет, например, цвета, вкуса, запаха и многого другого, и не только частей. Немалую роль в формировании теста как системы играет требование логической правильности заданий, включенных в тест. Как отмечается в литературе, логическая правильность в формулировании тестовых заданий достигается при соблюдении следующих условий:
- соразмерности объема определяющего понятия объему определяемого. Известные в литературе примеры:
1. ЧЕТЫРЕХУГОЛЬНИК, У КОТОРОГО ВСЕ СТОРОНЫ РАВНЫ, НАЗЫВАЕТСЯ ________________ (ответ - ромб).
2. ПРЯМОУГОЛЬНИК, У КОТОРОГО ВСЕ СТОРОНЫ РАВНЫ, НАЗЫВАЕТСЯ ______________ (ответ - квадрат). В случае если на первое задание дается ответ "квадрат", допускается несоразмерность: объем определяющего - четырехугольника - больше объема определяемого - квадрата. отсутствия тавтологии. Примеры:
3. СТОИМОСТЬ ТОВАРА ОПРЕДЕЛЯЕТСЯ СТОИМОСТЬЮ ____________ (ответ - труда);.
СТОИМОСТЬ ТРУДА ОПРЕДЕЛЯЕТСЯ СТОИМОСТЬЮ ________________ (ответ - товара).
Как уже отмечалось, в этих примерах обнаруживает себя нарушение правил логики; одна стоимость определяется через другую, которая в свою очередь нуждается в определении; утвердительной формы тестового задания. Примеры:
4. ЕСЛИ В МАЖОРНОМ ЛАДУ ПОНИЗИТЬ ВТОРУЮ СТУПЕНЬ, ТО ПОЛУЧИТСЯ ЛАД
1) дорийский
2) фригийский
3) лидийский
5. ОСНОВНЫМ ЭЛЕМЕНТОМ ХОХЛОМСКОЙ РОСПИСИ ЯВЛЯЕТСЯ
1) бутон
2) розан
3) кудрина
4) купавка В приведенных примерах ответы подобраны по определенному основанию; в них соответственно перечислены лады и элементы росписи. Отсутствие общего основания приводит к логической противоречивости содержания задания и ответов. Например, в задании:
6. НА ЭЛЕКТРОН, ДВИЖУЩИЙСЯ В МАГНИТНОМ ПОЛЕ, ДЕЙСТВУЕТ СИЛА
1) Кулона
2) Лоренца
3) Ампера
4) Кориолиса
5) тяжести
пятый ответ не совпадает с фамилией ученого-физика. Этот ответ не соответствует содержанию остальных ответов и потому его можно признать некорректным; он должен содержать фамилию еще одного известного физика, как это и сделано ниже:
7. ОСНОВОПОЛОЖНИК КВАНТОВОЙ ТЕОРИИ
1) Борн
2) Эйнштейн
3) Гейзенберг
4) Бор
5) Резерфорд
В дополнение к трем перечисленным свойствам логически правильного мышления отметим еще одно требование к тестовым заданиям, которое является столь же формальным, сколь и содержательным. Это требование краткости тестовых заданий. Краткость обеспечивается тщательным подбором слов, символов, графиков, позволяющих минимумом средств добиваться максимума ясности смыслового содержания задания. Исключаются повторы, малопонятные, редко употребляемые, а также неизвестные для студентов символы, иностранные слова, затрудняющие восприятие смысла. Примерное количество слов в задании - пять-девять, но, в общем, чем меньше, тем лучше. Например:
СИЛА – ЭТО
1) вектор
2) скаляр
Хорошо, когда задания содержат не более одного придаточного предложения. Как отмечал известный лингвист А.М.Пешковский, точность и легкость понимания растут по мере уменьшения словесного состава фразы и увеличения ее бессловесной подпочвы. Чем меньше слов, тем меньше недоразумений. Хороший способ достижения краткости задания - это спросить о чем-нибудь одном. Часто встречающиеся случаи утяжеления заданий требованиями что-то найти, решить и затем еще и объяснить отрицательно сказываются на качестве задания и теста в целом, хотя с педагогической точки зрения легко понять причину формулирования такого рода заданий. Если в таких заданиях ученик что-то решает без учителя, потом что-то ему объясняет, то возникает сопряжение объективного метода с субъективным, плюс к этому - затруднения с оценками при решении вопроса какой выставить балл. В противоположность этому, одно из важных требований теста – иметь заранее разработанные правила выставления баллов без участия учителя.
Статья 9. Знания как предмет тестового контроля
Что значит знать? Вот, друг мой, в чем вопрос.
Гете. Фауст.
Статья 10. Знания как предмет тестового контроля
Концепция знания В предыдущей статье проводился анализ трех понятий: знание, незнание, и невежество. Из этих понятий в педагогическом тестировании опираются только на знание; при этом незнание рассматривается довольно упрощенно как альтернатива знанию. Хотя уже было показано, что со времен Сократа знанию противостоят не незнание, а невежество. Уровень незнания и невежества вряд ли можно измерить по причине неконкретности и бесконечности того мира, который образуется частицей отрицаниями "не" с различными словами. В то время как понятия "знать" и "ведать" можно соотнести с конкретным набором элементов, образующих множества признаков данного свойства у испытуемых. Таким образом, главная сложность измерения знания заключается в общей концептуализации этого явления. Именно этого в педагогической науке явно не хватает. В отсутствии общей концепции знания, разработчики тестов начинают строить свое собственное понимание сущности знаний, применительно к той учебной дисциплине, с преподаванием которых они имеет дело. Таким образом, они становятся - или начинают читать себя - экспертами. Существуют признаки, на основе которых окружающие полагают; что эксперты знают, что значит знать: это уровень и качество полученного ими общего и профессионального образования, опыт преподавания, показатели эффективности работы, научно-методические труды, признание со стороны руководителей. К сожалению, в советское и особенно, в постсоветское время, немалое число некомпетентных лиц научились приобретать репутацию экспертов, не будучи таковыми, по существу. Это делалось за счет выстраивания системы взаимовыгодных отношений с вышестоящими деятелями, защиты липовых диссертаций, написания коллективных "научных трудов", а также бесцеремонного заимствования из трудов знающих людей. Это своего рода хунвейбины, известные по новейшей истории Китая, после которых страна была по многим направлениям отброшена назад, на десятилетия. Там многое, если не все, пришлось переделывать заново. Схожий период настал сейчас и в России. Для целей педагогического измерения концептуально можно выделить четыре основные сферы знаний: знание мира, знание людей, знание самого себя, и знание способов деятельности. Далее эти четыре сферы полезно разделить на естественнонаучную и на гуманитарную сферу знаний, а далее делить по отраслям практики, по наукам. Например, научное знание делится на филологическое, математическое, историческое, физическое, химическое и т.д. Но не все знания являются научными. Помимо них существует пласты донаучных и вненаучных знаний, объективных и субъективных. Вненаучные знания отличаются от научных способами получения, хранения и передачи. Научные способы обеспечивают сравнительно большую объективность, подтверждаемость и воспроизводимость знаний. К вненаучным можно отнести результаты таких направлений деятельности, как магия, астрология, нумерология, хиромантия, и учение о живом космосе, левитация и ясновидение, и многие другие. К спорному относят статус религиозных знаний, хотя их существование в религиозных текстах и влияние на сознание множества людей не может подвергаться сомнению. Главным критерием отличия донаучных знаний от научных является мера их рациональной обоснованности: чем выше такая обоснованность, тем больше знания претендуют на научность. Рациональное познание - сложный, присущий человеку способ отражения действительности посредством мышления. Для него характерны: опора на результаты чувственного отражения, опосредованность чувствами; абстрактность и обобщенность возникающих образов; воспроизведение объектов на уровне сущностей, внутренних закономерных связей и отношений. К основным формам рационального познания относят понятия, суждения, умозаключения, законы, гипотезы, теории. Учебные знания заметно отчленены от процесса научного познания, упорядочены, соподчинены, выражены доступным для учащихся языком и, наконец, представлены в учебнике во множестве заданий, сопровождающих учебник и учебный процесс. В некотором смысле учебные знания объективны и субъективны одновременно. Будучи объективными вообще, изложенные в научных текстах и в учебных материалах, они превращаются в субъективные знания в процессе их усвоения. При этом практически всегда имеет место то или иное субъективное искажение предлагаемых знаний. Знание может быть также объективно истинным и объективно ложным. Ложное знание возникает как результат искажения, и, кроме того, вследствие намеренной пропаганды со стороны заинтересованных групп, партий, объединений и т.п. Объективно ложное знание органы образования не распространяют в принципе, за исключением некоторых меняющихся идеологем и политических мифов, сочетаемых с объективными или частично объективными знаниями в области истории, философии, религии, политологии и тому подобных, относимых к гуманитарным наукам. Объективно ложное знание существует в форме незнания, псевдознания и просто лжи. Немало ложных знаний имелось в курсах истории. Поэтому не случайно, что учебники истории приходилось (и видимо, еще придется) менять чаще других. Некоторые знания могут быть осмысленными или неосмысленными. В последнем случае можно говорить о непонимании сути. Напротив, понимание, по мнению З.И. Калмыковой – это мысленное проникновение в суть познаваемой действительности, абстрагирование и обобщение её закономерностей. Она же выделяет несколько уровней понимания. Первый уровень - элементарный – как акт чтения текста, в процессе которого происходит переход от графических знаков к словам и предложениям. Второй уровень понимания – лексический - устанавливаются связи между словами и соответствующими им предметам и явлениям действительности, без учета содержания текста в целом. На третьем уровне – синтаксическом – уточняется значение слов в зависимости от их формально- логических связей в предложении (1, с. 84-105). Знания, культура, мораль и воспитание Концепция знаний не может рассматриваться вне вопросов культуры. «Культура, истинная культура, - писал французский ученый и литератор Жан Ростан, - гораздо меньше, чем это принято думать, связана с накоплением фактических данных. Это скорее известное умение понимать, преломлять, мыслить. Быть культурным - это не значит начинить свой мозг цифрами, датами, именами. Это уровень суждения, логическая требовательность, стремление к доказательствам, понимание сложности вещей и трудности поставленных проблем. Это способность к сомнению, к чувству меры, к скромности суждения, и терпимости к незнанию. Это уверенность в том, что «никогда не можешь быть правым до конца". Связь знания и культуры регулируется так называемым чувством меры. Не случайно в Древнем Китае совершенным человеком справедливо считался тот, кто умел остановиться на том, что ему неизвестно. Пример нарушения отмеченного чувства меры можно найти в новейшей истории советской педагогики. В ней каждый элемент учебных знаний, в рамках так называемого воспитывающего обучения, должен был формировать преданность известным идеям, лицам и непоколебимую убежденность в правильности всех предлагавшихся (нередко принудительно) знаний, что нередко делалось, к тому же, в вульгаризированном виде. Вряд ли кто будет спорить с тем, что изучение наук не всегда оказывает положительное воспитательное воздействие на учащихся. Образование без воспитания опасно, и для личности, и для общества. В предыдущих статьях уже отмечалась убежденность древнеегипетских жрецов и членов ордена пифагорейцев в том, что для блага общества в тайны наук надо посвящать только достойных, порядочных людей. Эта же мысль подтверждается в так называемой философии герметизма, в которой подчеркивается что ложно понимаемый "прогресс" человечества порождает титанов ума и пигмеев духа, людей с притупленной совестью и чувственностью (2). Наиболее четко эта ситуация была выражена русским философом И. А. Ильиным. "Образование без воспитания не формирует, а разнуздывает и портит человека, ибо оно дает в его распоряжение жизненно выгодные возможности, технические умения, которыми он, - бездуховный, - начинает злоупотреблять". Классификации видов знаний Существует множество попыток классифицировать виды знаний, но нет пока ни одной, которая полностью удовлетворяла бы практические потребности. Например, в состав знаний И.Я. Лернер включал термины и понятия, факты, законы и теории, методологические знания (знания о методах), оценочные знания, абстрактные и конкретные знания, эмпирические и теоретические знания (3). Попытка выстроить классификацию знаний, с использованием нескольких оснований деления, сделана Е.Т. Дыранковой (4). Иерархию видов знаний школьников можно найти в работе В.П. Максаковского. Самое высокое место в его иерархии занимает знание научных законов, закономерностей. Затем следуют знания научных теорий, парадигм, концепций, гипотез, общих и единичных понятий, терминов, фактов. Замыкают этот ряд представления (5, с. 6). В ставшей уже классической работе Б. Блума и его коллег (6) выделяются три сферы образовательной деятельности и иерархия уровней подготовленности. В познавательной сфере там формулируются такие уровни: 1. Знания, позволяющие воспроизвести факты, перечислить названия изучаемых явлений и предметов. Здесь все основано на воспроизведении запомнившейся информации; 2. Понимание тех знаний, которые воспроизводятся. Хороший способ проверить понимание - просить учащихся воспроизвести материал своими словами, привести примеры; 3. Применение знаний, особенно в новой ситуации; 4. Умение анализировать и синтезировать признаки; 5. Умение дать оценку, сделать общий вывод. Это самый высокий уровень подготовленности. В сфере психологической выделяются:восприятие отдельных показаний, признаков, реагирование на них;
проявление интереса к нужной информации;
организация, структурирование полученной информации, систематизация;
умение иерархизировать получаемую информацию по уровням.
В психомоторной сфере:
представление о том, как надо действовать;
готовность выполнять действия под руководством педагога;
самостоятельное выполнение действий.
При подготовке сборника были использованы материалы
доктора педагогических наук, профессора Вадима Аванесова
Подготовил А.Н.Ошмарин,
методист учебно-методического центра
отдела образования Джанкойской райгосадминистрации,
Глава первая- Тесты: история и теория
1.Из глубины веков………………………………………………….1
2.Конец 19 века………………………………………………………4
3.Начало 20 века…………………………………………………….6
4.Тенденции 20 века………………………………………………...8
5.Советский период…………………………………………………11
6.Пятидесятые годы………………………………………………...14
7.Система полного усвоения знаний…………………………….17
Глава вторая- Тесты: теория и методика их разработки
1.Начала теории. Отношение к тестам……………………….…20
2.Определение педагогического теста…………………………..23
3.Традиционные тесты……………………………………………..26
4.Нетрадиционные тесты…………………………………………..29
6.Принципы разработки содержания теста……………………..37
7.Трудность теста и тестовых заданий………………………….40
ДокументНередко студенты задают вопрос: зачем нам изучать историю социологии, знать то, что навсегда ушло в прошлое и в текущей деятельности вряд ли пригодится? Не лучше ли сразу начать с изучения методики и принципов разработки социальных технологий,