Педагогическое тестирование

Тестирование как метод педагогического контроля

Борисова Н.А., учитель русского языка и литературы

КГУ «Мироновская средняя школа», Тайыншинский район, СКО

1. Традиционные формы педагогического контроля

Методы обучения в их традиционных вариантах подразделяют на методы преподавания, методы учения и методы контроля.

Педагогический контроль выполняет целый ряд функций в педагогическом процессе:

    оценочную,

    стимулирующую,

    развивающую,

    обучающую,

    диагностическую,

    воспитательную и др.

Процесс контроля - это одна из наиболее трудоемких и ответственных операций в обучении, связанная с острыми психологическими ситуациями как для учащихся, так и для преподавателя. С другой стороны его правильная постановка способствует улучшению качества подготовки учащихся.

В сложившемся педагогическом процессе различают несколько видов контроля: предварительный, текущий, тематический, рубежный, итоговый и выпускной.

Систему контроля образуют экзамены и зачеты, устный опрос, контрольные работы, коллоквиумы, рефераты, семинары, лабораторные работы, отчеты. Выбор форм контроля зависит от цели, содержания, методов, времени и места.

Перечисленные методы диагностирования успеваемости учащихся имеют определенные недостатки. Рассмотрим некоторые из них. Могут возникать трудности, связанные с особенностями учительской работы:

    довольно часто проявляется несовпадение требований разных преподавателей, отличия в их уровне строгости при оценке одного и того же ответа;

    различие в профессиональной квалификации;

    при организации текущих проверок знаний большого числа учащихся, когда оценивание проводится, главным образом, лишь по формальным критериям, наблюдается загруженность преподавателя рутинной мало творческой работой, связанной с большим объемом информации, которую требуется подготовить, обработать и проанализировать за относительно короткий промежуток времени;

    возможная небеспристрастность преподавателя (по психологическим и иным причинам) к оценке ответов некоторых учащихся;

    иногда оценки, выставляемые учащимся, оказываются недостоверными из-за

    опасения преподавателя, что они будут использованы для оценивания работы

    самого преподавателя.

Трудности, связанные со спецификой традиционной формы проверки знаний. Такие, как отсутствие четко сформулированных стандартов знаний и конкретно очерченных объемов умений, достаточных для каждой положительной оценки (часто учитель мучается с вопросом: "Какую оценку поставить - "неуд" или все же можно оценить как "удовлетворительно"?").

Трудности, связанные с учащимися: использование шпаргалок, списывание, "взаимопомощь" на экзамене, что искажает достоверность оценки знаний учащихся и мешает преподавателю объективно взглянуть на качество своей педагогической работы.

На современном этапе при оценке знаний учащихся перечисленные проблемы в большей степени решаются использованием такой формы контроля, как тестирование.

2. Тестирование как метод педагогического контроля

Для диагностики успешности обучения разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов). Как утверждает А.Анастази, по численности этот тип тестов занимает первое место.

В литературе встречается следующее определение тестов достижений. Тесты - это достаточно краткие, стандартизированные или не стандартизированные пробы, испытания, позволяющие за сравнительно короткие промежутки времени оценить преподавателями и учащимися результативность познавательной деятельности учащихся, т.е. оценить степень и качество достижения каждым учащимся целей обучения (целей изучения).

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин, и являются более объективным показателем обученности, чем обычная оценка.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками, учебным материалом. На формирование способностей (например, пространственных) влияние обучения также сказывается, но оно не является единственным фактором, определяющим уровень их развития.

Во-вторых, различие между тестами определяются целями их применения. Тесты достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т.д., т.е. с помощью этих тестов диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов.

Вместе с тем нельзя отрицать, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения.

Для того чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный учащийся, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях теста достижений.

Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например, навыки работы с учебником, таблицами, энциклопедиями и словарями.

Существуют также тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т.д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать учитель.

Отдельные тесты достижений можно объединять в тестовые батареи, что позволяет получать профили показателей успешности обучения. Обычно тестовые батареи предназначаются для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от курса к курсу. Однако в последнее время созданы батареи, позволяющие получать и такие данные.

По форме проведения тесты могут быть индивидуальными и групповыми, устными и письменными, бланковыми, предметными, аппаратурными и компьютерными, вербальными и невербальными. При этом каждый тест имеет несколько составных частей: руководство по работе с тестом, тестовую тетрадь с заданиями и, если необходимо, стимульный материал или аппаратуру, лист ответов (для бланковых методик), шаблоны для обработки данных.

В руководстве приводятся данные о целях тестирования, выборке, для которой тест предназначен, результатах проверки на надежность, способах обработки и оценки результатов. Задания теста, сгруппированные в субтесты (группы заданий, объединенные одной инструкцией), помещены в специальной тестовой тетради (тестовые тетради могут быть использованы многократно, поскольку правильные ответы отмечаются на отдельных бланках). Если тестирование проводится с одним испытуемым, то такие тесты носят название индивидуальных, если с несколькими - групповых. Каждый тип тестов имеет свои достоинства и недостатки. Преимуществом групповых тестов является возможность охвата больших групп испытуемых одновременно (до нескольких сот человек), упрощение функций экспериментатора (чтение инструкций, точное соблюдение времени), более единообразные условия проведения, возможность технической обработки данных и др.

Основным недостатком групповых тестов является снижение возможностей у экспериментатора добиться взаимопонимания с испытуемыми, заинтересовать их. Кроме того, при групповом тестировании затруднен контроль за функциональным состоянием испытуемых, таким, как тревожность, утомление и др. Иногда для того, чтобы понять причины низких результатов по тесту какого-либо учащегося, следует провести дополнительное индивидуальное собеседование. Индивидуальные тесты лишены этих недостатков.

Тестирование широко используется в учебных заведениях для тренировочного, промежуточного и итогового контроля знаний, а также для обучения и самоподготовки учащихся.

Как уже указывалось, результаты тестирования могут выступать и как оценка качества преподавания, а также как оценка самих испытательных материалов.

Не меньший интерес представляет изучение результатов тестирования для определения качества лекции или семинара. Например, пусть в потоке у учителя несколько классов, и во всех проведено тестирование по заданному разделу курса. В тесте имеется определенное количество теоретических вопросов и практических задач. Каждый вопрос соответствует какой-либо теме. По этой же теме в тесте прилагается практическая задача. Если учащиеся во всех классах плохо справились с каким-либо теоретическим заданием и практической задачей к этому вопросу, следовательно, не уделено достаточного внимания этой теме.

В настоящее время наиболее часто используются следующие варианты тестовых контрольных мероприятий:

    "автоматический", когда обучаемый выполняет задание в непосредственном диалоге с компьютером, результаты сразу переносятся в блок обработки;

    "полуавтоматический", когда задания выполняются письменно, а ответы со специальных бланков вводятся в компьютер (решения не проверяются);

    "автоматизированный", когда задания выполняются письменно, решения проверяются преподавателем, а в компьютер вводятся результаты проверки.

Особенностью первых двух является отстраненность учителя от проверки результатов испытаний. В этом случае, казалось бы, их объективность повышается. Однако, при этом утрачивается значительная часть информации, которую можно было бы получить при анализе результатов тестирования с использованием человеческого фактора.

В "автоматическом" режиме такой потери можно избежать. Но при использовании такого метода на сегодняшний день возможно появление некоторых специфических проблем. Не все учебные заведения могут позволить себе оснастить классы дорогостоящим компьютерным оборудованием в достаточном количестве.

Отсутствие навыков пользователя у обучаемых. Иногда приходится работать с учащимися, у которых по каким-то причинам нет достаточной компьютерной подготовки, или же они вообще никогда не общались с компьютером. Сложность и дороговизна разработки программного обеспечения. Существует проблема распознания ответов произвольной формы в открытых текстовых заданиях.

Одним из наиболее актуальных направлений развития компьютерных технологий в образовании является разработка специализированных систем проверки знаний учащихся. Их активное использование помогает поддерживать нужный образовательный уровень учащихся, предоставляет преподавателю возможность уделять больше внимания индивидуальной работе с учащимися.

3. Формирование оценочной шкалы тестового контроля

При создании тестов возникают определенные трудности в части формирования шкалы оценок правильности выполнения заданий учащимися.

Оценка знаний - один из существенных показателей, определяющих степень усвоения учащимися учебного материала, развития мышления, самостоятельности. Оценка должна побуждать учащегося к повышению качества учебной деятельности.

Очевидно, что при формировании шкалы оценок велика доля субъективизма, поскольку здесь многое будет зависеть от опыта, интуиции, компетентности, профессионализма учителя.

На сегодня еще часто встречается метод "проб и ошибок" при формировании шкалы оценок. Поэтому реальные знания учащегося не получают объективного отражения - как негативные последствия - снижается стимулирующее воздействие экзаменационной оценки на познавательную деятельность учащегося, на качество учебного процесса в целом.

4. Требования, предъявляемые к учителю при составлении тестовых заданий.

При составлении заданий теста следует соблюдать ряд правил, необходимых для создания надежного, сбалансированного инструмента оценки успешности овладения учащимися определенными учебными дисциплинами или их разделами. Так, необходимо проанализировать содержание заданий с позиции равной представленности в тесте разных учебных тем, понятий, действий и т.д. Тест не должен быть нагружен второстепенными терминами, несущественными деталями с акцентом на механическую память, которая может быть задействована, если в тест включать точные формулировки из учебника или фрагменты из него. Задания теста должны быть сформулированы четко, кратко и недвусмысленно, чтобы все учащиеся понимали смысл того, что у них спрашивается. Важно проследить, чтобы ни одно задание теста не могло служить подсказкой для ответа на другое.

Варианты ответов на каждое задание должны подбираться таким образом, чтобы исключались возможности простой догадки или отбрасывания заведомо неподходящего ответа.

Важно выбирать наиболее приемлемую форму ответов на задания. Учитывая, что задаваемый вопрос должен быть сформулирован коротко, желательно также кратко и однозначно формулировать ответы. Например, удобна альтернативная форма ответов, когда учащийся должен подчеркнуть одно из перечисленных решений.

Задачи для тестов должны быть информативными, отрабатывать одно или несколько понятий формулы, определения и т.д. При этом тестовые задачи не могут быть слишком громоздкими или слишком простыми. Это не задачи для устного счета. Вариантов ответов на задачу должно быть, по возможности, не менее пяти. В качестве неверных ответов желательно использовать наиболее типичные ошибки.

5. Достоинства и недостатки тестирования.

Одним из недостатков тестового метода контроля знаний учащихся является то, что создание тестов, их унификация и анализ - это большая кропотливая работа.

Возможно возникновение и других трудностей. Довольно часто встречается значительный субъективизм в формировании содержания самих тестов, в отборе и формулировке тестовых вопросов, многое также зависит от конкретной тестовой системы, от того, сколько времени отводится на контроль знаний, от структуры включенных в тестовое задание вопросов и т.д.

Но, несмотря на указанные недостатки тестирования как метода педагогического контроля, его положительные качества во многом говорят о целесообразности использования такой технологии в учебных заведениях.

К достоинствам следует отнести следующее:

    большая объективность и, как следствие, большее позитивное стимулирующее воздействие на познавательную деятельность учащегося;

    исключается воздействие негативного влияния на результаты тестирования таких факторов как настроение, уровень квалификации и др. характеристики конкретного учителя;

    ориентированность на современные технические средства, на использование в среде компьютерных (автоматизированных) обучающих систем;

    универсальность, охват всех стадий процесса обучения.

Отметим и другие достоинства. Тестированный опрос многофункционален. Он позволяет быстрее понять, как дальше работать с данным учащимся, а также помогает учителю скорректировать учебный курс.

В итоге следует заметить, что использование тестирования учащихся поможет объективно провести аттестацию школы, которая проводится с целью установления соответствия содержания, уровня и качества подготовки выпускников требованиям государственных образовательных стандартов.

Систематическое проведение контрольных мероприятий с помощью составленных на высшем уровне инструментов контроля позволяет формировать высококлассных специалистов в различных областях знаний, готовых применять накопленный багаж знаний в любую минуту.

Разработка качественного тестового инструментария - длительный, трудоемкий и дорогостоящий процесс. Стандартные наборы тестов для большинства дисциплин ещё не разработаны, а разработанные обычно имеют очень низкое качество. Данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов. Тест не позволяет проверять и оценивать высокие, продуктивные уровни знаний, связанные с творчеством, то есть вероятностные, абстрактные и методологические знания. Широта охвата тем в тестировании имеет и обратную сторону. Учащийся при тестировании, в отличие от устного или письменного экзамена, не имеет достаточно времени для сколько-нибудь глубокого анализа темы. Обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений. В тестировании присутствует элемент случайности. Например, учащийся, не ответивший на простой вопрос, может дать правильный ответ на более сложный. Причиной этого может быть, как случайная ошибка в первом вопросе, так и угадывание ответа во втором. Это искажает результаты теста и приводит к необходимости учета вероятностной составляющей при их анализе.

Введение............................................................................................................... 2

1. Педагогическое тестирование как метод контроля......................................... 4

2. Компьютерное тестирование в педагогике..................................................... 7

3. Интеллектуальное тестирование.................................................................... 12

Заключение......................................................................................................... 19

Список использованной литературы................................................................. 20


Введение

В последние годы в России в сфере образования наблюдается стремительное усиление интереса к автоматизации промежуточного и финального контроля результатов обучения учащихся самых различных учебных заведений, начиная от школ и заканчивая коммерческими курсами. Самым популярным видом такого контроля является тестирование, основанное на диалоге вычислительной системы с пользователем. Стремительный рост быстродействия компьютерных систем, уменьшение цен на вычислительную технику, появление качественных и мощных систем программирования увеличило потребность в системах, позволяющих объективно, быстро и надежно оценивать знания учащихся, предлагая интересные формы взаимодействия с ними.

Но вопрос создания таких систем является не однозначным, и авторы существующих разработок иногда отходят от педагогической и психологической стороны вопроса, пытаясь максимально увеличить привлекательность своих программных продуктов за счет средств мультимедиа. Иногда программисты просто игнорируют процесс взаимодействия с непосредственно носителями знаний (преподавателями), что отражается на существующих приложениях. Очень часто сами преподаватели не владеют в должной мере методами оценки качества создаваемых тестов (будем говорить о тестировании).

Необходимо отметить, что первые концепции компьютеризации обучения возникли более 30 лет назад под лозунгом «техническое перевооружение педагога, механизация его труда», «обучающей машины», имитирующей процесс индивидуальной работы преподавателя с обучаемым . Со временем росло понимание их ограниченности.

Дело в том, что применение традиционных методов компьютерного обучения и контроля (прямое тестирование, балльная система, и т.д.) неприемлемо: для того, чтобы оценить знания обучаемого, преподавателю приходится переработать огромное количество информации, и процесс взаимодействия оценивающего и оцениваемого не поддается строгой формализации, поэтому три основные алгоритмические структуры (последовательная, ветвление, цикл) при реализации машинных систем не смогут описать в полной мере данную предметную область. Т.е. осуществление автоматизированного контроля знаний, умений обучаемых, в первую очередь, включает решение проблемы определения совокупности требуемых качеств знаний, без которых критерии оценки знаний и способы определения уровня их усвоения выявить нельзя.

Цель реферата: показать некоторые существующие методы и модели педагогического тестирования, описать и оценить качество существующих систем тестирования и контроля, выдвинуть собственные идеи.

1. Педагогическое тестирование как метод контроля.

Основная цель контроля знаний и умений состоит в обнаружении достижений, успехов учащихся, в указании путей совершенствования, углубления знаний, умений, с тем, чтобы создавались условия для последующего включения учащихся в активную творческую деятельность. Эта цель в первую очередь связана с определением качества усвоения учащимися учебного материала – уровня овладения знаниями, умениями и навыками, предусмотренных программой. Во – вторых, конкретизация основной цели контроля связана с обучением приемам взаимоконтроля и самоконтроля, формированием потребности в самоконтроле и взаимоконтроле.

В - третьих эта цель предполагает воспитание у учащихся таких качеств личности, как ответственность за выполненную работу, проявление инициативы.

Если перечисленные цели контроля знаний и умений учащихся реализовать, то можно говорить о том, что тестирование выполняет следующие функции: контролирующую, обучающую (образовательную), диагностическую, прогностическую, развивающую, ориентирующую, воспитывающую . Рассмотрим эти функции более подробно.

Контролирующая функция состоит в выявлении состояния знаний и умений учащихся, уровня их умственного развития, в изучении степени усвоения приемов познавательной деятельности, навыков рационального учебного труда.

При помощи тестирования определяется исходный уровень для дальнейшего овладения знаниями, умениями и навыками, изучается глубина и объем их усвоения. Сравнивается планируемое с действительными результатами, устанавливается эффективность используемых преподавателем методов, форм и средств обучения.

Обучающая функция тестирования заключается в совершенствовании знаний и умений, их систематизации. В процессе проверки учащиеся повторяют и закрепляют изученный материал. Они не только воспроизводят ранее изученное, но и применяют знания и умения в новой ситуации. Проверка помогает выделить главное, основное в изучаемом материале, сделать проверяемые знания и умения более ясными и точными. Тестирование способствует также обобщению и систематизации знаний.

Сущность диагностической функции тестирования – в получении информации об ошибках, недочетах и пробелах в знаниях и умениях учащихся и порождающих их причинах затруднений учащихся в овладении учебным материалом, о числе, характере ошибок. Результаты диагностических проверок помогают выбрать наиболее интенсивную методику обучения, а также уточнить направление дальнейшего совершенствования содержания методов и средств обучения.

Прогностическая функция тестирования служит получению опережающей информации об учебно-воспитательном процессе. В результате проверки получают основания для прогноза о ходе определенного отрезка учебного процесса: достаточно ли сформированы конкретные знания, умения и навыки для усвоения последующей порции учебного материала (раздела, темы).

Результаты прогноза используют для создания модели дальнейшего поведения учащегося, допускающего сегодня ошибки данного типа или имеющего определенные пробелы в системе приемов познавательной деятельности.

Прогноз помогает получить верные выводы для дальнейшего планирования и осуществления учебного процесса.

Развивающая функция тестирования состоит в стимулировании познавательной активности учащихся, в развитии их творческих способностей. Тестирование обладает исключительными возможностями в развитии учащихся. В процессе тестирования развиваются речь, память, внимание, воображение, воля и мышление школьников. Тестирование оказывает большое влияние на развитие и проявление таких качеств личности, как способности, склонности, интересы, потребности.

Сущность ориентирующей функции тестирования - в получении информации о степени достижения цели обучения отдельным учеником и группой в целом – насколько усвоен и как глубоко изучен учебный материал. Тестирование ориентирует учащихся в их затруднениях и достижениях.

Вскрывая пробелы, ошибки и недочеты учащихся, тестирование указывает им направления приложения сил по совершенствованию знаний и умений, помогает учащемуся лучше узнать самого себя, оценить свои знания и возможности.

Воспитывающая функция тестирования состоит в воспитании у учащихся ответственного отношения к учению, дисциплины, аккуратности, честности. Проверка побуждает более серьезно и регулярно контролировать себя при выполнении заданий. Она является условием воспитания твердой воли, настойчивости, привычки к регулярному труду .

Выделение функции педагогического тестирования как формы контроля подчеркивает его роль и значение в процессе обучения. В учебном процессе сами функции проявляются в разной степени и различных сочетаниях. Реализация выделенных функций на практике делает контроль более эффективным, а также эффективней становится и сам учебный процесс.

Итак, педагогическое тестирование как форма контроля знаний является неотъемлемой частью учебного процесса.

Компьютерное тестирование в педагогике

Идея компьютерного тестирования напрямую проистекает от идеи программированного контроля знаний. Программированный контроль знаний, в свою очередь, явился неизбежной реакцией на некоторые проблемы прежде всего высшего образования в России. Собственно, примерно те же проблемы распространяются и на школьное образование, но последнее, в силу традиционной косности, очень слабо восприимчиво к новым технологиям.

Основной проблемой любого образования (не только российского), является отсутствие четкого контроля за качеством усвоения материала. Причем если в школьной практике учитель еще более-менее имеет возможность с определенной периодичностью проверять уровень текущих знаний ученика, то в ВУЗе преподаватель целый семестр выдает материал и лишь в конце семестра убеждается в уровне его усвоения. Само собой, в системе высшего образования подразумевается, что студенты должны в достаточной степени заниматься и самостоятельным образованием, однако, это предполагаемое самостоятельное получение знаний остается целиком и полностью на совести студента, и преподаватель абсолютно не может знать, кто именно из студентов хоть что-то делает самостоятельно. С получением большим числом обучаемых доступа в Internet положение усугубилось еще и тем, что теперь даже сдача рефератов не подразумевает абсолютно никакой работы с информацией; частенько студенты даже не считают нужным целиком прочесть то, что распечатывают из Сети .

Необходимость систематического контроля за усвоением материала сомнений не вызывает. Прежде всего это давало бы экономию времени преподавателя, который при отсутствии обратной связи вынужден или повторять положения, которые студентами давно усвоены, или излагать положения, основанные на фактах, плохо усвоенных студентами. Во вторую очередь, систематический контроль за уровнем знаний учащихся стимулирует повышение качества обучения за счет усиления акцента на трудных для усвоения положениях и повышения ответственности обучаемых за результаты самостоятельной работы (в случае, естественно, когда преподаватель в этом заинтересован).

Важным моментом систематического программированного контроля знаний является его объективность, что обусловлено переносом акцента с карательной функции на информативную. Только в таком случае учащийся не будет бояться контроля и изобретать способы получения повышенной оценки, и только в таком случае преподаватель будет получать реальную картину знаний учащегося.

Технически программированный контроль знаний прост - учащимся выдается некий бумажный носитель (расцвет программированного контроля вызвал к жизни релейно-ламповых "электронных" монстров, которые по сей день можно видеть на экзаменах по сдаче на водительские права), на котором записаны вопросы и варианты ответов, один (или несколько) из которых являются правильными. Учащемуся остается лишь расставить крестики против правильных ответов.

Подобная технология позволила совершить качественный скачок в осуществлении обратной связи между преподавателем и студентом. Программированный контроль, состоящий из 8-10 вопросов, проводится за очень короткий срок - от 5 до 10 минут, и при этом преподаватель может получить полноценную информацию об усвоении пройденного материала всей учебной группой одновременно. Кроме того, техническая реализация программированного контроля позволила полностью избежать списывания, давая возможность предложить каждому учащемуся свой вариант программированной карты.

Недостатком программированного контроля в его до-компьютерном виде являлась высокая трудоемкость создания программированных карт, которые (в идеале) требовались на каждое занятие, и сложность их последующей обработки. С появлением компьютерных технологий у преподавателей появилась возможность резко снизить трудоемкость и подготовки контроля, и обработки результатов.

Выделяют пять общих требований к тестам:

· валидность;

· определенность (общепонятность);

· простота;

· однозначность;

· надежность.

Валидность теста – это адекватность. Различают содержательную и функциональную валидность: первая – это соответствие теста содержанию контролируемого учебного материала, вторая – соответствие теста оцениваемому уровню деятельности .

Выполнение требования определенности (общедоступности) теста необходимо не только для понимания каждым учеником того, что он должен выполнить, но и для исключения правильных ответов, отличающихся от эталона.

Требование простоты теста означает, что тест должен иметь одно задание одного уровня, т.е. не должен быть комплексным и состоять из нескольких заданий разного уровня. Необходимо отличать понятие “комплексный тест” от понятия “трудный тест”. Трудность теста принято характеризовать числом операций P, которое надо выполнить в тесте: P < 3 – первая группа трудности; P = 3-10 – вторая группа трудности. Не следует также смешивать понятия простоты-комплексности и легкости-трудности с понятием сложности.

Однозначность определяют как одинаковость оценки качества выполнения теста разными экспертами. Для выполнения этого требования тест должен иметь эталон. Для измерения степени правильности используют коэффициент K a = P 1 / P 2 , где P 1 – количество правильно выполненных существенных операций в тесте или батарее тестов; P 1 – общее количество существенных операций в тесте или батарее тестов. Существенными считают те операции в тесте, которые выполняются на проверяемом уровне усвоения. Операции, принадлежащие к более низкому уровню в число существенных не входят. При K a ³ 0.7 считают, что деятельность на данном уровне усвоена.

Понятие надежности тестирования определяют как вероятность правильного измерения величины K a . Количественный показатель надежности r Î . Требование надежности заключается в обеспечении устойчивости результатов многократного тестирования одного и того же испытуемого. Надежность теста или батареи тестов растет с увеличением количества существенных операций P .

Итак, при реализации систем компьютерного тестирования необходимо, на мой взгляд, придерживаться именно этих пяти требований к создаваемым тестам. Но проблема компьютерного тестирования стоит намного острее. Реализация в системах тестирования описанных выше пяти требования к тестам не означает того, что созданный комплекс будет отвечать всем требованиям преподавателя и учащегося.

Большинство программных продуктов не дают возможности преподавателю и студенту, учителю и ученику отойти в реальном учебном процессе от традиционных методик: лекционного курса, конспекта, очного контроля знаний, контрольных работ, зачетов, экзаменов. Недостаток этот можно определить следующим: компьютерный курс является авторским по определению, и поэтому обеспечивает высокое качество образования только при соответствующем сопровождении автором (который, в большинстве случаев, не обладает достаточными знаниями в области информационных технологий). Хотя отдельные компоненты компьютерного обучающего, контролирующего или обучающе-контролирующего курса могут использоваться как независимые учебные модули другими преподавателями (а также и при самостоятельном освоении темы), максимальный эффект, скорее всего, может быть достигнут только во взаимодействии с автором- разработчиком курса.

Если же в образовательный процесс, основанный на авторском мультимедиа курсе, включается другой преподаватель, возникает опасность конфликта личностей, так как на едином образовательном поле сталкиваются не только различные способы методической организации учебного процесса, но и разные личностные подходы.

Что касается проверки качества знаний, неформальный характер процесса оценивания знаний требует применения трудно поддающихся обработке преподавателем компьютерных тестов, необходима активная обратная связь, помогающая оценить правильность усвоения материала, должна быть четко выражена определенность и результативность .

Именно неформальность знаний как таковых, и процесса проверки знаний в частности, породило множество проблем в области компьютерного тестирования, таких как необъективность оценивания, трудность понимания учащимися подготовленных вопросов, медленная работа компьютерных систем, и т.п.

Инженерия знаний и методы теории искусственного интеллекта помогут создать систему контроля знаний, позволяющую строить модели знаний преподавателя и тестируемого и объективно оценивать знания и умения последнего.

3. Интеллектуальное тестирование

В понятие «искусственный интеллект» вкладывается различный смысл - от признания интеллекта у ЭВМ, решающих логические или даже любые вычислительные задачи, до отнесения к интеллектуальным лишь тех систем, которые решают весь комплекс задач, осуществляемых человеком, или еще более широкую их совокупность. Можно выделить две основные линии работ по искусственному интеллекту (ИИ). Первая связана с совершенствованием самих машин, с повышением "интеллектуальности" ис­кусственных систем. Вторая связана с задачей оптимизации совместной работы "искусственного интеллекта" и собственно интеллектуальных возможностей человека.

Идея создания мыслящих машин "человеческого типа", которые, каза­лось бы, думают, двигаются, слышат, говорят, и вообще ведут себя как живые люди, уходит корнями в глубокое прошлое. Еще древние египтяне и римляне испытывали благоговейный ужас перед культовыми статуями, кото­рые жестикулировали и изрекали пророчества (разумеется, не без помощи жрецов). В средние века и даже позднее ходили слухи о том, что у кого-то из мудрецов есть гомункулы (маленькие искусственные человечки) - настоящие живые, спо­собные чувствовать существа . В настоящее время роботы, системы распознавания образов, экспертные системы и т.д. вызывают у непосвященного тот же трепет и восторг перед «думающей» машиной.

Но не зря в свое время были заморожены некоторые исследования в области ИИ. Попытки создать машинный разум не удавались, и раз за разом энтузиазм ученых угасал, так как существующие на тот момент вычислительные средства не позволяли хотя бы приблизительно воссоздать взаимодействие нейронов головного мозга. Появление многопроцессорных систем и увеличение количества команд микропроцессоров и его тактовой частоты позволяет сейчас, на мой взгляд, «построить» приближенное мышление человека с использованием параллельных процессов и нейронных сетей.

Обращаясь к проблеме роли ИИ в обучении и образовании, будем рассматри­вает этот процесс как одну из разновидностей взаимодействия человека с ЭВМ, и раскрывать среди перспективных возможностей те, которые направлены на создание так называемых адаптивных обучающихся систем, имити­рующих оперативный диалог учащегося и преподавателя-человека.

Интеллектуальное тестирование предполагает наличие модели знаний, модели самого процесса тестирования и оценивания. Так можно охарактеризовать в общем все разработки в этой области. Рассмотрим некоторые из них более подробно.

Традиционная Российская система оценивания знаний обучаемых основана на лингвистических оценках, по которым устанавливается стипендия, производится учет успеваемости, проставляются записи в зачетных книжках за период обучения и др.

Вместе с тем, такая новая образовательная процедура как образовательное тестирование по альтернативному признаку предполагает оценивание уровня знаний в диапазоне от нуля до ста, что порождает проблему распознавания лингвистического образа знаний по результатам такого образовательного тестирования.

Под образом уровня знаний понимаются обучаемые, принадлежащие к множеству (группе), знания которых по “эталону уровня знаний” отнесены к лингвистическим оценкам неудовлетворительно (D), удовлетворительно (C), хорошо (B), отлично (A).

Под распознаванием образа уровня знаний понимается процедура принятия решения о принадлежности конкретного обучаемого к одному из указанных образов на основании сравнения его образовательных достижений при тестировании с характеристиками образа.

В каждом курсе есть ключевые моменты, особенно важные темы, без знания которых невозможно усвоение более сложного материала в процессе учебы или которые будут необходимы в работе по специальности. На устном экзамене при личном контакте со студентом преподаватель обязательно оценивает понимание студентом этих тем. При автоматизированном тестировании можно учесть важность каких-либо разделов курса, увеличив долю вопросов по этим разделам в общем количестве вопросов. Но это не всегда удобно для составителя теста, потому что не всегда наиболее важные разделы содержат больше всего материала.

Теория образовательного тестирования должна формироваться на частных законах и закономерностях таких научных направлений как информациология, общая статистика, статистический приемочный контроль, квалиметрия, педагогика, психология, исследование операций, теория принятия решений и др. Прямое применение теоретических разработок из указанных научных направлений не дает заметных практических результатов по оцениванию знаний по причине нематериальности знаний, как объекта исследований. Задачу формирования теории образовательного тестирования можно сформулировать как задачу поиска оптимальной структуры специфических законов и закономерностей тестологии, позволяющую оценить знания с заданной погрешностью.

Для решения задач подобного класса наиболее успешно используются генетические методы, основанные на реализации генетических алгоритмов, позволяющих осуществить направленный перебор частных законов и закономерностей по наиболее приемлемым направлениям для формирования отечественной теории образовательного тестирования.

В отличие от традиционного случайного поиска приемлемых решений, алгоритмы генетического поиска используют аналоги или близость имеющихся решений во многих областях знаний к поиску оптимального набора специфических законов, обеспечивающих объективность, достоверность и точность оценивания уровня знаний, воспроизведенных обучаемыми в процедурах тестирования. Такой направленный перебор частных законов является эволюционным и имеет очень много сходств с операторами, применяемыми в генетических алгоритмах и процедурах, происходящих с живыми организмами в природе.

Основные свойства образовательных тестов предлагается формировать на популяциях частных законов таких научных отраслей как: информациология; психология, педагогика и психодиагностика; логика; теория вероятностей; теория поиска; теория нечетких множеств; теория игр; теория статистических решений; приемочный выборочный контроль.

В данных исследованиях изучаются возможности так называемой «абсолютной временной шкалы оценивания знаний». Формулируются ее принципы. Формулируются этапы последовательного перехода от традиционной формы экзаменов к тестовой форме этого подхода, на их основе – требования к созданию тестовых материалов этого подхода.

Анализируется опыт использования данного подхода на вступительных экзаменах в Тверском государственном университете на протяжении 4-х лет.

Изучается диагностический потенциал данного подхода. Формулируется принцип «трехуровнего абстрагирования» для диагностических тестирований.

Методика основывается на том, что учебный процесс является частным случаем технологического процесса и ему должны быть свойственны такие же методы анализа, какие приняты для производственных процессов. Однако слепо перенести подобные методики нельзя, особенно это касается содержательного анализа процесса.

Для того чтобы проанализировать учебный процесс нужно иметь, во-первых, критерий качества обучения, а, во-вторых, проследить его изменение во времени. В качестве наиболее информативного критерия качества обучения следует использовать степень обученности учащихся - СОУ. Этот критерий основан на статистике полученных учащимися оценок за выполнение отдельных заданий или контрольных работ. Оценки входят в СОУ с «весом» равным интегралу вероятности получения данной оценки для некоторого «типового» распределения оценок.

Процедура тестирования предполагает анализ ответов на последовательность тестовых заданий определенной сложности. Если ответ правильный, то предполагается, что уровень подготовки студента выше сложности предъявленной задачи и он способен решать задачи заданной сложности, в противном случае - неспособен. Это подобно оценке градиента некоторой гипотетической функции регрессии, в которой градиент сам является случайной величиной.

Предлагается использовать следующий подход. Считаем, что если тестируемый решил задание, то у него появляется желание решить более сложное задание. Если нет - то им будет сделана еще одна попытка решения задания той же сложности. Если оно также не решено, то предъявляется задача пониженной сложности. Если сразу не решено менее сложное задание, то к решению предлагается задача меньшей сложности. Аналогично происходит процесс повышения сложности заданий. В результате, если исключить этап обучения при решении задач, студент выберет для себя определенный уровень сложности, вокруг которого и будет размываться сложность заданий.

Таким образом, функция «уровня знаний» является преобразованием функции «сложности» задачи через «способность решения задач» определенной «сложности». В этом высказывании термины «уровень знаний», «способность решения задач» и «сложности» носят нечеткий характер. Поэтому для формализации этих понятий целесообразно использование аппарата нечетких множеств. Кроме того, в указанной постановке заметна разница между «сложностью» и «способностью решения задач».

Понятия «сложность» и «уровень знаний» - это некоторые нечеткие переменные (только переменные, хотя они и задаются функцией), в то время как «способность решения задач» является нечетким отношением нечетких переменных «сложности» и «уровня знаний». Количество баллов также является переменной, однако эта переменная может не анализироваться, поскольку является преобразованием «уровня знаний».

Прямым тестированием будем называть способ контроля знаний обучаемого, при котором структура теста (т.е. набор и порядок предъявления тестовых заданий) не зависит от фактических ответов обучаемого. Практически все существующие в настоящее время тесты функционируют в режиме прямого тестирования, однако чаще всего они реализуют лишь простейшие и далеко не самые эффективные методики оценивания знаний.

Детальный анализ педагогических приемов и способов “живого” диалогового общения преподавателя и тестируемого показал, что можно выделить по крайней мере пять параметров, значения которых влияют на организацию процесса контроля и оценивания знаний.

Цель тестирования определяется основным вопросом, ответ на который должен быть получен в результате тестирования - а) обладает ли обучаемый равномерным уровнем знаний по всему материалу (проверка широты знаний) или б) обладает ли обучаемый систематическими знаниями по темам предъявляемых ему тестовых заданий (проверка глубины знаний).

Вид тестирования имеет два значения - зачетное или экзаменационное. Результаты зачетного тестирования представляются в двоичном формате: “зачет” или “незачет”. В ходе зачетного тестирования оценка “зачет” выставляется в случае, если обучаемый демонстрирует знания, превышающие некоторое априори заданное пороговое значение.

При экзаменационном тестировании по сумме баллов, набранной обучаемым при выполнении теста, рассчитывается итоговая оценка знаний обучаемого (имеющая в общем случае более двух допустимых значений), для чего сумма баллов проецируется на применяемую оценочную шкалу.

Сложность теста характеризуется уровнем знаний, которые должен продемонстрировать обучаемый при его выполнении. Она определяется степенью сложности тестовых заданий, которые могут предъявляться обучаемому. Исследования позволяют говорить о как минимум трех уровнях сложности тестов – стандартной, повышенной и пониженной.

Уровень контроля определяет степень строгости проверки глубины знаний. Изучение методик проведения зачетных и экзаменационных опросов показывает, что можно говорить о четырех различных уровнях строгости оценивания ответов на тестовые задания (строгий контроль; выявление наиболее важных знаний; выявление простейших знаний; выявление любых имеющихся знаний) .

И, наконец, отслеживание условия раннего прекращения тестирования предполагает досрочное завершение теста в ситуации, когда продолжение тестирования становится нецелесообразным. В качестве первого из этих условий рассматривается превышение предельной длительности тестирования. Второе условие – прекращение тестирования и выставление неудовлетворительной оценки при получении априори заданного количества неправильных ответов.

Разнообразие возможных сочетаний значений пяти предложенных характеристик позволяет говорить о существовании весьма обширного семейства алгоритмов прямого тестирования знаний (например, экзаменационного оценивания глубины знаний с повышенной сложностью и строгим контролем, либо зачетного оценивания широты знаний со стандартной сложностью и контролем предельной длительности тестирования и т.п.).

Заключение

Начавшееся в нашей стране с начала 80-х годов внедрение в учебных заведениях новых информационных технологий – обучение при помощи педагогических программных средств, а также использование тестирующих программ – дало более чем скромные результаты. Среди многих известных причин этого (финансовые, технические, организационные, методические трудности) отметим одну: психологическое неприятие учителями “компьютерных” методов обучения и контроля знаний, особенно высококвалифицированными, творчески работающими. У них для этого есть основания: налицо большое количество плохих программ, не отвечающих главным психолого-педагогическим принципам обучения, неудачно реализующих основные этапы процесса усвоения знаний; как правило, отсутствует методическое сопровождение; оказываются непомерно большими затраты времени и сил на освоение компьютеров, изучение программы, поддержку соответствующей инфраструктуры; при использовании даже хороших систем нивелируется роль учителя в учебно-воспитательном процессе, исчезает творческий характер его труда; отсутствует система поощрения педагогов-новаторов, осваивающих новые информационные технологии.

Эту ситуацию можно и нужно изменить. Технический прогресс стремительно продвинулся вперед, современная вычислительная техника и системы телекоммуникаций достигли огромных результатов за последние несколько лет в плане быстродействия, объемов обрабатываемой и хранимой информации. Развитие систем проектирования программ (объектно-ориентированные системы визуального программирования, СУБД, системы моделирования нейронных сетей, и т.п.) дало в руки инженеров и системных аналитиков мощнейшие средства разработки и внедрения в жизнь самых фантастических проектов.

Список использованной литературы

1. Аванесов B.C. Композиция тестовых заданий. Учебная книга для преподавателей вузов, учителей школ, аспирантов и студентов пед.вузов. 2 изд., испр.. и доп. М.: Адепт. – 2002.

2. Ваньков Е.А. «Технологии компьютерного тестирования» // Компьютера, 2002. - № 3.

3. Границкая А.С. Научить думать и действовать: Адаптивная система обучения в школе: Кн. для учителя. М.: Просвещение. – 2001 .

4. Казаринов А.С., Култышева А.Ю., Мирошниченко А.А. Технология адаптивной валидности тестовых заданий: Учебное пособие. Глазов: ГГПИ, 1999.

5. Кальней В.А., Шишов С.Е. Технология мониторинга качества обучения в системе “учитель-ученик”: Методическое пособие для учителя. М.: Педагогическое общество России, 1999.

6. Касьянова Н. В. «Cоздание системы компьютерного контроля как результат новых информационных технологий в обучении», Восточноукраинский Национальный Университет (ВНУ), Украина, г.Луганск // материалы конференции ИТО-2001.

7. Майоров А.Н. Тесты: конструирование, проведение, использование. Издание второе - СПб.: Образование и культура, 1997.

8. Моисеев В.Б., Усманов В.В., Таранцева К.Р., Пятирублевый Л.Г. «Оценивание результатов тестирования на основе экспертно-аналитических методов». Журнал «Открытое образование», №3, 2001, с.32-36.

9. Рудинский И.Д. «Метод адаптивного автоматизированного контроля знаний». Сборник материалов конференции, 2001.

10. Челышкова М.Б. Разработка педагогических тестов на основе современных математических моделей: Уч.пособие. М.: Исследовательский центр проблем качества подготовки специалистов, 1995.

Ваньков Е.А. «Технологии компьютерного тестирования» // Компьютера, 2002. - № 3

Аванесов B.C. Композиция тестовых заданий. Учебная книга для преподавателей вузов, учителей школ, аспирантов и студентов пед.вузов. 2 изд., испр.. и доп. М.: Адепт. – 2002

3 Границкая А.С. Научить думать и действовать: Адаптивная система обучения в школе: Кн. для учителя. М.: Просвещение. – 2001

Касьянова Н. В. «Cоздание системы компьютерного контроля как результат новых информационных технологий в обучении», Восточноукраинский Национальный Университет (ВНУ), Украина, г.Луганск // материалы конференции ИТО-2001

Казаринов А.С., Култышева А.Ю., Мирошниченко А.А. Технология адаптивной валидности тестовых заданий: Учебное пособие. Глазов: ГГПИ, 1999

Челышкова М.Б. Разработка педагогических тестов на основе современных математических моделей: Уч.пособие. М.: Исследовательский центр проблем качества подготовки специалистов, 1995

Моисеев В.Б., Усманов В.В., Таранцева К.Р., Пятирублевый Л.Г. «Оценивание результатов тестирования на основе экспертно-аналитических методов». Журнал «Открытое образование», №3, 2001, с.32-36

Майоров А.Н. Тесты: конструирование, проведение, использование. Издание второе - СПб.: Образование и культура, 1997

Рудинский И.Д. «Метод адаптивного автоматизированного контроля знаний». Сборник материалов конференции, 2001

Кальней В.А., Шишов С.Е. Технология мониторинга качества обучения в системе “учитель-ученик”: Методическое пособие для учителя. М.: Педагогическое общество России, 1999

2.1. Тест (от англ. test -- испытание, проверка) -- стандартизованные, краткие, ограниченные во времени испытания, предназначенные для установления количественных и качественных индивидуальных различий.

По мере использования тестов была сформирована их классификация по цели и содержанию:

* тесты личности -- для оценки эмоционально-волевых качеств индивидуума;

* тесты интеллекта -- для анализа уровня развития познавательных процессов и функций мышления;

* тесты способностей -- для оценки возможности в овладении различной деятельностью;

* тесты достижений, с помощью которых оценивают развитие знаний, умений, навыков после обучения.

Из всего многообразия типов стандартизованных тестов в образовании используют тесты достижений. Они создавались для проверки результатов обучения на разных ступенях получения образования, измерения эффективности программ и процесса обучения. Тесты достижений принято противопоставлять тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях.

* По процедуре создания могут быть выделены стандартизированные и не стандартизированные тесты.

Стандартизация -- последовательный ряд процедур по планированию, проведению оценивания и выставлению баллов. Цель стандартизации состоит в том, чтобы обеспечить всем учащимся возможность проходить оценивание в равных условиях, чтобы их оценки имели одинаковое значение и не подвергались влиянию различных условий. Это важная процедура, когда оценки планируется использовать для сравнения отдельных людей или групп.

В образовании можно выделить и ряд задач, которые могут быть решены не стандартизированными тестами, -- в том числе текущий контроль знаний на этапе обучения. Однако для итоговой аттестации учащихся используются только стандартизованные тесты.

По способу предъявления различают тесты:

бланковые (машиночитаемые бланки, тестовые тетради);

предметные (манипуляция материальными объектами рассчитана на быстроту реакции и четкость действий);

аппаратурные (с использованием специальной аппаратуры -- датчиков для фиксации сигналов);

практические (аналоги лабораторных работ, но с тестовыми условиями заданий);

компьютерные (как частный случай -- адаптивные).

По характеру действий тесты делят на:

вербальные;

невербальные.

По ведущей ориентации выделяют:

тесты на скорость;

тесты на результативность (мощность);

смешанные тесты.

По степени однородности задач тесты делят на:

гомогенные, позволяющие измерить одно качество (уровень подготовки по одному предмету) однородными по составу заданиями;

гетерогенные (многомерные) -- для измерения уровня подготовленности учащихся по нескольким учебным предметам и (или) свойствам личности.

Гетерогенные тесты бывают полидисциплинарными и междисциплинарными. Полидисциплинарные тесты состоят из гомогенныхсубтестов по отдельным дисциплинам. Результаты учеников по субтестам объединяются для подсчета итоговых баллов по всему полидисциплинарному тесту. Для выполнения заданий междисциплинарных тестов требуется применение обобщенных, межпредметных, интегративных знаний и умений. Междисциплинарные тесты всегда многомерны, их разработка требует обращения к факторным методам анализа данных, математико-статистическим методам многомерного шкалирования и т. д.

По целям использования в системе образования:

определяющий (знания или поведение обучаемого в начале обучения).

Для отечественной системы образования наиболее приемлемый и используемый педагогами термин -- «тестирование во входном контроле». При входном контроле с помощью педагогических тестов можно ответить на вопрос -- насколько обучаемые владеют базовыми знаниями, умениями и навыками, чтобы успешно освоить новый материал, а также определить степень владения новым материалом до начала его изучения.

Учащиеся в классе имеют разную подготовку, различные способности и раз-личаются по мотивирующему фактору. В этой ситуации реализовать в большей мере личностно ориентированное обучение возможно при следующем подходе. Сначала следует провести входное тестирование, которое позволит разделить учащихся на две подгруппы. В первую попадают сильные учащиеся; при анализе выполнения ими входного теста прежде всего важна не степень их готовности к изучению нового материала, а оценка степени владения новым материалом, которая поможет учителю организовать его изучение на приемлемом уровне. Для второй группы учащихся на начальном этапе важно определить, каких базовых компонентов знаний им не хватает для успешного продолжения учения, и принять меры по устранению выявленных пробелов еще на первоначальном этапе. В этом случае учитель может подобрать такой метод обучения, который был бы наиболее эффективным для всей группы и позволил бы получить высокие результаты по окончании обучения. Сравнение же начального и конечного состояния обучаемых позволяет оценить прирост знаний; тогда во входном тестировании используется тестовый материал, незначительно отличающийся от материала для итогового контроля по изучаемой теме.

При первоначальном изучении материала учителю педстоит большая подготовительная работа по разработке собтвенного проверочного материала или по адаптации уже существующего; в дальнейшем же используется уже готовый материал и необходимы только незначительные его корректировки. Входное тестирование бесполезно, когда:

учитель хорошо знает возможности обучаемых, поскольку давно работает с классом;

область планируемых к усвоению знаний достаточно новая, так что у учащихся не может быть никаких «заделов», либо трудно пока выделить качественный уровень усвоения.

Тесты для входного контроля, обычно называемые претестами (предварительными тестами), делятся на два типа. Претесты первого типа позволяют выявить готовность к усвоению новых знаний в классе. Они разрабатываются в рамках критериально-ориентированного подхода и содержат задания для проверки базовых знаний, умений и навыков, необходимых для усвоения нового материала, В основном эти претесты предназначены для наиболее слабых учеников, находящихся на границе между явно подготовленными и явно не подготовленными к началу усвоения нового материала. По результатам выполнения претеста проводится деление тестируемых на две группы, в одну из которых попадают те, кто может двигаться дальше, а в другую -- те, кто нуждается в дополнительной работе и консультациях педагога.

П р е т е с т ы второго типа разрабатываются в рамках нормативно-ориентированного подхода. Они охватывают планируемые результаты предстоящего обучения и построены полностью на новом материале. По результатам выполнения претеста преподаватель принимает решение, позволяющее внести элементы индивидуализации в массовый учебный процесс. Если ученик показал некоторые предварительные знания по новому материалу, то план его обуче-ния необходимо перестроить и начать с более высокого уровня, чтобы учебный материал имел для него действительный характер новизны. Иногда роль входного претеста выполняет итоговый тест, который предназначен для будущей оценки результатов усвоения нового материала после завершения его изучения.

26. Понятия, используемые в тестировании (предтестовое задание, тестовое задание, педагогический тест).

Предтестовое задание . Определение предтестового задания является базовым, содержащим специфические требования, с тем чтобы отличить его от традиционного контрольного задания. Предтестовое задание – это единица контрольного материала, содержание, логическая структура и форма представления которого удовлетворяют ряду требований и обеспечивают однозначность оценок результатов выполнения благодаря стандартизованным правилам проверки.

В предтестовых заданиях проверяются наиболее существенные опорные элементы содержания дисциплины. В каждом предтестовом задании определяется то, что однозначно считается правильным ответом с запланированной степенью его полноты.

Требования, предъявляемые к форме пред тестовых заданий, можно условно разделить на специальные, отражающие специфику формы, и общие, инвариантные относительно выбранной формы. Согласно, общим требованиям задание должно иметь определенный порядковый номера стандартную инструкций по выполнению, адекватную форме, эталон правильного ответа, стандартизованные правила по оценке результатов его выполнения и т. д..

Преимущества предтестовых заданий по сравнению с традиционными контрольными заданиями обеспечиваются предельной стандартизацией при предъявлении и оценивании результатов их выполнения, что в целом повышает объективность оценок учащихся по тесту.

Тестовое задание. Предтестовые задания должны пройти обязательную эмпирическую проверку, по результатам которой часть из них превращается в тестовые, а оставшаяся часть удаляется из первоначальной совокупности заданий теста.Предтестовое задание превращается втестовое, если количественные оценки его характеристик удовлетворяют определенным критериям, нацеленным на эмпирическую проверку качества содержания, формы и системообразующих свойств предтестовых заданий.

Обычно требуется не менее двух-трех апробаций, по результатам которых ведется коррекция содержания, формы, трудности задания, его валидности и статистических свойств, характеризующих качество его работы вместе с остальными заданиями теста. Исследование системообразующих характеристик тестового задания проводится на основе анализа дескриптивной (описательной) статистики, а также методов корреляционного, факторного и латентно-структурного анализа. Интерпретация результатов анализа – это всегда сложная аналитическая работа, результаты которой зависят от множества условий, в том числе и от вида создаваемого теста. В длительной апробации и коррекции нуждаются в основном итоговые тесты, используемые для принятия управленческих решений в образовании.

Педагогический тест . В отличие от первых двух определений, инвариантных относительно целей тестирования и решаемых задач, определение педагогического теста должно быть ориентировано на конкретный вид теста. В частности итоговый нормативно-ориентированный тест – это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обладающих такими характеристиками, которые обеспечивают высокую дифференциацию, точность и обоснованность оценок качества учебных достижений.

Из этого определения следуют два важных вывода. Первый: нет и не может быть тестов, качественных вообще, так как оценка дифференцирующего эффекта теста, точности измерений (надежности) и их адекватности поставленным целям (валидности) зависит не только от характеристик тестовых заданий, но и от особенностей тестируемого контингента учащихся. Второй: для оценки качества теста необходимы эмпирические данные тестирования, полученные на репрезентативной выборке учащихся. Работа по коррекции теста консолидирует систему тестовых задании – постепенно нарастают внутренняя связь и целостность, интегративностъ системы, совершается переход от совокупности предтестовых.заданий к профессионально разработанному тесту.

Итоговый критериально-ориентированный тест – это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обладающих такими характеристиками, которые обеспечивают валидную содержательную интерпретацию учебных достижений по отношению к установленным, статистически обоснованным критериям выполнения. В определении не конкретизируется базовая содержательная область, используемая при интерпретации, что позволяет применять его для различных разновидностей критериально-ориентированных тестов.

27. Классификация тестовых заданий.

Все задания разбиваются на две большие группы - задания в открытой форме и задания в закрытой форме. В основу классификации положено наличие или отсутствие ввода дополнительной информации испытуемым. Если дополнительная информация нужна, то это задание в открытой форме . Если не нужна, то это задание в закрытой форме .

Задания в открытой форме подразделяются на задания с дополнениеми в виде свободного изложения. В первом случае испытуемому необходимо дополнить содержание задания своей информацией. В результате задание должно превратиться в истинное логическое высказывание. Дополнение должно быть кратким - одно, в крайнем случае, два - три слова. При свободном изложении объем водимой информации может быть значительно больше.

В тестировании чаще всего используются задания в закрытой форме. Эти задания характерны тем, что содержат в себе и основу (вопрос, утверждение) и ответы (элементы ответов), из которых испытуемый должен выбрать или составить верный ответ.

В простейшем случае испытуемый просто указывает ответ, который ему кажется правильным - задания с выбором верного ответа. Об этих заданиях более подробно будет сказано далее.

В заданиях с выбором нескольких верных ответов, испытуемый должен указать все верные ответы. Процедура оценивания здесь сложнее, чем в предыдущем случае. Сумма баллов за такое задание может быть больше чем в заданиях с выбором одного верного ответа.

Задания с градуированными ответами содержат ответы, которые возможно все являются правильными в той или иной степени. Ответы имеют градацию по степени правильности. Задача составителя заключается в том, чтобы найти и применить признак, позволяющий осуществить такую градацию. Максимальное количество баллов испытуемый получает, если его градация ответов полностью совпадает с градацией эксперта, например, разработчика задания.

Задания на установление соответствия требуют от испытуемого найти соответствие между элементами двух множеств. Соответствие устанавливается на основании логических умозаключений или использовании смысловых ассоциаций.

В заданиях на установление правильной последовательности испытуемому необходимо не просто выбрать соответствующие элементы ответа, но и расположить их в нужной последовательности. Заданиями такого типа хорошо проверять знание алгоритмов действий, технологических приемов, логики рассуждений и т.п. С помощью этих заданий удобно проверять знание и понимание испытуемыми формулировок определений, понятий, терминов, путем конструирования их из отдельным слов, предложений, символов, графических элементов.

Особую актуальность в наше время приобретают вопросы, связанные с разработкой тестов педагогами-практиками.

Анализ психолого-педагогической литературы показывает, что существуют различные определения понятия «тест».

Так, например, в психологическом словаре тест определяется как «краткое, стандартизированное, обычно ограниченное во времени психологическое испытание, предназначенное для установления в сравниваемых величинах межиндивидуальных различий» . (Психологический словарь. /Под ред. В.В. Давыдова. – М., 1983. – С. 370).

В словаре под ред. А.В. Петровского, М.Г.Ярошевского даётся следующее определение: «тест (от англ. test – проверка) – система знаний, позволяющая измерить уровень определённого психического качества (свойства) личности». (Психология. Словарь. /Под ред. А.В. Петровского, М.Г. Ярошевского. – М., 1990. – С. 396).

В.Д.Шадриков определяет тест как стандартизированную психологическую методику, направленную на диагностику качеств, состояний и функциональных характеристик личности и их количественную оценку. (В.Д.Шадриков. Психодиагностика и психопрогностика // Профессиональная ориентация и обучение. Ярославль. 1988. - С. 3 - 9).

Понятие «тест» употребляется в узком и широком смысле слова.

В узком смысле под тестом подразумевается «краткое, строгостандартизированное испытание, которое позволяет количественно выразить результат и, следовательно, даёт возможность осуществить математическую обработку.» (С.А. Гуцанович, А.М. Радьков. Тестирование в обучении математике: диагностико-дидактические основы. – Могилёв, 1995. – С. 19 – 20). В широком же смысле понятие «тест» интерпретируется как «средство , так как с дидактических позиций понятие «средство» охватывает весь инструментарий, который является связующим звеном между целью и результатом психолого-педагогической деятельности и включает в себя такжеразличные методы, формы, приёмы». (С.А.Гуцанович, А.М.Радьков. Тестирование в обучении математике: диагностико-дидактические основы. – Могилёв, 1995. – С. 20).



Наряду с понятием «тест» встречается понятие «тестовое задание», которое может рассматриваться как наиболее простой и в то же время целостный структурный элемент определённого теста.

Следует рассматривать и понятие «тестирование» как определённую процедуру измерения свойств при помощи теста.

Средства, с помощью которых осуществляется тестовая проверка знаний, умений и навыков в обучении, обычно называют дидактическими тестами или тестами успешности, или тестами для измерения достижений.

Под такими тестами чаще всего подразумевают набор вопросов и заданий, из ответов, на которые получают информацию об уровне усвоения некоторого учебного материала.

Ошибкой многих учителей является отождествление с тестом определённых заданий, состоящих либо из заданий с выбором верных ответов, либо предусматривающих однозначные ответы, на которые поставлены вопросы.

Верно составленный тест должен иметь следующую примерную структуру:

некоторую совокупность заданий;

правила работы с тестами для испытуемых;

инструкцию экспериментатору;

теоретическое описание свойств, измеряемых тестом;

шкалу измерений свойств;

метод выведения оценки по шале.

С теоретическими и прикладными основами использования тестов в системе математического образования можно познакомиться в книге С.А. Гуцановича и А.М. Радькова «Тестирование в обучении математике: диагностико-дидактические основы».

Сегодня тестирование представляет собой целую отрасль. Тесты широко используются в системе образования.

Кратко рассмотрим их различные классификации.

Тесты различают по направленности: тесты достижений, тесты способностей, тесты личности, тесты креативности, тесты проективные, тесты критериально-ориентированные (см. приложение).

Средства, с помощью которых осуществляется тестовая проверка знаний, умений и навыков в обучении, обычно называют дидактическими тестами. Под такими тестами чаще всего подразумевают набор вопросов и заданий, из ответов, на которые получают информацию об уровне усвоения некоторого учебного материала (см. приложение).

В научно-педагогической литературе выделяются следующие признаки тестов: объективность, модельность, стандартизированность.

Объективность предполагает исключенность влияния случайных факторов, намеренных воздействий на тестируемого. Она достигается, главным образом, единством задания, единой инструкцией, единством принципов регистрации результатов тестирования.

Модельность означает, что испытание, с помощью тестов состоит из заданий, которые выражают какое-то комплексное целое.

Стандартизированность обеспечивает единообразные процедуры проведения и оценки выполнения теста. Стандартизация затрагивает словесные инструкции, время, материалы, а также окружающую обстановку. Подчеркнём, рассмотренные признаки тестирования особенно важно учитывать в процессе проведения диагностических исследований.

Таким образом, педагогическая практика показывает, что тесты, во-первых, являются прогрессивной в научном отношении частью методического инструментария; во-вторых, позволяют «измерить» типические ошибки и трудности обучаемых; в-третьих, выдвинуть уровень математических и других способностей учащихся на различных этапах (периодов) обучения; в-четвёртых, на основе анализа полученного материала смоделировать (спроектировать) стройную, логически научно обоснованную систему обучения и воспитания детей. Это, в свою очередь, требует от педагога серьёзной методологической, теоретической и методической подготовки.