Автор книги: Марина Челышкова
Жанр: Прочая образовательная литература, Наука и Образование
сообщить о неприемлемом содержимом
Текущая страница: 17 (всего у книги 17 страниц)
И
Измерение педагогическое – научно обоснованный процесс отображения измеряемых объектов (свойств, учебных достижений и т.д.) на некоторое множество точек числовой оси, представляющей из себя шкалу.
Инструкция – указания в письменной или устной форме для участников тестирования (в том числе для педагогов и организаторов) по подготовке к тестированию, о порядке его проведения, правилах поведения на нем.
Интервал доверительный – интервал на оси переменной измерения, относительно которого с заранее выбранной вероятностью близкой к единице (меньшей единицы на величину выбранного уровня значимости критерия) можно утверждать, что он содержит истинное значение оцениваемого параметра.
к
Ключи ответов – набор правильных пронумерованных ответов к каждому заданию теста.
Конфиденциальность результатов тестирования – неразглашение результатов тестирования без согласия участвовавших испытуемых и педагогов.
Корреляционный анализ – совокупность методов статистического исследования взаимозависимости между переменными, находящимися во взаимодействии.
Коэффициент корреляции – числовой показатель степени взаимозависимости двух переменных, который, как правило, изменяется от – 1 до +1.
Коэффициент корреляции бисериальный – числовой показатель степени взаимозависимости двух переменных, одна из которых измерена в дихотомической шкале наименований, а другая в континуальной порядковой или интервальной шкале. При нарушении нормального характера распределения значений переменных может выходить за пределы интервала [– 1; +1].
Коэффициент корреляции Пирсона – числовой показатель степени взаимозависимости двух переменных, измеренных в континуальной шкале.
Коэффициент корреляции точечно-бисериальный – числовой показатель степени взаимозависимости двух переменных, одна из которых измерена в дихотомической шкале наименований, а другая в континуальной порядковой или интервальной шкале. По сравнению с бисериальным коэффициентом корреляции имеет заниженные значения и не может выходить за пределы интервала [– 1; +1].
Коэффициент надежности – количественная мера надежности теста, определяемая как доля дисперсии истинных баллов от общей дисперсии баллов по тесту. Квадрат коэффициента корреляции между наблюдаемыми результатами тестирования и истинными баллами по тесту.
Коэффициент ранговой корреляции Спирмена – числовой показатель степени взаимозависимости качественных признаков, измеренных в дихотомической шкале наименований или в порядковой шкале.
Коэффициент φ – числовой показатель степени взаимозависимости переменных, измеренных в номинальной шкале.
M
Матрица корреляционная – прямоугольная таблица, содержащая набор значений коэффициента корреляции между переменными, как правило, между результатами по различным заданиям теста.
Матрица ответов – прямоугольная таблица, содержащая результаты ответов испытуемых на задания теста в виде баллов за каждое задание теста или в виде номера (буквы), выбранной испытуемым при ответе (только для заданий с выбором ответов).
Меры изменчивости – статистические показатели разброса значений измеряемой переменной относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения.
Меры центральной тенденции – характеристики совокупности значений измеряемой переменной, указывающие на наиболее типичный репрезентативный для исследуемой выборки результат.
Модераторы – характеристики контингента испытуемых, значимые для оценки прогностической валидности теста.
H
Надежность параллельных форм – оценка надежности теста, полученная путем корреляции результатов по двум параллельным формам теста, которые предъявляют одной и той же группе испытуемых.
Надежность ретестовая – оценка надежности теста, полученная путем корреляции результатов по двукратному предъявлению одного и того теста одной и той же группе испытуемых.
Надежность теста – числовая характеристика теста, отражающая точность тестовых измерений и их устойчивость по отношению к действию случайных факторов.
Надежность частей теста – оценка надежности теста, полученная путем расщепления теста на части (задания) и анализа устойчивости результатов по отдельным частям (заданиям) теста.
Нормальное распределение – наиболее часто встречающийся вид теоретического распределения переменных, график плотности которого представляет из себя симметричную унимодальную колоколообразную кривую.
Нормы теста – совокупность статистических показателей, описывающих результаты выполнения теста репрезентативной выборкой испытуемых.
О
Область применения теста – характеристика теста, указывающая на особенности контингента испытуемых, для которых предназначен тест. Специфичность выборки стандартизации определяется по возрастным, половым, профессиональным, территориальным и другим критериям.
Оценка интервальная – оценка параметра генеральной совокупности с помощью числового интервала, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр.
Оценка параметра – однозначно определенная функция результатов наблюдений над случайной величиной, с помощью которой судят об истинном значении оцениваемого параметра.
Оценка точечная – оценка параметра генеральной совокупности, представленная не интервалом, а одним числом.
Ошибка измерения – статистический показатель, характеризующий степень точности отдельных измерений, погрешность измерений.
Ρ
Распределение частотное – совокупность всех значений случайной величины и соответствующие частоты наблюдения этих значений.
Репрезентативность – свойство выборочной совокупности представлять генеральную совокупность.
с
Сертификация теста – процедура установления и подтверждения степени соответствия характеристик теста действующим на момент сертификации требованиям к его качеству.
Совокупность генеральная – все подлежащее исследованию множество однородных элементов, объединенных принадлежностью к одной и той же системе.
Спецификация теста – форма представления запланированной содержательной структуры и других планируемых автором характеристик теста.
Среднее арифметическое – один из наиболее распространенных видов средних величин в статистике. Среднее арифметическое получается путем суммирования всех величин и деления на их количество.
Стандартизация теста – процедура получения норм теста.
Стандартное отклонение – характеристика разброса значений переменной, определяемая как корень квадратный из дисперсии.
Стратификация выборки – процесс расслоения выборки на страты (слои), необходимый для достижения репрезентативности выборки стандартизации.
Τ
Теория классическая конструирования тестов – теория конструирования и применения тестов, построенная на системе постулатов, непараметрических методах оценивания и предположении о существовании параллельного измерения, осуществляемого с помощью параллельных и эквивалентных тестов.
Теория современная конструирования тестов (Item Response Theory – IRT) – теория конструирования и применения тестов, основанная на методах математического моделирования и оценивании латентных параметров испытуемых и заданий теста.
Тест (в широком понимании) – стандартизованная процедура и совокупность методик, предназначенных для получения количественных характеристик об уровне и качестве учебных достижений тестируемых.
Тест входной – система тестовых заданий, предназначенная для оценивания подготовки испытуемого с целью его дальнейшего обучения или проведения развернутого контроля его знаний и умений.
Тест гетерогенный – система междисциплинарных заданий или набор гомогенных субтестов по различным дисциплинам, требующих при разработке и применении использования методов многомерного шкалирования и факторного анализа.
Тест гомогенный – система стандартизованных однородных по содержанию тестовых заданий, связанных дисциплинарной общностью и позволяющих ввести предположение об одномерности измерений.
Тест диагностический – система тестовых заданий, выдаваемая после формирующего теста и предназначенная для выявления причин ошибок испытуемого в процессе текущего контроля за счет пошагового отслеживания этапов выполнения заданий.
Тест итоговый критериально-ориентированный – система стандартизованных тестовых заданий, ранжированных по нарастанию трудности, предназначенных для итогового контроля и позволяющих оценить процент освоенных знаний и умений испытуемыми по отношению к полному объему, запланированному педагогом к усвоению и заложенному в тесте.
Тест итоговый нормативно-ориентированный – система стандартизованных тестовых заданий, ранжированных в рамках определенной стратегии предъявления и позволяющих эффективно дифференцировать испытуемых по уровню и качеству подготовки на основе анализа результатов выполнения теста.
Тест тематический – система тестовых заданий, содержание которой предназначено для контроля по одной теме дисциплины. Обычно не нуждается в серьезном статистическом обосновании качества.
Тест формирующий – система тестовых заданий, предназначенных для формирования представлений педагога о пробелах в подготовке испытуемых. Обычно используется при рубежном контроле в сочетании с диагностическими тестами и в компьютерной форме предъявления.
Тест якорный – блок заданий в количестве от 5 до 10, помещаемый во все варианты теста и используемый для выравнивания шкал по различным вариантам теста.
Тестирование – процедура предъявления теста, проведения тестирования, оценки и интерпретации результатов его выполнения.
Тестолог (специалист в области педагогических измерений) – специалист, занимающийся теоретико-методологическим и методическим обоснованием процессов разработки и применения педагогических тестов.
Трудность задания – характеристика задания, отражающая статистический уровень его выполнения на выборке стандартизации.
У
Уровень значимости – понятие математической статистики, отражающее величину вероятности ошибочного вывода относительно анализируемой статистической гипотезы, проверяемой на основе выборочных данных.
Φ
Форма задания – способ организации и упорядочения элементов задания, расположенных на строго фиксированных в рамках каждой формы местах.
Формы параллельные – варианты теста, разработанные на основе общей спецификации и имеющие сходные статистические характеристики.
Ш
Шкала – форма фиксации результатов измерений путем упорядочения их в определенную числовую систему.
Шкала интервальная – тип шкалы континуального характера с единицей измерения, разбивающей интервал измерения делениями шкалы, но без абсолютного нуля.
Шкала номинальная – тип шкалы, используемый для простейшей классификации при установлении соответствия измеряемого признака определенному классу по дихотомическому принципу.
Шкала порядковая – тип шкалы, используемый для упорядочения (ранжирования) элементов без учета расстояния между ними.
Шкалирование – процесс упорядочения результатов измерения путем отображения их в ту или иную шкалу.
Список литературы
1. Анастази А., Урбина С. Психологическое тестирование. СПб.: Питер, 2007.
2. Балыхина Т.М. Словарь терминов и понятий тестологии. М.: Изд-во РУДН, 2000.
3. Басова А.Л. Перспективы использования методов тестирования абитуриентов для прогноза успешной учебной деятельности в вузах с различными формами обучения. Психология и социология образования / Современный гуманитарный ун-т. М., 2001.
4. Берка К. Измерения, понятия, теория, проблемы. М.: Прогресс, 1987.
5. Болонский процесс: поиск общности европейских систем высшего образования (проект TUNING) / под науч. ред. В.И. Байденко; Исслед. центр проблем качества подгот. специалистов. М., 2007.
6. Гавриков A.A., Зайченко О.М. и др. Педагогическое образование в университете. Контекстно-биографический подход. Великий Новгород, 2001.
7. Гласе Дж., Стенли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976.
8. Ефремова Η. Φ. Современные тестовые технологии в образовании. М.: Логос, 2003.
9. Загвоздкин В.К. Портфель индивидуальных учебных достижений – нечто большее, чем просто альтернативный способ оценки // Информ.-метод, идидакт. журн. 2004. № 5 (http://image.websib.ra/05/text_article.htm?457).
10. Звонников В.И. Измерения и качество образования. М.: Логос, 2006.
11. Звонников В.И., Челышкова М.Б., Нефедов В.А. Документированная система менеджмента качества. Концепция системы менеджмента качества университетского образования: справ.-метод, пособие / Гос. ун-т управления. М., 2006. Вып. 1.
12. Звонников В.И., Ефремова Η. Ф., Найденова H.H. Челышкова М.Б. Проведение мониторинга качества образования / Исслед. центр проблем качества подгот. специалистов. М., 2005.
13. Звонников В.И., Челышкова М.Б. Разработка и сертификация аттестационных тестов / Гос. ун-т управления. Μ., 2007.
14. Звонников В.И., Челышкова М.Б. Современные средства оценивания результатов обучения. М.: Академия, 2007.
15. Зимняя H.A. Педагогическая психология. М.: Логос, 2005.
16. Иванов Д.А., Митрофанов К.Г., Соколова О.В. Компетентностный подход в образовании. Проблемы, понятия, инструментарий. М.: Академия, 2003.
17. Клайн П. Введение в психометрическое программирование: справочное руководство по конструированию тестов. Киев: Наукова думка, 1994.
18. Ковалева Г.С, Красновский Э.А., Краснокутская Л.П., Краснянская К.А., Кошеленко HT., Смирнова Е.С Результаты российских учащихся в международном исследовании PISA-2000 / Новый взгляд на грамотность: материалы междунар. исследования PISA-2000. М.: Логос, 2004.
19. Масленников А. С. Разработка методики проведения педагогических измерений уровня подготовки выпускников в условиях аттестации учебных заведений среднего и высшего профессионального образования: сб. материалов по программе «Научное и научно-методическое функционирование развития системы образования»: в 3 ч. Ч. 3. М.: Прометей, 2003.
20. Михеев В.И. Методы теории измерения в педагогике. М. : Логос, 2003.
21. Найденова H.H. Формирование репрезентативной выборки. М.: Логос, 2003.
22. Переверзев В.Ю. Критериально-ориентированное педагогическое тестирование: учеб. пособие. М.: Логос, 2003.
23. Полилова Т.А. Концепция электронного портфолио (http://schools.keldysh.rU/courses/e-portfoKo.htm#_Tocl55786304).
24. Руководство пользователя SPSS. SPSS BASE 8.0. M.: СПСС РУСЬ, 1998.
25. Теория управления / под общ. ред. А.Л. Гапоненко, А.П. Панкрухина. М.: Изд-во РАГС, 2004.
26. Хуторской A.B. Ключевые компетенции как компонент личностно-ориентированного образования // Народное образование. 2003. №2.
27. Филиппов В.М. и др. Управление в высшей школе: опыт, тенденции, перспективы. М.: Логос, 2006.
28. Челышкова М.Б. Теория и практика конструирования педагогических тестов: учеб. пособие. М.: Логос, 2001.
29. Applying the Rasch Model: Fundamental Measurement in the Human Sciences / Trevor G. Bond. Christine M. Fox. Lawrence Erlbaum Associates, 2001.
30. Automated Essay Scoring: A Cross-Disciplinary Perspektive / Ed. by Mark D/ Shermis. Jul Burstein. Lawrence Erlbaum Associates, 2003.
31. Baker F.B. Item Response Theory: Parameter Estimation Techniques. ASC. Univ. Ave, 2004.
32. Bateson D., Nicol C, Achroeder T. Alternative Assessment and Tables of Specification for the Third International Mathematics and Science Study. ICC 64, 1991.
33. Berk R.A. Criterion-referenced Measurement. The State of Art. Baltimore, MD: Johns Hopkins University Press, 1980.
34. Constructing Test Items: Multiple-Choise. Constructed-Response, Performance, and Other Formats / Steven J. Osterlind. University of Missouri-Columbia, 2004.
35. Crocker L., Algina J. Introduction to Classical and Modern Test Theory. University of Florida. HBJCP, 1986.
36. Educational Measurement / Ed. by R.L. Linn. N.Y.: Macmillan, 1989.
37. Handbook of Modern Item Response Theory / Ed. by Wim J. van der Linden and Ronald K. Hambleton. ASC. Univ. Ave, 1997.
38. Keeves J.P. (Ed.) Educational Research, Methodology and Measurement: An International Handbook. Oxford: Pergamon Press, 1988.
39. Measurement and Assessment in Schools / Ed. by Blaine R. Wortnen, Karl R, White, Xitao Fan, Ricard R. Sudweeks, 1999.
40. Roid G.H., Haladyna Φ.Μ. A Technology for Test-item Writing. N.Y.: Academic Press, 1982.
41. Software and Books for allYour Measurement Needs. In Catalog Assessment Systems Corporation, 1996.
42. Test Assessment / W. Bruce Walsh, Nancy E. Betz. Prentice Hall, Inc, 2001.
43. Test Theory: A Unified Treatment / Ed. by Roderick P. McDonald. Lawrence Erlbaum Associates, 1999.
44. Weiss D.J. (Ed.) New Horizons in testing. N.Y.: Academic Press, 1983.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.