--PAGE_BREAK--За умови, що тест зроблений правильно, кожен профіль свідчить про структуру знань. Цю структуру можна назвати елементарною (оскільки є ще факторні структури, що виявляються за допомогою методів факторного аналізу).
Роль структури знань багаторазово підкреслювалася видатним педагогом А. Дистервегом, а також психологом Д. Брунером. Останній вважає, що "виклад структури знань, оволодіння цією структурою, а не просте засвоєння фактів і технічних прийомів є центральним моментом".
Розробники систем дистанційного навчання повинні прагнути, у першу чергу, до формування правильних індивідуальних структур знань, у яких не було би пробілів (розривів у знаннях), і на цій основі підвищувати рівень підготовки. Рівень знань у значній мірі залежить від особистих зусиль і здібностей тих, хто навчається за допомогою таких систем, у той час як структура знань помітно залежить від правильної організації навчальної системи, від індивідуалізації навчання, від рівня поданого матеріалу, від об'єктивності контролю — загалом, від усього того, чого зазвичай не вистачає.
Як справедливо відзначав М. Мінський, людина не може добре вчитися, якщо розриви для нього між відомим і невідомим занадто великі. Рівень знань у значній мірі залежить від особистих зусиль і здібностей учнів. У той час як структура знань залежить від правильної організації навчального процесу, від індивідуалізації навчання, від майстерності педагога, від об'єктивності контролю. Загалом, від усього того, чого звичайно в нас не вистачає.
2. Класи і види тестів Традиційний тест являє собою єдність, щонайменше, трьох систем:
- змістовної системи знань, яка описується мовою навчальної дисципліни, що перевіряється;
- формальної системи завдань зростаючої складності;
- статистичних характеристик завдань і результатів.
Традиційний навчальний тест потрібно розглядати з двох сторін: як метод педагогічного виміру і якрезультат застосування тесту.
Обидва ці критерії характеризують тест із різних сторін, тому що тест треба розуміти одночасно і як метод, і як результат навчального виміру. Одне доповнює інше. Тест як метод не мислиться без результатів, що підтверджують якість його самого і якість оцінок виміру випробуваних різного рівня підготовленості.
Головна ідея традиційного тесту — мінімальним числом завдань, за короткий час, швидко, якісно і з найменшими витратами порівняти знання як можна більшого числа учнів.
Власне кажучи цим відбивається ідея ефективності навчальної діяльності в області контролю знань в системах дистанційного навчання.
2.1 Гомогенні тести До традиційних тестів відносяться тести гомогенні і гетерогенні.
Гомогенний тест являє собою систему завдань зростаючої складності, специфічної форми і визначеного змісту — система, створювані з метою об'єктивного, якісного, і ефективного методу оцінки структури і виміри рівня підготовленості учнів по одній навчальній дисципліні.
Легко бачити, що у своїй основі визначення гомогенного тесту збігається з визначенням традиційного тесту.
Гомогенні тести поширені більше інших. Вони створюються для контролю знань по одній навчальній дисципліні чи по одному розділі такої, наприклад, об'ємної навчальної дисципліни, як фізика. У гомогенному педагогічному тесті не допускається використання завдань, що виявляють інші властивості. Наявність останніх порушує вимога дисциплінарної чистоти навчального тесту. Адже кожен тест вимірює щось заздалегідь визначене.
2.2 Гетерогенні тести Гетерогенний тест являє собою систему завдань зростаючої складності, специфічної форми і визначеного змісту — система, створена з метою об'єктивного, якісного, і ефективного методу оцінки структури і виміри рівня підготовленості по декількох навчальних дисциплінах.
Нерідко в такі тести включаються і психологічні завдання для оцінки рівня інтелектуального розвитку.
Звичайно гетерогенні тести використовуються для комплексної оцінки випускника шкіл, оцінки особистості при прийомі на роботу і для добору найбільш підготовлених абітурієнтів при прийомі до вузи. Оскільки кожен гетерогенний тест складається з гомогенних тестів, інтерпретація результатів тестування ведеться по відповідях на завдання кожного тесту (тут вони називаються шкалами) і крім того, за допомогою різних методів агрегування балів робляться спроби дати загальну оцінку підготовленості.
Нагадаємо, що традиційний тест являє собою метод діагностики, у якому відповідається на одні завдань, в однаковий час, в однакових умовах і з однаковою оцінкою.
При такій орієнтації задачі визначення точного обсягу і структури освоєного навчального матеріалу відступають на задній план. У тест відбирається таку мінімально достатню кількість завдань, що дозволяє порівняно точно визначити, образно говорячи, не «хто що знає», а «хто знає більше».
Інтерпретація результатів тестування ведеться переважно мовою тестології, з опорою на середню арифметичну, моду чи медіану і на так звані процентні норми, що показують — скільки відсотків випробуваних мають тестовий результат гірше, ніж у будь-якого узятого для аналізу випробуваного з його тестовим балом. Така інтерпретація називається нормативно-орієнтованою.
Тут висновок добудовується рейтингом:
завдання Þ відповіді Þ висновки про знання Þ рейтинг, що розуміється як висновок про місце чи ранзі випробуваного.
2.3 Інтегровані тести Інтегрованим можна назвати тест, який складається із системи завдань, що відповідають вимогам інтегрованого змісту, тестової форми, які збільшують складність завдань, націлених на узагальнену підсумкову діагностику підготовленості.
Діагностика проводиться за допомогою таких завдань, правильні відповіді на які вимагають інтегрованих (узагальнених, явно взаємозалежних) знань в області двох і більшого числа навчальних дисциплін. Створення таких тестів дається тільки тим викладачам, що володіють знаннями ряду навчальних дисциплін, розуміють важливу роль міжпредметних зв'язків у навчанні, здатні створювати завдання, правильні відповіді на які потребують знань різних дисциплін і умінь застосовувати такі знання.
Перевага інтегрованих тестів перед гетерогенними полягає в більшій змістовній інформативності кожного завдання й у меншому числі самих завдань.
Методика створення інтегрованих тестів подібна з методикою створення традиційних тестів, за винятком роботи з визначення змісту завдань. Для створення змістовних інтегрованих тестів використання експертних методів є обов'язковим. Це пов'язано з тим, що тільки експерти можуть визначити адекватність змісту завдань цілям тесту. Але, насамперед, самим експертам важливо буде визначитися з цілями утворення і вивчення тих чи інших освітніх програм, а потім і домовитися між собою по принципових питаннях, залишивши для експертизи лише варіації в розумінні ступеня значимості окремих елементів у загальній структурі підготовленості.
2.4Адаптивні тести
Доцільність адаптивного контролю випливає з необхідності раціоналізації традиційного тестування.
Кожен викладач розуміє, що добре підготовленому учню немає необхідності давати легкі завдання, тому що занадто високо імовірність правильного рішення. До того ж легкі матеріали не володіють помітним потенціалом розвитку. Симетрично, через високу імовірність неправильного рішення нема рації давати важкі завдання слабкому учню. Відомо, що важкі і дуже важкі завдання знижують навчальну мотивацію багатьох учнів.
Потрібно було знайти порівняння в одній шкалі для міри складності завдань і міри рівня знань. Ця міра була знайдена в теорії педагогічних вимірів. Датський математик Г. Раск назвав цю міру словом «логіт».
Після появи комп'ютерів ця міра лягла в основу методики адаптивного контролю знань, де використовуються способи регулювання складності і числа пропонованих завдань, у залежності від відповіді учнів.
При успішній відповіді наступне завдання комп’ютер підбирає більш важким, при неуспішному — легшим. Зрозуміло, цей алгоритм вимагає попереднього випробування всіх завдань, визначення їх міри складності, а також створення банка завдань і спеціальної програми.
Використання завдань, що відповідають рівню підготовленості, істотно підвищує точність вимірів і мінімізує час індивідуального тестування до 5-10 хвилин. Адаптивне тестування дозволяє забезпечити комп'ютерну видачу завдань на оптимальному, приблизно 50%-му рівні імовірності правильної відповіді для кожного учня.
Зараз у світі три варіанти адаптивного тестування.
Перший називається пірамідальним тестуванням. При відсутності попередніх оцінок всім дається завдання середніх труднощів і вже потім, у залежності від відповіді, кожному дається завдання легше чи важче; на кожнім кроці корисно використовувати правило розподілу шкали складності навпіл.
Другий варіант — flexilevel-контроль починається рівня складності, який обирає сам той, хто проходить тестування, з поступовим наближенням до реального рівня знань.
Третій варіант — stradaptive (від англ. stratified adaptive), коли тестування проводиться за допомогою банку завдань, розділених за рівнями складності. При правильній відповіді наступне завдання береться з верхнього рівня, при неправильному — з нижнього.
Таким чином, адаптивний тест являє собою варіант автоматизованої системи тестування з заздалегідь відомими параметрами складності і здатністю кожного завдання, що диференціює.
Ця система створена у виді комп'ютерного банку завдань, упорядкованих відповідно до цікавлячого характеристиками завдань.
2.5 Критеріально-орієнтовані тести Це дуже умовне й в принципі неправильна назва групи тестів, що одержали в нас деяке поширення і визнання. Власне кажучи ж ми маємо справу не стільки з тестами названого роду, скільки з інтерпретацією тестових результатів
Якщо головною задачею є прагнення з'ясувати, які елементи змісту навчальної дисципліни засвоєні, то це випадок предметно-педагогічного підходу до інтерпретації результатів тестування. При цьому визначається: що з головної сукупності завдань (по англ. Domain) випробуваний знає і чого не знає. Інтерпретація результатів ведеться педагогами, мовою навчальної дисципліни.
Висновок вибудовується уздовж логічного ланцюжка:
зміст навчальної дисципліни Þ головна сукупність завдання для виміру знань Þ тест як вибірка завдань з цієї сукупності, відповіді Þ імовірнісний висновок про знання навчальної дисципліни.
При орієнтації на такі тести потрібно велике число завдань і досить повного визначення змісту досліджуваної дисципліни. Інтерпретація результатів ведеться педагогами.
Суперечки відбуваються навколо двох головних питань:
1. Правильність змісту тесту, що означає безпомилковість формулювань його завдань, предметно-наукову обґрунтованість, допустимість тесту для перевірки знань.
При аргументації на користь того чи іншого тесту педагоги спираються на мову, принципи і взагалі на знання навчальної дисципліни, яку вони викладають. У таких випадках говорять про тести із змістовно-орієнтованою інтерпретацією результатів.
2. Обґрунтованість оцінки знань по всьому навчальному предмету, на основі результатів тестування по невеликій вибірці завдань тесту; вибірці з потенційно чи реально існуючої головної сукупності всіх завдань, які можна було б дати випробуваним для упевненої й обґрунтованої оцінки. Фактично це питання обґрунтування точності індуктивного висновку про знання великого числа питань на основі відповідей по малому числу завдань тесту.
Другий вид тестів пов'язаний з орієнтацією на такі конкретні цілі і задачі, як, наприклад, перевірка рівня засвоєння порівняно короткого переліку необхідних знань, умінь і навичок, що виступають як заданий чи стандарт критерію засвоєння.
Наприклад, для атестації випускників дистанційних курсів важливо мати такі завдання, що дозволяють робити висновок про мінімально припустиму їх компетентність (Minimum Competency Tests). При перевірці мінімально припустимого рівня знань зміст завдань носить принципово полегшений характер. Оскільки такі завдання повинні виконувати усі випускники, допущені системою до атестації, тут важко говорити про тести як методі об'єктивного й ефективного виміру різного рівня підготовленості, у строгому контексті поняття «тест».
В такому випадку говориться про тести з критеріально-орієнтованою інтерпретацією результатів. Висновок вибудовується уздовж логічного ланцюжка: завдання Þ відповіді Þ висновки про відповідність заданому критерію.
Під критеріально-орієнтованою інтерпретацією мається на увазі порівняння змісту атестаційних матеріалів з результатами тестування і висновок: що із заданого стандарту і на якому рівні, реально засвоєно.
При критеріально-орієнтованій інтерпретації потрібно трохи менше число завдань, за допомогою яких визначається — що випробуваний знає і чого не знає з заданого стандарту. Інакше кажучи, тут відповіді оцінюються щодо не всієї області (Domain) необхідних знань, а тільки з області, обмеженої конкретним стандартом чи рівнем (критерієм) знань.
При критеріально-орієнтованій інтерпретації для діагностики заздалегідь заданого рівня підготовленості використовуються, власне кажучи, не тести, у традиційному розумінні цього методу, а сукупності завдань у тестовій і в іншій формі. Слово одне, але зміст інший.
3. Принципи добору змісту тестових завдань Зміст тесту можна визначити як оптимальне відображення навчального матеріалу в системі тестових завдань.
Слова «оптимальне відображення» припускають необхідність добору такого контрольного матеріалу, відповіді на який з високою імовірністю (більше 95%) свідчили б про рівень підготовленості кожного учня.
Досягнення обґрунтованого висновку про знання учнів на основі змісту тесту є головною метою тестології — науки про розробку якісних тестів і їхньому ефективному застосуванні.
Оптимальне відображення припускає також можливість вибору придатної форми і необхідного числа завдань.
Форм лише чотири. Це:
- завдання з вибором одного чи декількох правильних відповідей з числа запропонованих;
- завдання відкритої форми, де відповідь дописується, у відведеному для цього місця;
- завдання на встановлення відповідності;
- завдання на встановлення правильної послідовності дій.
Число завдань традиційного тесту звичайно буває не менше тридцяти. Банк завдань адаптивного тесту містить більше число завдань.
При тестуванні перевіряється не весь програмний матеріал, а лише та частина навчальної програми, що входить у зміст. Це знання, що підлягають обов'язковій перевірці в кожнім системі дистанційного навчання. Деякі елементи знань, що перевіряються, (переважно по окремих темах) використовуються тільки в поточному контролі. Інші елементи, що охоплюють знання декількох тем, використовуються в рубіжному контролі, наприклад, наприкінці навчальної чверті. І, нарешті, у підсумковому контролі використовуються завдання, правильні відповіді на який вимагають знання багатьох, а й іноді і всіх тем, вивчених протягом навчального року.
Сформулюємо критерії добору змісту тестового матеріалу:
Значимість. Цей принцип указує на необхідність включити в тест лише ті елементи знання, які можна віднести до найбільш важливих, ключових, без яких знання стають неповними, з численними пробілами. Такі елементи знання, через їхню важливість, можна назвати структурними. У тест, отже, потрібно включати тільки ті матеріали, що відіграють роль структурних елементів в індивідуальному знанні.
Наукова вірогідність. У тест включається тільки той зміст навчальної дисципліни, що є об'єктивно щирим і піддається раціональній аргументації. Відповідно, усі спірні точки зору, цілком нормальні в науці, не рекомендується включати в тестові завдання. Суть тестових завдань полягає саме в тім, що вони вимагають чіткого, заздалегідь відомого викладачам відповіді, визнаного ними в процесі розробки завдань об'єктивно щирим.
продолжение
--PAGE_BREAK--