Calculul indicelui de dificultate (Ytr). Dificultatea testului și elementele testului Care este dificultatea testului

Un indicator al dificultății unui element de testat ca cel mai important factor de formare a aluatului.

Krasheninnikova Galina Gennadievna

Cand. ped. Știință, filiala Magadan a Universității de Stat din Rusia pentru Umanistice

Una dintre caracteristicile principale ale unui element de testare este dificultatea acestuia. Nivelul de dificultate al sarcinii, precum și nivelul de pregătire al testatului, sunt parametri latenți care nu se pretează la observarea directă. Pentru a evalua acești parametri, este necesar să se utilizeze indicatori strâns legați. Atunci când testează cunoștințele elevilor, elementele de testare în sine acționează ca un indicator. Sarcina apare: să convertească valorile indicatorului în valorile parametrilor latenți. Exista abordări diferite la rezolvarea acestei probleme. Teoriile de testare clasice și moderne oferă propriile metode de estimare a parametrilor latenți.

Măsura tradițională a dificultății sarcinii în teoria testului clasic ani lungi rămâne raportul dintre numărul de răspunsuri corecte la această sarcină și numărul total de subiecți din grup. Cu cât sarcina este mai ușoară, cu atât este mai mare procentul celor care au îndeplinit această sarcină.

Cu toate acestea, această definiție are o inexactitate semantică: o creștere a valorii numerice a unui indicator statistic indică o scădere a nivelului de dificultate al sarcinii și invers. Prin urmare, recent s-au încercat introducerea unor noi unități de dificultate. Măsura clasică a dificultății este înlocuită de cea opusă și reprezintă ponderea răspunsurilor incorecte în grupul de subiecți, care, în opinia noastră, reflectă mai exact semnificația parametrului „dificultate în sarcină”.

Teoria modernă de testare - Item Response Theory (IRT) - se bazează pe teoria analizei structurale latente (LSA), creată de P. Lazarsfeld. În IRT, spre deosebire de teoria clasică, parametrul latent este tratat nu ca o constantă, ci ca o variabilă continuă. Metodele IRT pot fi clasificate în funcție de numărul de parametri pe care îi utilizează. Cele mai cunoscute sunt modelul cu un parametru al lui G. Rush, modelele cu doi și trei parametri ale lui A. Birnbaum.

Georg Rasch a plasat pe aceeași scară atât nivelul de pregătire al testatorului, cât și nivelul de dificultate al sarcinii, introducând o unitate comună de măsură pentru ei - logit. Un logit al dificultății unei sarcini este egal cu logaritmul natural al raportului dintre proporția răspunsurilor incorecte la această sarcină și proporția răspunsurilor corecte.

În ciuda faptului că IRT sa răspândit în ultimii ani, are totuși multe dezavantaje. În special, la testarea realizărilor educaționale, există discrepanțe semnificative între valorile calculate și datele empirice. De asemenea, a fost dovedită o corelație ridicată (aproximativ 0,9) între rezultatele obținute prin modelul Rush și rezultatele obținute prin metode clasice. Acest fapt ne permite, fără a compromite precizia calculelor, să folosim metodele teoriei testului clasic pentru a caracteriza dificultatea elemente de testare.

Deși formula clasică pentru calcularea dificultății unei sarcini este destul de convenabilă pentru executarea și interpretarea ulterioară a rezultatelor obținute, în opinia noastră, aceasta nu este lipsită de o oarecare subiectivitate: dificultatea unei sarcini depinde în mod direct de eșantionul participanților la test. În acest sens, să luăm în considerare o altă perspectivă a evaluării nivelului de dificultate al unui element de testare, care, deși nu este răspândit, ne prezintă un anumit interes.

Pentru a aborda esența parametrului latent „dificultate”, să trecem la clasificarea nivelurilor de asimilare a cunoștințelor adoptate în literatura pedagogică. Puteți observa o creștere complet obiectivă a gradului de dificultate de asimilare pentru fiecare nivel ulterior de asimilare a cunoștințelor. Astfel, putem concluziona că există o relație directă între nivelurile de asimilare și nivelurile de dificultate ale sarcinilor corespunzătoare fiecărui nivel de asimilare. Acest lucru ne permite să identificăm concepte precum „nivel de dificultate” și „nivel de asimilare” în raport cu elementele testate. Luând clasificarea V.P. Bespalko, distingem patru niveluri de dificultate: „student”, tipic, euristic, creativ.

În prezent, metodele expert sunt utilizate pe scară largă în pedagogie. Prin urmare, evaluarea de către experți a nivelului de dificultate al elementelor testate merită atenție ca o altă opțiune pentru evaluarea indicatorului de dificultate. De exemplu, în opera lui A.P. Ivanov, este dată o descriere a unei astfel de evaluări, atunci când, înainte de începerea experimentului de testare, mai mulți experți sunt rugați să evalueze dificultatea sarcinilor tuturor variantelor de test în puncte. Pentru a obține o evaluare expertă, autorul furnizează o listă de opt factori cu criteriile de evaluare corespunzătoare de la 1 la 5 puncte pentru fiecare.

Într-un test bine conceput, dificultatea elementului nu ar trebui să fie influențată nici de formă, nici de organizarea testului. Indicele de dificultate depinde doar de conținutul și nivelul de pregătire al testatului. Este adevărat, există o părere că gradul de dificultate al unei sarcini este influențat de localizarea acestei sarcini în structura testului. În acest caz, se recomandă utilizarea mai multor variante de testare care diferă în ordinea sarcinilor. V.S. Avanesov consideră că principiul principal al dezvoltării conținutului testelor pedagogice este dificultatea tot mai mare a elementelor testate. În opinia sa, numai după determinarea gradului de dificultate, sarcina are șansa de a deveni una de testare. Până atunci, rămâne doar o sarcină sub formă de test.

Includerea unui număr mare de sarcini de dificultate medie în test crește fiabilitatea acestuia, dar duce la o scădere a validității sale de fond. Testul, constând în sarcini ușoare care verifică cunoștințele minime, nu poate da o idee despre nivelul real de cunoștințe. Selectarea elementelor de testare cu un grad ridicat de dificultate poate spori motivația în învățare, dar poate avea și un efect opus. Astfel, testele din sarcini dificile distorsionează și rezultatele testelor. În plus, conținutul testului ar trebui să varieze în funcție de nivelul de pregătire al grupurilor de studenți. Dificultatea testului pentru elevii slabi diferă semnificativ de nivelul de dificultate al testului oferit elevilor puternici.

Potrivit lui A. Anastazi și S. Urbina, alegerea nivelului de dificultate al sarcinii depinde de scopul testului, de modul în care se presupune că vor fi folosiți indicatorii testului. Pentru testele orientate spre subiect, dificultatea sarcinilor ar trebui să fie la nivelul 0,8-0,9. Determinând conținutul informațional al acestuia în funcție de nivelul de dificultate al sarcinii, autorii arată că cea mai informativă sarcină este cu un nivel mediu de dificultate egal cu 0,50.

Astfel, putem concluziona că sarcinile cu un nivel mediu de dificultate au cea mai mare capacitate de diferențiere. Și, dacă scopul testării este diferențierea testatului, o evaluare comparativă a nivelului lor de cunoștințe, atunci sarcinile cele mai simple și mai dificile ar trebui excluse din test. Dacă scopul testului este de a determina dacă elevul a însușit suficient un anumit set de competențe necesare pentru trecerea la următoarea etapă de formare, atunci acesta poate conține atât sarcinile cele mai ușoare, cât și cele mai dificile.

Lista bibliografică

1. Avanesov V.S. Aplicarea sarcinilor sub formă de test în noile tehnologii educaționale // Tehnologii școlare. - 2007. - Nr. 3. - P. 146–163.

2. Anastasi A., Urbina S. Testarea psihologică. - SPb. : Peter, 2002. - 688 p.

3. Bespalko V.P. Componente ale tehnologiei pedagogice. - M.: Pedagogika, 1989 .-- 192 p.

4. Ivanov A.P. Sistematizarea cunoștințelor în matematică în clase specializate folosind teste. - M.: Fizmatkniga, 2004. - 416 p.

5. Ingenkamp K. Diagnostic pedagogic. - M.: Pedagogika, 1991 .-- 240 p.

6. Kim V.S. Analiza rezultatelor testelor în procesul de măsurare Rasch // Măsurători pedagogice. - 2005. - Nr. 4. - P. 39–45.

7. Rasch G. Modele probabiliste pentru unele teste de inteligență și realizare. - Chicago și Londra, 1980. - 199 p.

valabilitate. Expertiza este deja utilizată pentru a îmbunătăți calitatea materialelor de testat din etapa de proiectare și dezvoltare.

Testează elementele care îndeplinesc cerințele formale „externe” (formulare corectă, logică consistență, formă adecvată etc.) nu sunt întotdeauna calitative, permițând să se considere astfel de sarcini a priori sau a posteriori ca un mijloc eficient de evaluare a nivelului de formare a elevilor.

Elementele de testare (teste) măsoară proprietățile anumitor eșantioane de potențiali subiecți. Examinarea calității sarcinilor și a întregului test este o evaluare nu numai a fiecăruia dintre elementele sale (distractori, numărul acestora etc.), ci și a întregului test, a structurii acestuia și a relațiilor cu alte sarcini.

Calitatea educației profesionale este, de asemenea, nivelul, volumul cunoștințelor, consistența, stabilitatea, valoarea, perspectivele, fundamentalitatea, capacitatea de a primi și construi noi cunoștințe, de a le aplica pentru a rezolva probleme. Efectiv control de calitate educația este, de asemenea, imposibilă fără informații relevante și în timp util despre nivelul de formare. Este necesar să se utilizeze materiale de testare de înaltă calitate care să evalueze în mod fiabil realizările educaționale.

Aplicarea principiilor și mijloacelor de calimetrie, analiza sistemului se concentrează pe integritatea, apariția, compatibilitatea, adaptabilitatea și alte caracteristici sistemice ale testelor. Calitatea testelor este evaluată prin măsurarea corespondenței dintre caracteristicile elementelor de testare și variantele de test compilate pe baza acestora. Evaluarea cuprinzătoare a testului (testului) în ansamblu.

Elementele de testare, întregul test au elemente structurale caracterizate prin proprietăți interne și externe, structură proprie. Aceste proprietăți sunt influențate într-un mod decisiv de mulți factori:

  • populația generală și eșantionul de subiecți;
  • indicatori de calitate;
  • caracteristicile tehnologiei de testare;
  • caracteristicile procesării, analiza rezultatelor testelor (în special, aparatul matematic și statistic folosit și procedurile euristice);
  • calificarea experților și profesionalismul grupului de experți;
  • o abordare sistematică pentru efectuarea și analiza testelor.

Luarea în considerare completă a proprietăților vă permite să proiectați teste „dorite” - teste cu calități predeterminate (conform ipotezei testării), proprietăți statistice, de exemplu, teste „paralele”, subteste etc. Este, de asemenea, necesar să se ia în considerare măsura de diferențiere, capacitatea sarcinilor (testelor) de a diferenția testat, de exemplu, capacitatea de a diferenția față de nivelul maxim sau minim de învățare.

Caracteristici precum dificultatea (complexitatea) sarcinii și capacitatea sa discriminatorie sunt de o importanță capitală pentru analiză. Dificultatea sarcinii reflectă nivelul fezabilității acesteia într-un eșantion statistic dat (standard). Este adesea evaluat de raportul dintre numărul celor care au finalizat corect sarcina și numărul eșantionului de subiecți.

Cu cât acest indicator este mai aproape de 1, cu atât este mai mare dificultatea sarcinii; cu cât este mai aproape de 0, cu atât este mai mică dificultatea acestuia.

Ca indicator al dificultății unei sarcini de testare, utilizați indice de dificultate U calculat după formula:

unde n este numărul de răspunsuri corecte la sarcină, N este numărul total de subiecți (eșantion).

Atunci când se construiește un test orientat pe criterii, pentru a-i crește dificultatea, se adaugă sarcini de dificultate mai mare, pentru coborâre, acestea includ mai multe sarcini de dificultate mică.

Dificultatea sarcinii (testului) este:

  • subiectiv, asociat cu circumstanțe precum o limită de timp, cunoașterea tehnologiei, înțelegerea condițiilor (formarea cunoștințelor, abilităților și abilităților), disponibilitatea mentală etc .;
  • obiectiv (statistic), asociat cu proporția subiecților din eșantion care au rezolvat sarcina (testul).

Dificultatea este o valoare relativă care depinde de vârstă, diferențe profesionale și alte diferențe ale subiecților, prin urmare, aceste caracteristici afectează rezultatele testului, fiabilitatea testului. Sunt necesare măsuri pentru nivelarea condițiilor (pentru a minimiza un astfel de impact asupra testat). Pentru a face acest lucru, utilizați eșantionarea direcționată, standardizarea procedurii de testare, adică este necesară o tehnică de diagnostic eficientă, care să ducă la o „medie de aur”, un echilibru de sarcini dificile, intermediare și simple.

Sarcinile prea dificile înrăutățesc caracteristicile statistice ale evaluării (sunt puține cele decisive, eșecul unei sarcini dificile poate afecta rezolvarea altor sarcini etc.). Sarcinile prea simple duc la rezultate monotone neinformative care complică analiza calității predării, provoacă o atitudine negativă a subiecților față de testare și testare.

Exemplu. Testul orientat pe criterii ar trebui să fie complet, reflectând conținutul întregului volum de cunoștințe planificat pentru asimilare. Un test orientat normativ poate conține doar acele secțiuni care sunt necesare pentru diferențierea de nivelul realizărilor educaționale ale elevilor, de exemplu, 50-70% din sarcinile de dificultate medie (Fig. 4.1, Fig. 4.2).

În testele de certificare bazate pe criterii, majoritatea sarcinilor sunt mai ușoare, ceea ce limitează procentul de studenți necertificați.

Exemplu. Dacă procentul prevăzut de studenți necertificați nu ar trebui să depășească 10%, iar criteriul „eșecului academic” este de 70% (cei care au finalizat doar până la 30% din sarcini nu sunt certificate), testul ar trebui să includă de la 70% de sarcini ușoare pe care 90% din testate (Fig. 4.2) ...


Orez. 4.1.


Orez. 4.2.

Prin urmare, este important să alegeți un test care să fie optim în ceea ce privește complexitatea sarcinilor, grupurile de dificultate, structura testului. În cazul în care majoritatea subiecților răspund corect la întrebare, aceasta este plasată de obicei la începutul testului, iar restul întrebărilor - pe măsură ce dificultatea lor crește. Această aranjare a sarcinilor face posibilă estimarea aproximativ a pragului de dificultate pentru fiecare subiect, locul său în rating.

Testarea practică arată că nivelul individual de cunoștințe, abilități și abilități ale subiecților se reflectă cât mai mult posibil atunci când se utilizează sarcini de dificultate medie cu includerea cantitate mică restul sarcinilor.

Există o caracteristică specială numită capacitate discriminatoare sarcini. Arată măsura eficacității de a distinge testarea în grupuri: cei care au stăpânit materialul educațional și cei care nu l-au stăpânit.

Cu cât R este mai aproape de zero, cu atât este mai mică distincția dintre sarcina subiecților care au stăpânit sau nu au stăpânit materialul educațional.

Cu cât R este mai aproape de –1, cu atât este mai mare diferența, dar în ordine inversă: subiecții care au stăpânit materialul au răspuns greșit și invers. Acesta este un caz rar, mărturisește, de exemplu, lacunele metodologice, spontaneitatea acesteia.

În articolul anterior, au fost luate în considerare nouă principii de dezvoltare a conținutului testelor pedagogice. Accentul acestui articol este al zecelea principiu: creșterea dificultății articolelor de testat.

Dacă un test pedagogic este definit pe scurt ca un sistem de sarcini cu dificultăți în creștere uniformă, atunci va deveni clar că dificultatea sarcinilor este cel mai important, să spunem, un indicator generator de teste. Mulți lideri ai școlii cred că profesorii lor sunt capabili să „inventeze” câte „teste” doresc în scurt timp. De fapt, puteți veni cu câteva sarcini într-o formă de test. Și nu teste deloc, ci doar sarcini. Nu pot fi incluse în test real până când se cunoaște măsura dificultății lor, precum și alte caracteristici. Măsura dificultății este testată empiric. Din această cerință, devine clar că o verificare empirică preliminară a fiecărei sarcini este obligatorie, înainte de testare. În timpul procesului de verificare, multe sarcini nu îndeplinesc cerințele impuse acestora și, prin urmare, nu sunt incluse în test. Prima cerință pentru elementele testului: în test, elementele trebuie să difere în ceea ce privește nivelul de dificultate, care rezultă din definiția dată anterior a testului și principiul luat în considerare.

Un cititor atent a surprins deja diferențele în vocabularul celor trei concepte de bază ale teoriei măsurătorilor pedagogice introduse aici, ca și cum ar fi „imperceptibil”: conceptul de test pedagogic, o sarcină într-o formă de test și un sarcina de testare. Cerințele pentru prima dintre ele au fost deja luate în considerare în articolul „Definiția unui test pedagogic” (Școala № 30, august 1999).

Este mai bine să introduceți cerințele pentru cel de-al doilea concept acum, după ce a făcut acest lucru cel puțin pe scurt, pentru a nu fi distras de subiectul principal al articolului. Următoarele cerințe sunt impuse sarcinilor în formularul de testare:

Concizie;

Fabricabilitate;

Corectitudinea formei;

Corectitudinea conținutului

Forma logică a enunțului;

Aceleași reguli pentru evaluarea răspunsurilor;

Prezența unui anumit loc pentru răspunsuri;

Aceleași instrucțiuni pentru toți subiecții;

Aranjarea corectă a elementelor sarcinii;

Avanesov V.S. Bazele teoriei pedagogice a măsurătorilor // Pedagogical Measurements, 1, 2004. P. 17.

O interpretare detaliată a acestor cerințe va urma în articolele următoare, dar acum aș dori să atrag atenția cititorului asupra faptului că nu există cerința unei anumite dificultăți a sarcinii, în timp ce o astfel de cerință este impusă testului și sarcina de testare. Din reflecția asupra acestui material și a materialului publicat anterior, se pot trage două concluzii. Primul este că nu există loc în test pentru sarcini cu un grad necunoscut de dificultate. Și al doilea - că nu toate sarcinile propuse sub formă de test pot deveni sarcini de testare: acestea sunt concepte diferite. În primul concept, cele mai esențiale sunt cerințele de conținut și formă. Pentru sarcinile de testare, în primul rând, este prezentată o cerință de o anumită dificultate, lucru care în mod clar nu este necesar pentru sarcinile din formularul de testare. Se poate repeta că sarcinile au șansa de a deveni elemente de testare numai după verificarea empirică a măsurii dificultății lor pe grupuri tipice de subiecți.

Indicatorul dificultății testului și a elementelor testului este informativ și formal în același timp. Informativ, deoarece într-un test bun, dificultatea poate depinde doar de dificultatea conținutului sarcinilor și de nivelul de pregătire al subiecților înșiși. În timp ce se află într-un test prost, rezultatele încep să fie influențate semnificativ de forma sarcinilor (mai ales dacă nu este adecvat conținutului), organizarea slabă a testării, dacă există oportunități de înșelăciune, scurgeri de informații. În această privință, practica dăunătoare a pregătirii țintite a studenților pentru un singur examen de stat merită o mențiune specială. Tolstoi, ministrul educației din Rusia în 1907, i-a chemat pe profesorii implicați în această activitate ca formatori. Dar educatorii sunt cel mai puțin de vină. Vina este sistemul eronat de „etichetare” care determină astfel de practici eronate. Ce este controlul, la fel este și educația.

Componenta formală a indicatorului de dificultate apare atunci când se consideră testarea ca un proces de confruntare între subiect și sarcina care i se oferă. Rezultatul obținut în acest caz este util să fie luat în considerare ca rezultat al unei astfel de confruntări. Într-o interpretare simplificată a fiecărui caz de prezentare a unei sarcini, două rezultate sunt adesea, dar absolut neaparat luate în considerare: victoria subiectului în soluția corectă a sarcinii, unde primește un punct, sau înfrângere, pentru care se acordă zero puncte. Evaluarea rezultatului confruntării depinde de raportul dintre nivelul de cunoștințe al testatorului și nivelul de dificultate al sarcinii, de unitatea de măsură al cunoștințelor aleasă și de regula adoptată anterior (convenție) - ceea ce este considerat un „victoria” subiectului testului și dacă o remiză este acceptabilă, dacă vorbim în limba sportului.

Principiul dificultății crescânde este utilizat în prezentarea conținutului multor manuale și manuale, în special pentru acele discipline academice care sunt construite pe principiul cumulativ, ceea ce înseamnă: cunoașterea elementelor ulterioare ale cursului depinde în mod explicit de cunoașterea elementelor educaționale anterioare. . Această structură este inerentă manualelor de matematică, logică, limbi străine, statistici, tehnice și multe alte științe. În ele, conceptele studiate anterior sunt utilizate în mod activ în subiecte ulterioare. Prin urmare, trebuie să studiați astfel de discipline doar de la început și fără lacune.

Majoritatea autorilor, în special cei străini, nu fac distincție între conceptele de „dificultate” și „complexitate”. Mulți dezvoltatori de testare fac același lucru. Cu toate acestea, există lucrări în care aceste concepte sunt definite în moduri diferite. De exemplu, A.N. Zakharov și A.M. Matyushkin observă că gradul de dificultate al unei sarcini de învățare nu coincide cu complexitatea sa. Gradul de complexitate al materialului educațional este caracterizat de saturația reală (obiectivă) a sarcinii educaționale și forma prezentării acesteia, iar gradul de dificultate presupune întotdeauna corelarea materialului educațional care trebuie stăpânit cu materialul educațional asimilat anterior. și capacitățile intelectuale ale studenților (1).

L.N. Landa a explicat dificultatea problemei educaționale prin faptul că elevii adesea nu cunosc operațiunile care trebuie efectuate pentru a găsi o soluție. Dacă sistemul de operații pentru rezolvarea unei anumite clase de probleme este numit o metodă de soluție, atunci, în opinia sa, dificultatea este asociată cu necunoașterea metodei, cu necunoașterea modului de gândire în procesul de rezolvare, cum și în ce secvență este necesar să se acționeze cu condițiile problemei (2). Dificultățile care apar se explică prin faptul că profesorul încearcă adesea să ofere cunoștințe despre conținutul studiatului și este mult mai puțin preocupat de modul de gândire și raționare (ibid.). Această interpretare se intersectează cu ideea de a lega complexitatea sarcinii de numărul de operații care trebuie efectuate pentru a obține succesul. Aceste definiții ale dificultății și dificultății sunt în mare parte psihologice; sunt utile în analiza psihologică a conținutului elementelor testate.

Mulți ani, măsura tradițională a dificultății fiecărei sarcini a fost proporția răspunsurilor corecte din grupul de subiecți, reprezentat de simbolul pj, unde indicele j indică numărul sarcinii de interes (1, 2 etc.) ). De exemplu, dacă răspunsurile corecte ale subiecților la a treia sarcină a testului sunt evaluate cu un punct, iar cele incorecte - cu zero, atunci valoarea indicatorului p 3 poate fi găsită din raportul elementar:

P 3 = R 3 / N,

unde R 3 înseamnă numărul de răspunsuri corecte la această sarcină și N - numărul total de subiecți din grup. Formula generală pentru calcularea proporției răspunsurilor corecte la orice sarcină (j) este, respectiv, a formei

p j = R j / N

Indicator p j. a fost mult timp folosit ca o măsură a dificultății în așa-numita teorie a testului clasic (3). Ulterior, s-a realizat inexactitatea semantică conținută în ea: la urma urmei, o creștere a valorii lui p j nu indică o creștere a dificultății, ci, dimpotrivă, o creștere a ușurinței, dacă un astfel de cuvânt poate fi folosit. Prin urmare, în anul trecut statistica opusă a fost asociată cu indicatorul dificultății sarcinilor - proporția răspunsurilor incorecte (q j). Această cotă se calculează din raportul dintre numărul de răspunsuri incorecte (Wj- de la cuvântul englezesc Greșit - incorect) la numărul de subiecți (N):

q j = W j / N

Se presupune în mod natural că p j + q j = 1. În teoria clasică a testelor, mulți ani au fost luați în considerare doar indicatorii empirici de dificultate. În noile versiuni ale teoriilor psihologice și pedagogice ale testelor, se acordă mai multă atenție naturii activității mentale a elevilor în procesul de finalizare a sarcinilor de testare diferite forme (4).

Conținutul testului nu poate fi doar ușor, mediu sau dificil. Aici se manifestă pe deplin ideea binecunoscută despre dependența rezultatelor metodei aplicate. Sarcinile ușoare de testare creează doar aspectul elevilor care au cunoștințe, deoarece testează cunoștințe minime. În acest sens, se poate observa că orientarea administrației educaționale federale de a verifica nivelul minim de cunoștințe nu oferă și nici nu poate, chiar prin definiție, să dea o idee despre nivelul real de cunoștințe, adică pentru a oferi informațiile de mult timp necesare societății și organismelor guvernamentale. Aceasta denaturează rezultatele testelor și selectarea sarcinilor evident dificile, ca urmare a cărora majoritatea școlarilor au subestimat scorurile. Un accent pe sarcini dificile este adesea văzut ca un mijloc de creștere a motivației pentru învățare. Cu toate acestea, acest instrument funcționează ambiguu. Sarcinile dificile îi pot împinge pe unii să studieze, alții să se îndepărteze de el. O astfel de orientare distorsionează rezultatele și, ca rezultat, reduce calitatea măsurării pedagogice. Dacă testul este construit strict din sarcini cu dificultăți tot mai mari, atunci acesta deschide calea către crearea uneia dintre cele mai interesante scale de măsurare - scala lui L. Gutman.

La definirea testului, s-a observat deja că toate sarcinile testului, aș dori să subliniez, indiferent de conținutul subiectelor, secțiunilor și disciplinelor academice, sunt aranjate într-o ordine de dificultate tot mai mare. Recomandarea pe scară largă, până de curând, de a include mai multe sarcini de dificultate medie în test este justificată din punctul de vedere al determinării fiabilității măsurătorilor folosind așa-numitele formule. teoria testului clasic. Metodele de evaluare a fiabilității testului existente în această teorie dau o scădere a fiabilității atunci când sarcinile ușoare și dificile sunt incluse în test. În același timp, entuziasmul pentru sarcinile de dificultate medie duce la o deformare gravă a conținutului testului: acesta din urmă își pierde capacitatea de a reflecta în mod normal conținutul disciplinei studiate, în care există întotdeauna material ușor și dificil. Astfel, în căutarea unei fiabilități abstracte teoretic ridicate, se pierde validitatea semnificativă a rezultatelor testului. Dorința de a crește valabilitatea rezultatelor testelor este adesea însoțită de o scădere a preciziei acestora. Acest fenomen este cunoscut în teorie ca paradoxul teoreticianului psihometriei americane F. Lord

Dacă se testează un grup slab de studenți, se dovedește că sarcinile dificile ale testului pur și simplu nu funcționează, deoarece niciun singur elev nu le poate răspunde corect. Astfel de sarcini sunt eliminate din procesarea ulterioară a datelor. Nu sunt oferite în sistemele de control adaptiv. Conținutul testului pentru cursanții slabi va diferi semnificativ de conținutul testului pentru cursanții puternici. Pentru cei din urmă, dimpotrivă, sarcinile ușoare nu funcționează, deoarece toți subiecții cu cunoștințe răspund corect sarcinilor ușoare. Astfel, conținutul testului tradițional variază semnificativ în funcție de nivelul de pregătire al acelor grupuri de studenți, ale căror cunoștințe sunt măsurate prin test.

Cartografierea optimă a conținutului materialului educațional în sarcini de testare a nivelului de dificultate cerut presupune posibilitatea alegerii unei forme adecvate. Conținutul testului este exprimat într-una dintre cele patru forme de bază ale sarcinilor. Acestea sunt: ​​1) sarcini cu alegerea unuia sau mai multor răspunsuri corecte dintre cele oferite; 2) sarcini de formă deschisă, în care subiectul scrie el însuși răspunsul, în locul rezervat pentru aceasta; 3) sarcini pentru stabilirea conformității și 4) sarcini pentru stabilirea succesiunii corecte a acțiunilor.

Literatură

1. Zakharov A.I., Matyushkin A.M. Probleme ale sistemelor de învățare adaptive // ​​Cibernetică și probleme de învățare. - M.: Progres, 1970.- 389s.

2. Landa L.N. Algoritmizarea în predare. M., Iluminism, 1966

3. Gulliksen H. Teoria testelor mentale. N - Y. Wiley. 1950 - 486 p. și multe altele. dr.

4. Tatsuoka, K.K. Construcția articolelor și modelele psihometrice adecvate pentru răspunsul construit. Prinston, N-J, 1993. 56 pp; Frederiksen, N., Mislevy R. J., Bejar I. J. (Eds). Teoria testelor pentru o nouă generație de teste. Lawrence Erlbaum Ass. Publ. 1993, Hillsdale, N-J, 404 pp. si etc .

În articolul anterior, au fost luate în considerare nouă principii de dezvoltare a conținutului testelor pedagogice. Astăzi continuăm să luăm în considerare cel de-al zecelea principiu - dificultatea crescândă a elementelor de testare.

Dacă un test pedagogic este definit pe scurt ca un sistem de sarcini cu dificultăți crescânde, atunci devine clar că dificultatea sarcinilor este cel mai important, să spunem, un indicator de formare a testelor. Mulți lideri de școli cred că profesorii lor sunt capabili să „inventeze” câte „teste” doresc în scurt timp; Eu însumi am citit ordinul pentru școală, unde profesorilor li s-a ordonat să trimită „teste” directorului în termen de trei zile. De fapt, puteți veni cu câte sarcini doriți în formă de test (și acestea nu sunt încă teste). Acestea nu ar trebui incluse într-un test real până când nu se cunoaște o măsură de dificultate verificabilă empiric. Din această cerință, devine clar că o verificare empirică preliminară a fiecărei sarcini este obligatorie, înainte de testare. În timpul procesului de verificare, multe sarcini (de obicei mai mult de jumătate) nu îndeplinesc cerințele impuse acestora și, prin urmare, nu sunt incluse în test. Prima cerință pentru elementele testului: în test, elementele trebuie să difere în ceea ce privește nivelul de dificultate, care rezultă din definiția dată anterior a testului și principiul luat în considerare.

Cititorul atent a surprins probabil deja diferențele în vocabularul celor trei concepte de bază ale teoriei testelor introduse aici, ca și cum ar fi „imperceptibil”: test pedagogic, sarcini în formă de test și sarcini de test. Cerințele pentru prima dintre ele au fost deja luate în considerare în articolul „Definiția unui test pedagogic” (Școala № 30, august 1999).

Este mai bine să introduceți cerințele pentru cel de-al doilea concept acum, după ce a făcut acest lucru cel puțin pe scurt, pentru a nu fi distras de subiectul principal al articolului. Următoarele cerințe sunt impuse sarcinilor în formularul de testare:

  • corectitudinea conținutului
  • forma logică a enunțului;
  • corectitudinea formei;
  • concizie;
  • disponibilitatea unui anumit loc pentru răspunsuri;
  • aranjarea corectă a elementelor sarcinii;
  • aceleași reguli pentru evaluarea răspunsurilor;
  • aceleași instrucțiuni pentru toți subiecții;
  • adecvarea instrucțiunilor la forma și conținutul sarcinii.

O interpretare detaliată a acestor cerințe va urma în articolele următoare, dar acum aș dori să atrag atenția cititorului asupra faptului că nu există cerința unei anumite dificultăți a sarcinii, în timp ce o astfel de cerință este impusă testului și sarcina de testare. Din reflecția asupra acestui material și a materialului publicat anterior, se pot trage două concluzii. Primul este că nu există loc în test pentru sarcini cu un grad necunoscut de dificultate. Și al doilea - că nu toate sarcinile propuse sub formă de test pot deveni sarcini de testare: acestea sunt concepte diferite. În primul concept, cele mai esențiale sunt cerințele de conținut și formă. Pentru sarcinile de testare, în primul rând, este prezentată o cerință de o anumită dificultate, lucru care în mod clar nu este necesar pentru sarcinile din formularul de testare. Sarcinile au șansa de a deveni elemente de testare numai după un test empiric experimentat, să zicem, al măsurii dificultății lor pe grupuri tipice de subiecți.

Indicatorul dificultății testului și a elementelor testului este informativ și formal în același timp. Un indicator semnificativ, deoarece într-un test bun dificultatea poate depinde doar de conținutul și nivelul de pregătire al subiecților înșiși, în timp ce într-un test prost rezultatele încep să fie influențate semnificativ de forma sarcinilor (mai ales dacă nu este adecvat conținutului), organizarea slabă a testării, dacă există posibilitatea de a înșela, scurgeri de informații. Practica controversată a pregătirii țintite pentru testarea centralizată merită o mențiune specială în acest sens.

Componenta formală a indicatorului de dificultate apare atunci când se consideră testarea ca un proces de confruntare între fiecare subiect și fiecare sarcină care i se oferă. Rezultatul rezultat este util să fie luat în considerare ca rezultat al unei astfel de confruntări. Cu o interpretare simplificată a fiecărui caz de confruntare a subiectului cu sarcina următoare, sunt luate în considerare doar două rezultate: victoria subiectului în soluția corectă a sarcinii, unde primește un punct, sau înfrângere, pentru care se acordă zero puncte. Evaluarea rezultatului confruntării depinde de raportul dintre nivelul de cunoștințe al testatorului și nivelul de dificultate al sarcinii, de unitatea de măsură a cunoștințelor aleasă și de regula adoptată anterior (convenția) - ceea ce este considerat un „ victoria "subiectului testului și dacă un egal este acceptabil, dacă vorbim în limba sportului.

Principiul dificultății crescânde este utilizat în prezentarea conținutului multor manuale și manuale, în special pentru acele discipline academice care sunt construite pe principiul cumulativ, ceea ce înseamnă: cunoașterea elementelor ulterioare ale cursului depinde în mod explicit de cunoașterea elementelor educaționale anterioare. . Această structură este inerentă manualelor de matematică, logică, limbi străine, statistici, tehnice și multe alte științe. În ele, conceptele studiate anterior sunt utilizate în mod activ în subiecte ulterioare. Prin urmare, trebuie să studiați astfel de discipline doar de la început și fără lacune.

Majoritatea autorilor, în special cei străini, nu fac distincție între conceptele de „dificultate” și „complexitate”. Mulți dezvoltatori de testare fac același lucru. Cu toate acestea, există lucrări în care aceste concepte sunt definite în moduri diferite. De exemplu, A.N. Zakharov și A.M. Matyushkin observă că gradul de dificultate al unei sarcini de învățare nu coincide cu complexitatea sa. Gradul de complexitate al materialului educațional este caracterizat de saturația reală (obiectivă) a sarcinii educaționale și forma prezentării acesteia, iar gradul de dificultate presupune întotdeauna corelarea materialului educațional care trebuie stăpânit cu materialul educațional asimilat anterior. și capacitățile intelectuale ale studenților (1).

L.N. Landa explică dificultatea problemei educaționale prin faptul că elevii adesea nu cunosc operațiunile care trebuie efectuate pentru a găsi o soluție. Dacă sistemul de operații pentru rezolvarea unei anumite clase de probleme este numit o metodă de soluție, atunci, în opinia sa, dificultatea este asociată cu necunoașterea metodei, cu necunoașterea modului de gândire în procesul de rezolvare, cum și în ce secvență este necesar să se acționeze cu condițiile problemei (2). Dificultățile care apar se explică prin faptul că profesorul încearcă adesea să ofere cunoștințe despre conținutul studiatului și este mult mai puțin preocupat de modul de gândire și raționare (ibid.). Această interpretare se intersectează cu ideea de a lega complexitatea sarcinii de numărul de operații care trebuie efectuate pentru a obține succesul. Aceste definiții ale dificultății și dificultății sunt în mare parte psihologice; sunt utile în analiza psihologică a conținutului elementelor testate.

Mulți ani, măsura tradițională a dificultății fiecărei sarcini a fost proporția răspunsurilor corecte din grupul de subiecți, reprezentat de simbolul pj, unde indicele j indică numărul sarcinii de interes (1, 2 etc.) ). De exemplu, dacă răspunsurile corecte ale subiecților la a treia sarcină a testului sunt evaluate cu un punct, iar cele incorecte - cu zero, atunci valoarea indicatorului p3 poate fi găsită din raportul elementar

unde R3 indică numărul de răspunsuri corecte la sarcina dată, iar N reprezintă numărul total de subiecți din grup. Formula generală pentru calcularea proporției răspunsurilor corecte la orice sarcină (j) este, respectiv, a formei

Indicator pj. a fost mult timp folosit ca o măsură a dificultății în așa-numita teorie a testului clasic (3). Ulterior, s-a realizat inexactitatea semantică conținută în ea: la urma urmei, o creștere a valorii pj indică nu o creștere a dificultății, ci, dimpotrivă, o creștere a ușurinței, dacă un astfel de cuvânt poate fi folosit. Prin urmare, în ultimii ani, statistica opusă - proporția de răspunsuri incorecte (qj) - a fost asociată cu indicatorul dificultății sarcinii. Această cotă se calculează din raportul dintre numărul de răspunsuri incorecte (Wj- de la cuvântul englezesc Greșit - incorect) la numărul de subiecți (N):

Se presupune în mod natural că pj + qj = 1. În teoria clasică a testelor, timp de mulți ani au fost luați în considerare doar indicatorii empirici de dificultate. În noile versiuni ale teoriilor psihologice și pedagogice ale testelor, sa acordat o atenție sporită naturii activității mentale a elevilor în procesul de îndeplinire a sarcinilor de testare de diferite forme (4).

Conținutul testului nu poate fi doar ușor, mediu sau dificil. Aici se manifestă pe deplin ideea binecunoscută despre dependența rezultatelor metodei aplicate. Sarcinile ușoare de testare creează doar aspectul elevilor care au cunoștințe, deoarece testează cunoștințe minime. În acest sens, se poate observa că orientarea administrației educaționale federale de a verifica nivelul minim de cunoștințe nu oferă și nici nu poate, chiar prin definiție, să dea o idee despre nivelul real de cunoștințe, adică pentru a oferi informațiile de mult timp necesare societății și organismelor guvernamentale. Aceasta denaturează rezultatele testelor și selectarea sarcinilor evident dificile, ca urmare a cărora majoritatea școlarilor au subestimat scorurile. Un accent pe sarcini dificile este adesea văzut ca un mijloc de creștere a motivației pentru învățare. Cu toate acestea, acest instrument funcționează ambiguu. Sarcinile dificile îi pot împinge pe unii să studieze, alții să se îndepărteze de el. O astfel de orientare distorsionează rezultatele și, ca rezultat, reduce calitatea măsurării pedagogice. Dacă testul este construit strict din sarcini cu dificultăți tot mai mari, atunci acesta deschide calea către crearea uneia dintre cele mai interesante scale de măsurare - scala lui L. Gutman.

La definirea testului, s-a observat deja că toate sarcinile testului, aș dori să subliniez, indiferent de conținutul subiectelor, secțiunilor și disciplinelor academice, sunt aranjate într-o ordine de dificultate tot mai mare. Recomandarea pe scară largă, până de curând, de a include mai multe sarcini de dificultate medie în test este justificată din punctul de vedere al determinării fiabilității măsurării folosind așa-numitele formule. teoria testului clasic. Metodele de evaluare a fiabilității testului existente în această teorie dau o scădere a fiabilității atunci când sarcinile ușoare și dificile sunt incluse în test. În același timp, entuziasmul pentru sarcinile de dificultate medie doar duce la o deformare gravă a conținutului testului: acesta din urmă își pierde capacitatea de a reflecta în mod normal conținutul disciplinei studiate, în care există întotdeauna material ușor și dificil. Astfel, în căutarea unei fiabilități teoretic ridicate, se pierde validitatea semnificativă a rezultatelor testului. Dorința de a crește valabilitatea rezultatelor testelor este adesea însoțită de o scădere a preciziei acestora.

Dacă un grup slab de studenți este testat, se dovedește că sarcinile dificile ale testului pur și simplu nu funcționează, deoarece niciun singur elev nu le poate răspunde corect. Astfel de sarcini sunt eliminate din procesarea ulterioară a datelor. Nu sunt oferite în sistemele de control adaptiv. Conținutul testului pentru cursanții slabi va diferi semnificativ de conținutul testului pentru cursanții puternici. Pentru cei din urmă, dimpotrivă, sarcinile ușoare nu funcționează, deoarece toți subiecții cu cunoștințe răspund corect sarcinilor ușoare. Astfel, conținutul testului tradițional variază semnificativ în funcție de nivelul de pregătire al acelor grupuri de studenți, măsurarea cunoștințelor cărora se adresează testul.

Cartografierea optimă a conținutului materialului educațional în sarcini de testare a nivelului de dificultate cerut presupune posibilitatea alegerii unei forme adecvate. Conținutul testului este exprimat într-una dintre cele patru forme de bază ale sarcinilor. Acestea sunt: ​​1) sarcini cu alegerea unuia sau mai multor răspunsuri corecte dintre cele oferite; 2) sarcini de formă deschisă, în care subiectul scrie el însuși răspunsul, în locul rezervat pentru aceasta; 3) sarcini pentru a stabili conformitatea și 4) sarcini pentru a stabili succesiunea corectă a acțiunilor.

Acasă> Teste

Articolul 7. Dificultatea testului și elementele testate

În articolul precedent, au fost luate în considerare nouă principii pentru dezvoltarea conținutului testelor pedagogice. Astăzi continuăm să luăm în considerare cel de-al zecelea principiu - dificultatea crescândă a elementelor de testare. Dacă un test pedagogic este definit pe scurt ca un sistem de sarcini cu dificultăți crescânde, atunci va deveni clar că dificultatea sarcinilor este cel mai important, să spunem, un indicator de formare a testelor. Mulți lideri de școli cred că profesorii lor sunt capabili să „inventeze” câte „teste” doresc în scurt timp; Eu însumi am citit ordinul pentru școală, unde profesorilor li s-a ordonat să trimită „teste” directorului în termen de trei zile. De fapt, puteți veni cu câte sarcini doriți în formă de test (și acestea nu sunt încă teste). Acestea nu ar trebui incluse într-un test real până când nu se cunoaște o măsură de dificultate verificabilă empiric. Din această cerință, devine clar că o verificare empirică preliminară a fiecărei sarcini este obligatorie, înainte de testare. În timpul procesului de verificare, multe sarcini (de obicei mai mult de jumătate) nu îndeplinesc cerințele impuse acestora și, prin urmare, nu sunt incluse în test. Prima cerință pentru elementele testului: în test, elementele trebuie să difere în ceea ce privește nivelul de dificultate, care rezultă din definiția dată anterior a testului și principiul luat în considerare. Cititorul atent a surprins deja diferențele în vocabularul celor trei concepte de bază ale teoriei testelor introduse aici, așa cum ar fi „imperceptibil”: test pedagogic, sarcini în formă de test și sarcini de test. Cerințele pentru prima dintre ele au fost deja discutate în articolul „Definiția unui test pedagogic” (Școala № 30, august 1999). Este mai bine să introduceți cerințele pentru cel de-al doilea concept acum, după ce a făcut acest lucru cel puțin pe scurt, pentru a nu fi distras de subiectul principal al articolului. Următoarele cerințe sunt impuse sarcinilor în formularul de testare:

    corectitudinea conținutului; forma logică a enunțului; corectitudinea formei; concizie; disponibilitatea unui anumit loc pentru răspunsuri; aranjarea corectă a elementelor sarcinii; aceleași reguli pentru evaluarea răspunsurilor; aceleași instrucțiuni pentru toate subiectele; adecvarea instrucțiunilor la forma și conținutul sarcinii.
O interpretare detaliată a acestor cerințe va urma în articolele următoare, dar acum aș dori să atrag atenția cititorului asupra faptului că nu există cerința unei anumite dificultăți a sarcinii, în timp ce o astfel de cerință este impusă testului și sarcina de testare. Din reflecția asupra acestui material și a materialului publicat anterior, se pot trage două concluzii. Primul este că nu există loc în test pentru sarcini cu un grad necunoscut de dificultate. Și al doilea - că nu toate sarcinile propuse sub formă de test pot deveni sarcini de testare: acestea sunt concepte diferite. În primul concept, cele mai esențiale sunt cerințele de conținut și formă. Pentru sarcinile de testare, în primul rând, este prezentată o cerință de o anumită dificultate, lucru care în mod clar nu este necesar pentru sarcinile din formularul de testare. Sarcinile au șansa de a deveni elemente de testare numai după un test empiric experimentat, să zicem, al măsurii dificultății lor pe grupuri tipice de subiecți. Indicatorul dificultății testului și a elementelor testului este informativ și formal în același timp. Un indicator semnificativ, deoarece într-un test bun dificultatea poate depinde doar de conținutul și nivelul de pregătire al subiecților înșiși, în timp ce într-un test prost rezultatele încep să fie influențate semnificativ de forma sarcinilor (mai ales dacă nu este adecvat conținutului), organizarea slabă a testării, dacă există posibilitatea de a înșela, scurgeri de informații. Practica controversată a pregătirii țintite pentru testarea centralizată merită o mențiune specială în acest sens. Componenta formală a indicatorului de dificultate apare atunci când se consideră testarea ca un proces de confruntare între fiecare subiect și fiecare sarcină care i se oferă. Rezultatul rezultat este util să fie luat în considerare ca rezultat al unei astfel de confruntări. Cu o interpretare simplificată a fiecărui caz de confruntare a subiectului cu sarcina următoare, sunt luate în considerare doar două rezultate: victoria subiectului în soluția corectă a sarcinii, unde primește un punct, sau înfrângere, pentru care se acordă zero puncte. Evaluarea rezultatului confruntării depinde de raportul dintre nivelul de cunoștințe al testatorului și nivelul de dificultate al sarcinii, de unitatea de măsură aleasă a cunoștințelor și de regula adoptată anterior (convenția) - ceea ce este considerat o „victorie” a subiectului testului și dacă o remiză este acceptabilă, dacă vorbim în limba sportului. Principiul dificultății crescânde este utilizat în prezentarea conținutului multor manuale și manuale, în special pentru acele discipline academice care sunt construite pe principiul cumulativ, ceea ce înseamnă: cunoașterea elementelor ulterioare ale cursului depinde în mod explicit de cunoașterea elementelor educaționale anterioare. . Această structură este inerentă manualelor de matematică, logică, limbi străine, statistici, tehnice și multe alte științe. În ele, conceptele studiate anterior sunt utilizate în mod activ în subiecte ulterioare. Prin urmare, trebuie să studiați astfel de discipline doar de la început și fără lacune. Majoritatea autorilor, în special cei străini, nu fac distincție între conceptele de „dificultate” și „complexitate”. Mulți dezvoltatori de testare fac același lucru. Cu toate acestea, există lucrări în care aceste concepte sunt definite în moduri diferite. De exemplu, A.N. Zakharov și A.M. Matyushkin observă că gradul de dificultate al unei sarcini de învățare nu coincide cu complexitatea sa. Gradul de complexitate al materialului educațional este caracterizat de saturația reală (obiectivă) a sarcinii educaționale și forma prezentării acesteia, iar gradul de dificultate presupune întotdeauna corelarea materialului educațional care trebuie asimilat cu materialul educațional asimilat anterior. și capacitățile intelectuale ale studenților. L.N. Landa explică dificultatea problemei educaționale prin faptul că elevii adesea nu cunosc operațiunile care trebuie efectuate pentru a găsi o soluție. Dacă sistemul de operații pentru rezolvarea unei anumite clase de probleme este numit o metodă de soluție, atunci, în opinia sa, dificultatea este asociată cu ignoranța metodei, cu necunoașterea modului de gândire în procesul de rezolvare, cum și în ce secvență este necesar să se acționeze cu condițiile problemei. Dificultățile care apar se explică prin faptul că profesorul încearcă adesea să ofere cunoștințe despre conținutul celor studiați și este mult mai puțin preocupat de modul de gândire și raționare. Această interpretare se intersectează cu ideea de a lega complexitatea sarcinii de numărul de operații care trebuie efectuate pentru a obține succesul. Aceste definiții ale dificultății și dificultății sunt în mare parte psihologice; sunt utile în analiza psihologică a conținutului elementelor testate. Mulți ani, măsura tradițională a dificultății fiecărei sarcini a fost proporția răspunsurilor corecte din grupul de subiecți, reprezentat de simbolul pj, unde indicele j indică numărul sarcinii de interes (1, 2 etc.) ). De exemplu, dacă răspunsurile corecte ale subiecților la a treia sarcină a testului sunt evaluate cu un punct, iar cele incorecte - cu zero, atunci valoarea indicatorului p3 poate fi găsită din raportul elementar:

Unde Rsub> 3 înseamnă numărul de răspunsuri corecte la această sarcină, iar N este numărul total de subiecți din grup. Formula generală pentru calcularea proporției răspunsurilor corecte la orice sarcină (j) este, respectiv, de forma:

Indicator P j. a fost mult timp folosit ca o măsură a dificultății în așa-numita teorie a testului clasic. Ulterior, s-a realizat inexactitatea semantică conținută în ea: la urma urmei, o creștere a valorii pj indică nu o creștere a dificultății, ci, dimpotrivă, o creștere a ușurinței, dacă un astfel de cuvânt poate fi folosit. Prin urmare, în ultimii ani, statistica opusă - proporția răspunsurilor incorecte (q j) - a fost asociată cu indicatorul dificultății sarcinii. Această proporție se calculează din raportul dintre numărul de răspunsuri incorecte (W j - de la cuvântul englezesc Greșit - incorect) la numărul de subiecți (N):

Se presupune în mod natural că p j + q j = 1. În teoria clasică a testelor, mulți ani au fost luați în considerare doar indicatorii empirici de dificultate. În noile versiuni ale teoriilor psihologice și pedagogice ale testelor, se acordă mai multă atenție naturii activității mentale a elevilor în procesul de îndeplinire a sarcinilor de testare de diferite forme. Conținutul testului nu poate fi doar ușor, mediu sau dificil. Aici se manifestă pe deplin ideea binecunoscută despre dependența rezultatelor metodei aplicate. Sarcinile ușoare de testare creează doar aspectul elevilor care au cunoștințe, deoarece testează cunoștințe minime. În acest sens, se poate observa că orientarea administrației educaționale federale de a verifica nivelul minim de cunoștințe nu oferă și nici nu poate, chiar prin definiție, să dea o idee despre nivelul real de cunoștințe, adică pentru a oferi informațiile de mult timp necesare societății și organismelor guvernamentale. Aceasta denaturează rezultatele testelor și selectarea sarcinilor evident dificile, ca urmare a cărora majoritatea școlarilor au subestimat scorurile. Un accent pe sarcini dificile este adesea văzut ca un mijloc de creștere a motivației pentru învățare. Cu toate acestea, acest instrument funcționează ambiguu. Sarcinile dificile îi pot împinge pe unii să studieze, alții să se îndepărteze de el. O astfel de orientare distorsionează rezultatele și, ca rezultat, reduce calitatea măsurării pedagogice. Dacă testul este construit strict din sarcini cu dificultăți tot mai mari, atunci acesta deschide calea către crearea uneia dintre cele mai interesante scale de măsurare - scala lui L. Gutman. La definirea testului, s-a observat deja că toate sarcinile testului, aș dori să subliniez, indiferent de conținutul subiectelor, secțiunilor și disciplinelor academice, sunt aranjate într-o ordine de dificultate tot mai mare. Recomandarea pe scară largă, până de curând, de a include mai multe sarcini de dificultate medie în test este justificată din punctul de vedere al determinării fiabilității măsurării folosind așa-numitele formule. teoria testului clasic. Metodele de evaluare a fiabilității testului existente în această teorie dau o scădere a fiabilității atunci când sarcinile ușoare și dificile sunt incluse în test. În același timp, entuziasmul pentru sarcinile de dificultate medie doar duce la o deformare gravă a conținutului testului: acesta din urmă își pierde capacitatea de a reflecta în mod normal conținutul disciplinei studiate, în care există întotdeauna material ușor și dificil. Astfel, în căutarea unei fiabilități teoretic ridicate, se pierde validitatea semnificativă a rezultatelor testului. Dorința de a crește valabilitatea rezultatelor testelor este adesea însoțită de o scădere a preciziei acestora. Dacă un grup slab de studenți este testat, se dovedește că sarcinile dificile ale testului pur și simplu nu funcționează, deoarece niciun singur elev nu le poate răspunde corect. Astfel de sarcini sunt eliminate din procesarea ulterioară a datelor. Nu sunt oferite în sistemele de control adaptiv. Conținutul testului pentru cursanții slabi va diferi semnificativ de conținutul testului pentru cursanții puternici. Pentru cei din urmă, dimpotrivă, sarcinile ușoare nu funcționează, deoarece toți subiecții cu cunoștințe răspund corect sarcinilor ușoare. Astfel, conținutul testului tradițional variază semnificativ în funcție de nivelul de pregătire al acelor grupuri de studenți, măsurarea cunoștințelor cărora se adresează testul. Cartografierea optimă a conținutului materialului educațional în sarcini de testare a nivelului de dificultate cerut presupune posibilitatea alegerii unei forme adecvate. Conținutul testului este exprimat într-una dintre cele patru forme de bază ale sarcinilor. Aceasta:

    sarcini cu alegerea unuia sau mai multor răspunsuri corecte dintre cele propuse; sarcinile într-o formă deschisă, în care subiectul scrie el însuși răspunsul, în locul desemnat pentru aceasta; sarcini pentru stabilirea conformității; sarcini pentru a stabili succesiunea corectă a acțiunilor.

Articolul 8. Cerințe logice pentru conținutul testului

Elementele de testare diferă de articolele non-testate nu numai prin conținut, ci și prin stilul de a construi o propoziție. Ambiguitatea este complet eliminată din elementul testat, atunci când, de exemplu, subiectul din cazul nominativ este ușor confundat cu obiectul direct din caz acuzativ(ca „mama iubește fiica”). În plus, uneori un element de testare este identificat din greșeală cu o ghicitoare. Deși în ambele cazuri sarcina este de a găsi răspunsul corect, similitudinea notată nu este suficientă pentru a identifica puzzle-ul și elementul testat. Există semne care le separă în mod clar. Pentru o enigmă, cea mai importantă trăsătură distinctivă este metaforicitatea, figurativitatea enigmei. Se știe că o expresie devine metaforică atunci când este utilizată nu în sens direct, ci în sens figurativ. Dimpotrivă, sarcina de testare este întotdeauna autologă: folosește cuvintele numai în sensul lor direct, imediat. Stilul autologic este cel despre care V. Mayakovsky a scris: „Căutăm o vorbire precisă și goală”. Sarcina de testare este formulată din termeni exacți și nu conține niciodată o metaforă, ci un cuvânt suplimentar și un semn suplimentar. Un exemplu de sarcină formulată metaforic într-o formă de test deschis: „___________ este considerat tatăl fiziologiei ruse”. Articolele anterioare au examinat cerințele pedagogice pentru conținutul testelor. Acum este timpul să luăm în considerare principiile logice ale determinării conținutului unui test pedagogic. În logică, astfel de legi ale gândirii corecte sunt cunoscute ca legile identității, non-contradicția, al treilea motiv exclus și motiv suficient. Acest lucru face posibilă identificarea unor astfel de proprietăți de bază ale gândirii corecte precum certitudinea, consistența și validitatea. În ceea ce privește teoria și practica testelor, aceste proprietăți generale ale gândirii corecte dobândesc funcțiile unor regulatori specifici ai activității de testare, în urma cărora dobândesc semnificația principiilor. Să le luăm în considerare mai detaliat. 1. Certitudinea conținutului testului Certitudinea conținutului testului formează subiectul măsurării pedagogice. În cazul unui test omogen, apare întrebarea cu privire la încrederea că toate sarcinile testului testează cunoștințele tocmai pentru un anumit disciplina academica, și nu pentru altele. Destul de des se întâmplă ca răspunsurile corecte la unele sarcini să necesite cunoașterea nu numai a disciplinei de interes, ci și a unui număr de alte discipline, de obicei conexe și precedente. Apropierea și coeziunea cărora face dificilă determinarea exactă a obiectului cunoștințelor măsurate. De exemplu, o mulțime de cunoștințe matematice sunt utilizate în calculele fizice și, prin urmare, sistemul de cunoștințe fizice include de obicei matematica care este utilizată în rezolvarea problemelor fizice. Eșecul în calculele matematice dă naștere la eșecul răspunsului la elementele de testare fizică. Se acordă un scor negativ, respectiv, pentru ignoranța fizicii, deși subiectul a făcut greșeli de natură matematică. Dacă un astfel de test include multe astfel de sarcini care pentru decizie corectă necesită nu atât cunoștințe fizice, cât capacitatea de a efectua calcule complicate, acesta poate fi un exemplu de conținut definit inexact al unui test de fizică. Cu cât este mai puțin intersecția cunoștințelor unei discipline academice cu cunoștințele alteia, cu atât conținutul disciplinei academice este mai clar exprimat în test. Cerința conținutului este necesară și în toate celelalte teste. Într-un test eterogen, acest lucru se realizează separând în mod explicit sarcinile de la o disciplină academică la o scară separată. În același timp, există adesea sarcini care funcționează bine nu numai pentru unul, ci și pentru doi, trei și chiar Mai mult solzi. În orice sarcină de testare se determină în prealabil care este considerat fără echivoc răspunsul la sarcină, cu ce grad de completitudine ar trebui să fie răspunsul corect. Definirea unui concept prin enumerarea elementelor care nu sunt incluse în el nu este permisă. Luați în considerare un exemplu de sarcină deschisă, în care subiectului i se cere, în locul unei liniuțe, să completeze afirmația cu răspunsul său: PUNCTUL ESTE CE NU AU ______________. În minte apare întrebarea: „Nu are ce? Răspunsul, potrivit lui Euclid, este „un punct nu are părți”, dar acesta este doar un caz de definiție nereușită a conținutului atât al unei sarcini, cât și al conceptului de punct. După cum știți, un punct nu are , de exemplu, culoare, gust, miros și multe altele și un rol semnificativ în formarea testului ca sistem îl are cerința corectitudinii logice a sarcinilor incluse în test. După cum sa menționat în literatura de specialitate, corectitudinea formulării sarcinilor de testare se realizează atunci când sunt îndeplinite următoarele condiții:

    proporționalitatea volumului conceptului definitoriu cu volumul celui definit. Exemple cunoscute în literatură:
    1. O QUETRANGLE CU TOATE LATURILE EGALE SE NUME ________________ (răspunsul este un romb).
    2. UN RECTANGUL CARE TOATE LATURILE SUNT EGALE SE NUME ______________ (răspunsul este un pătrat). Dacă răspunsul „pătrat” este dat primei sarcini, este permisă o discrepanță: volumul definitoriu - patrulater - este mai mare decât volumul definiției - pătratul. lipsa tautologiei. Exemple:
    3. COSTUL MARFURILOR ESTE DETERMINAT DE COSTUL ____________ (răspunsul este munca);
    COSTUL MUNCII ESTE DETERMINAT DE COSTUL ________________ (răspunsul este bunurile).
    După cum sa menționat deja, în aceste exemple se dezvăluie o încălcare a regulilor logice; o valoare este determinată prin cealaltă, care la rândul său trebuie determinată; forma afirmativă a elementului testat. Exemple:
    4. DACĂ AL DOILEA ETAP ESTE REDUSĂ ÎN LADA MAJOR, VA FI O LAD
    1) Dorian
    2) Frigian
    3) Lydian
    5. ELEMENTUL PRINCIPAL AL ​​VOPSEI KHOKHLOMA ESTE
    1) mugur
    2) rosean
    3) kudrina
    4) kupavka În exemplele date, răspunsurile sunt selectate pe o bază specifică; ele enumeră respectiv fretele și elementele picturii. Lipsa unui teren comun duce la o inconsecvență logică între conținutul sarcinii și răspunsurile. De exemplu, în misiune:
    6. ELECTRONUL MUTAT ÎN CÂMP MAGNETIC ESTE FORȚAT
    1) pandantiv
    2) Lorenz
    3) Ampere
    4) Coriolis
    5) gravitația
    al cincilea răspuns nu se potrivește cu numele fizicianului. Acest răspuns nu corespunde conținutului celorlalte răspunsuri și, prin urmare, poate fi considerat incorect; ar trebui să conțină numele unui alt fizician celebru, așa cum se face mai jos:
    7. FONDATORUL TEORIEI CANTULUI
    1) Bourne
    2) Einstein
    3) Heisenberg
    4) Bor
    5) Rutherford
2. Coerența conținutului sarcinilor Coerența conținutului sarcinilor necesită să nu apară judecăți cu privire la același gând care îl afirmă și îl neagă simultan. Existența a două răspunsuri exclusive la același articol de testare este inacceptabilă. Dacă subiecților li se oferă instrucțiunea: „Încercuiți numărul răspunsului corect”, iar apoi unul dintre răspunsuri afirmă că nu există un răspuns corect, atunci acest lucru creează un exemplu de inconsecvență în gândirea dezvoltatorului testului. În unele teste, există răspunsuri care nu au deloc legătură cu conținutul sarcinii. Astfel de răspunsuri sunt destul de ușor recunoscute de subiecți ca fiind eronate și, prin urmare, testul se dovedește a fi ineficient. Pentru a crește eficiența, testul este testat preliminar pe un eșantion tipic de subiecți. Și dacă se găsesc astfel de răspunsuri la sarcini pe care subiecții nu le aleg deloc, atunci astfel de răspunsuri sunt eliminate din test. Pentru că nu îndeplinesc funcția așa-numiților distractori, concepuți pentru a distrage atenția subiecților ignoranți de la răspunsul corect. În plus, astfel de distractori sunt dăunători testului, deoarece reduc precizia măsurătorilor (dar mai multe despre acest lucru în articolele în care vor fi luate în considerare problemele privind fiabilitatea testului). 3. Rationabilitate Valabilitatea conținutului articolelor testate înseamnă că acestea au motive pentru adevăr. Rationabilitatea se referă la argumentele care pot fi aduse în favoarea uneia sau altei formulări a elementelor testate. În absența argumentelor probatorii în favoarea corectitudinii sarcinii formulate, aceasta nu este inclusă în test, sub niciun pretext. Același lucru se întâmplă dacă cel puțin un contraargument apare în cursul discuției experților sau este permisă o condiție în care această afirmație se poate dovedi ambiguă sau falsă. Ideea validității conținutului testului este strâns legată de principiul corectitudinii conținutului articolelor testate, care a fost deja menționat în articolul anterior. Amintiți-vă că testul include doar conținutul disciplinei academice care este obiectiv adevărat și care se pretează la o argumentare rațională. În consecință, nu este recomandat ca punctele de vedere controversate, care sunt destul de acceptabile în știință, să fie incluse în conținutul articolelor testate. Neadevărul conținutului articolelor de testare diferă de incorectitudinea formulării lor. Incertitudinea, așa cum sa menționat mai sus, este determinată de răspunsul corespunzător, în timp ce o sarcină formulată incorect poate produce răspunsuri corecte și incorecte, sau chiar poate provoca confuzie. Aceasta include, de asemenea, sarcini formulate inexact sau ambiguu, care generează mai multe răspunsuri corecte sau corecte condiționat. Prin urmare, devine necesară introducerea unor condiții de adevăr suplimentare, care prelungesc sarcina în sine și complică semantica acesteia. Incorectitudinea formulării se constată de obicei în procesul de discutare a conținutului sarcinilor cu profesori-experți cu experiență. Succesul unei astfel de discuții este posibil dacă se creează un mediu cultural adecvat, unde sunt permise numai judecăți constructive și tactice. Din păcate, experiența convinge că acest lucru nu este adesea cazul. Între timp, doar o discuție comună și prietenoasă a materialelor de către dezvoltatori și experți poate crea o atmosferă de căutare a celor mai bune opțiuni pentru conținutul testului. Această căutare este aproape fără sfârșit și nu există un adevăr final.

În plus față de cele trei proprietăți enumerate ale gândirii logice corecte, observăm încă o cerință pentru sarcinile de testare, pe atât de formală pe cât de semnificativă. Aceasta este o cerință pentru concizia articolelor de testare. Brevitatea este asigurată de o selecție atentă a cuvintelor, simbolurilor, graficelor, permițând un minim de mijloace pentru a obține o claritate maximă a conținutului semantic al sarcinii. Sunt excluse repetițiile, obscure, rareori folosite, precum și simbolurile necunoscute studenților, cuvintele străine care complică percepția sensului. Numărul aproximativ de cuvinte din sarcină este de cinci până la nouă, dar, în general, cu cât este mai puțin cu atât mai bine. De exemplu:
PUTEREA ESTE
1) vector
2) scalar

Este bine când sarcinile conțin nu mai mult de o propoziție subordonată. După cum a remarcat celebrul lingvist A.M. Peshkovsky, acuratețea și ușurința înțelegerii cresc pe măsură ce compoziția verbală a frazei scade și subsolul său mut crește. Cu cât mai puține cuvinte, cu atât mai puține neînțelegeri. O modalitate bună de a ține o sarcină scurtă este să întrebi un lucru. Cazurile frecvent întâlnite de sarcini împovărătoare cu cerințele de a găsi ceva, de a rezolva și apoi de a explica acest lucru afectează negativ calitatea sarcinii și testul în ansamblu, deși din punct de vedere pedagogic este ușor de înțeles motivul formulării unor astfel de sarcini . Dacă în astfel de sarcini un elev decide ceva fără un profesor, atunci îi explică ceva, atunci există o conjugare a metodei obiective cu cea subiectivă, plus la aceasta - dificultăți cu note atunci când decide ce punct să dea. În schimb, una dintre cerințele importante ale testului este de a avea reguli de notare pre-dezvoltate fără participarea unui profesor.

Articolul 9. Cunoașterea ca subiect al controlului testului

Ce înseamnă să știi? Asta, prietene, este întrebarea.
Goethe. Faust.

Cunoştinţe Acum nu știm mult mai multe despre cunoaștere decât știam despre ea în vremea lui Goethe. Știința educației nu s-a ocupat de acest fenomen sau a făcut foarte puțin, destul de ciudat. Confirmarea acestui fapt este lipsa definiției conceptului de „cunoaștere” și a materialelor conexe din manualele pedagogice. Între timp, formarea unui sistem de cunoaștere în rândul elevilor este cel mai important scop al procesului educațional, o problemă cardinală a pedagogiei. La rândul său, lipsa unui sistem de cunoaștere în disciplina studenților face imposibilă crearea unui test complet pentru măsurarea cunoștințelor. Un astfel de caz a avut loc odată la verificarea unei variante a testului asupra istoriei Patriei pentru testarea centralizată. Istoria problemei cunoașterii datează de secole. Primele dovezi documentare ale unui studiu sistematic al cunoașterii sunt asociate cu numele lui Pitagora și Socrate. Pitagora a moștenit de la preoții egipteni, unde a studiat, așa-numita tradiție ezoterică a atitudinii față de cunoaștere. În conformitate cu această tradiție, cunoștințele ar trebui transmise de către profesor din gură în gură, și nu tuturor, ci doar elevilor vrednici (dedicați). Socrate, dimpotrivă, nu s-a considerat niciodată profesor, a fost un susținător al cunoașterii publice deschise. În dialogurile sale, Socrate a ridicat în repetate rânduri problema esenței cunoașterii, legătura cunoașterii cu ignoranța, ignoranța, cu inteligența, moralitatea, opinia, ideile și abilitățile. Spre deosebire de sofiștii laudați în mod deschis, Socrate nu se grăbea să-și arate înțelegerea. Nici el nu a fost un disput, deși, se pare, s-a aruncat adesea în discuția despre această problemă. Abilitatea sa de a afla esența subiectului prin intermediul unei serii de întrebări consecutive, în procesul unei conversații întâmplătoare, Socrate a numit, în glumă, arta „moașei”. Istoria a păstrat rezultatele căutărilor sale pentru noi în lucrările Dialogurilor lui Platon și Amintirile lui Xenofon. De exemplu, în dialogul „Menon” al lui Platon, se face distincția între conceptele de „cunoaștere” și „opinie”. Acest lucru se face pe exemplul cunoașterii drumului spre oraș și gândirii despre cunoașterea drumului. Opinia se caracterizează prin faptul că o persoană își asumă corect locul unde se află acest drum, dar nu a mers niciodată pe el și nu îl cunoaște (1; vol. 1, p. 406.). Cunoașterea aceluiași drum diferă de opinia despre acesta, deoarece o persoană a mers deja pe el și are, ca să spunem așa, experiență empirică. De asemenea, observă că, în ceea ce privește semnificația practică, opinia nu poate fi inferioară cunoștințelor. Oricine are părerea corectă despre unde trece drumul poate duce oamenii în acest oraș nu mai puțin cu succes decât cineva care cunoaște acest drum. Socrate a ridicat o întrebare actuală despre tipurile de cunoștințe, ca răspuns la care interlocutorul său evidențiază două tipuri de cunoștințe. La primul clasifică geometria, astronomia, numărarea și muzica, iar la al doilea - meșteșugul unui cizmar și alte meșteșuguri; „La urma urmei, ele nu sunt altceva decât cunoașterea modului de a face pantofi, ustensile din lemn sau alte obiecte” (2, pp. 225-226). Acum putem spune că primul dintre aceste tipuri seamănă mai mult cu cel teoretic, iar al doilea seamănă mai mult cu cunostinte practice... Ne-am aștepta ca esența cunoașterii să fie exprimată în definițiile științifice ale acestui concept. Dar dezamăgirea așteaptă aici. De exemplu, în dicționarul enciclopedic filosofic, cunoașterea este definită în termeni generali: ca rezultat al procesului de cunoaștere a realității, verificat de practica social-istorică și certificat de logică, reflectarea sa adecvată în mintea umană sub formă de idei, concepte, judecăți, teorii. O altă definiție a cunoașterii este prea generală și scurtă: cunoașterea este informații despre lumea înconjurătoare și despre persoana însuși (3; 190). Cunoaștere și minte Se crede că cunoașterea este legată de minte. Dar deja din vremea lui Heraclit din Efes se știa că „cunoașterea minții nu învață”. Unele cunoștințe pot fi dobândite chiar și cu o minte slabă, iar altele - numai cu o minte înaltă. Dacă trecem de la utilizarea cuvântului „minte” la echivalentul său științific „inteligență”, atunci se poate observa că viteza de asimilare a materialului educațional, precum și rezultatele testării cunoștințelor, depind de inteligență. De obicei, cu cât inteligența este mai mare, cu atât mai multe cunoștințe. Scoruri mai mari și teste, dar nu întotdeauna. Totul depinde de conținutul sarcinilor. În fiecare sală de clasă pot exista copii dezvoltați intelectual care, totuși, știu puțin din cauza refuzului lor de a studia bine. Inteligența copiilor, conform unor date, este de aproximativ 36% asociată cu nivelul de dezvoltare intelectuală a mamelor și doar 26% - cu nivelul aceleiași dezvoltări al taților. În teoriile străine moderne, este cunoscut un astfel de factor de inteligență precum „mintea critică”. Parcă anticipând aceste teorii, celebrul doctor rus V.M. Bekhterev spunea în 1905 că școala ar trebui să aibă grijă nu atât de mult de memorarea de rutină a formelor gata făcute, împrumutate în cea mai mare parte din clasici, cât și de dezvoltarea unei personalități amatori cu o minte critică și o atitudine independentă față de realitatea înconjurătoare. La examenele de admitere în universități, am auzit adesea despre dorința unor examinatori de a testa nu numai cunoștințele, ci și „abilitățile de gândire”. Cu alte cuvinte, se pune întrebarea despre testarea nu numai a cunoștințelor, ci și a intelectului participanților. Este util să ne amintim că conținutul testelor pentru măsurarea cunoștințelor este semnificativ diferit de conținutul testului minții. Această idee deschide calea către subiectivitate atunci când testează cunoștințele și se transformă prea des într-un club împotriva solicitanților care, în ajunul examenelor, nu iau consultații plătite de la aceiași instructori-examinatori și tutori cu jumătate de normă. Ignoranţă Dificultatea definirii cunoștințelor sugerează un răspuns la întrebarea opusă - ce este ignoranța? Gândul la ignoranță îmi vine în minte ca o lipsă de informații necesare. Dacă o persoană știe că nu știe, atunci cunoașterea unei astfel de ignoranțe nu este cunoaștere? Aceasta este o cunoaștere complet conștientă a lipsei de cunoștințe cu privire la o anumită problemă. În știință, o astfel de situație cognitivă este numită problematică. Există două forme distincte de ignoranță: 1) ignoranța în sensul de a nu fi informat și 2) ignoranță în sensul proprietăților inesențiale ale cunoștințelor dobândite. Prima formă este o stare temporară care încurajează căutarea informațiilor și aceasta este partea sa de stimulare. A doua formă de ignoranță este caracteristică unei educații de calitate slabă, care, în cuvintele lui G. Spencer, promovează mai degrabă răspândirea unor amăgiri plăcute decât adevăruri amare. În acest sens, este adecvat să menționăm încercările de a diferenția predarea, de exemplu, matematica, în conformitate cu două opțiuni „A” și „B”. (4). Aceasta este o abatere de la practica unei singure educații de bază pentru țară, care anterior era oferită de școala de stat generației mai tinere. Dacă mai devreme cunoștințele elevilor difereau în funcție de eforturile lor personale și de calitatea muncii profesorilor și școlilor, acum cunoștințele vor diferi și de versiunea cunoștințelor oferite. Când aceste opțiuni sunt puse în aplicare în viață, răspândirea unor concepții greșite plăcute între o mare parte a elevilor despre cunoștințele lor va fi pusă în circulație. Educația va rămâne învățământul secundar complet doar în nume, iar în conținutul cunoștințelor dobândite va deveni incomparabil. Astfel, diferențierea opțiunilor pentru cursurile de formare deschide de fapt posibilitatea reducerii cerințelor pentru nivelul de educație, de această dată din partea agenției federale pentru gestionarea educației. Dar este necesară această reducere pentru copii și părinții lor, societate și stat? Este departe de a fi o problemă departamentală. În procesul educațional, cunoștințele acumulate sunt aproape întotdeauna, într-un grad sau altul, distorsionate de studenți datorită obiceiului de a simplifica materialul perceput și a lipsei de stăpânire a aparatului conceptual. Puteți vorbi chiar despre o regularitate psihologică și, în acest sens, despre o diferență vizibilă între cunoștințele oferite elevilor din cunoștințele pe care le asimilează de fapt. Aceste diferențe pot deveni deosebit de vizibile cu o inteligență scăzută și o motivație scăzută a elevilor. Un alt motiv pentru denaturarea cunoștințelor propuse în rândul studenților mai în vârstă este luarea de note extinse, care îi distrage atenția de la înțelegerea esenței problemelor prezentate. Această din urmă împrejurare îl determină, de exemplu, pe autorul acestor rânduri în lucrarea sa cu profesorii să ofere note de curs structurate pentru cursul său și să vizualizeze prezentarea tuturor materialelor de bază, ceea ce conferă un efect didactic pozitiv (5). De asemenea, puteți vorbi despre o astfel de formă de ignoranță care nu se realizează și, prin urmare, se referă la cunoașterea implicită. Este, parcă, o formă de „ignoranță a cunoașterii”. Filosoful M. Polani crede că cunoașterea implicită nu este fixată într-un mod logic și se manifestă (se transmite) numai în procesul comunicării umane. Intuitia poate fi atribuita si formei cunoasterii tacite, care este definita ca un mod de a intelege adevarul prin discretia sa fara justificare. Mult mai rău este cazul când o persoană crede că știe, dar nu știe că nu știe. Acest caz este destul de comun. Precede amăgirea și, în unele circumstanțe, chiar până la ignoranță. Ignoranţă Nu întâmplător Socrate a opus cunoașterea nu ignoranței, ci ignoranței, argumentând că există un singur bun - cunoașterea și că există un singur rău - ignoranța. Se pune întrebarea - de ce? Poate pentru că ignoranța nu interferează cu dobândirea cunoștințelor și uneori chiar contribuie la aceasta, în timp ce ignoranța este un adevărat rău în ceea ce privește dobândirea cunoștințelor. T. Hobbes a subliniat un motiv al ignoranței: „Există un defect în minte”, a scris el, „care constă în a fi imun la învățare. Acest neajuns, aparent, provine din falsa opinie a persoanei în cauză că știe deja adevărul despre obiectul în cauză ... Cauza imediată a imunității la cunoaștere este, prin urmare, prejudecată, iar cauza directă a prejudecății este o opinie falsă. .. despre propriile cunoștințe ”(6) Elevii cu acest tip de prejudecăți sunt, aparent, în fiecare școală. Ignoranța apare din combinația de ignoranță, lipsă de cultură și maniere proaste. Nu este doar individul. Ignoranța apare ca rezultat al unui anumit model de organizare socială a societății. Nu este temporar sau accidental; există o ignoranță deliberată și conștientă, implantată de un mecanism bine unsat conceput pentru a facilita triumful ignoranței (7). Așa cum V.M. Bekhterev, „... cel mai important lucru care ne-a salvat de ignoranță”, a scris el, „este un anumit rest al timpului liber din studiile gimnaziale, pe care noi, insistând, mai ales în clasele superioare ale gimnaziului, le-am dedicat citind cărți străine. " Oamenii cunoscuți și talentați suferă mai mult din ignoranță decât alții. Autorul compoziției pedagogice „Orașul Soarelui” T. Campanella (1568-1639) este cunoscut în istorie. A fost închis 27 de ani (unde a scris această carte) sub acuzația că „știe ce nu a fost învățat”. În vremurile noastre, se pare că au încetat să mai închidă oameni cu cunoștințe pentru astfel de condiții, dar au învățat să-i împingă deoparte prin trucuri birocratice.

Articolul 10. Cunoașterea ca subiect al controlului testului

Conceptul de cunoaștere Articolul anterior a analizat trei concepte: cunoaștere, ignoranță și ignoranță. Dintre aceste concepte, testarea pedagogică se bazează numai pe cunoaștere; în același timp, ignoranța este privită într-un mod destul de simplificat ca o alternativă la cunoaștere. Deși s-a arătat deja că încă din vremea lui Socrate, cunoașterea se opune nu ignoranței, ci ignoranței. Nivelul ignoranței și ignoranței poate fi greu măsurat datorită vagii și infinitului lumii, care este format din particula negărilor „nu” cu cuvinte diferite. În timp ce conceptele „știu” și „responsabil” pot fi corelate cu un set specific de elemente care formează un set de semne ale unei proprietăți date la subiecți. Astfel, principala dificultate în măsurarea cunoștințelor constă în conceptualizarea generală a acestui fenomen. Aceasta este ceea ce lipsește în mod clar în știința pedagogică. În absența unui concept general de cunoaștere, dezvoltatorii de teste încep să își construiască propria înțelegere a esenței cunoașterii, în raport cu disciplina academică cu predarea de care se ocupă. Astfel, devin - sau încep să se citească singuri - experți. Există semne pe baza cărora cred alții; că experții știu ce înseamnă să știi: acesta este nivelul și calitatea educației generale și profesionale pe care au primit-o, experiență didactică, indicatori de performanță, lucrări științifice și metodologice, recunoaștere de la manageri. Din păcate, în perioada sovietică și mai ales în perioada post-sovietică, un număr considerabil de incompetenți au învățat să dobândească reputația de experți fără a fi astfel, în esență. Acest lucru a fost realizat prin construirea unui sistem de relații reciproc avantajoase cu oficiali superiori, apărarea unor disertații false, scrierea „lucrărilor științifice” colective, precum și împrumuturi necerimonioase din lucrările oamenilor cunoscuți. Este vorba despre un fel de gardieni roșii, cunoscuți din istoria modernă a Chinei, după care țara a fost aruncată înapoi în multe direcții timp de decenii. Acolo, multe, dacă nu toate, trebuiau refăcute din nou. O perioadă similară a venit acum în Rusia. În scopul măsurării pedagogice, conceptual, se pot distinge patru domenii principale ale cunoașterii: cunoașterea lumii, cunoașterea oamenilor, cunoașterea de sine și cunoașterea modurilor de a acționa. Mai mult, este util să împărțiți aceste patru sfere în știința naturii și sfera umanitară a cunoașterii și apoi să le împărțiți în funcție de ramurile practicii, în funcție de științe. De exemplu, cunoștințele științifice sunt împărțite în filologice, matematice, istorice, fizice, chimice etc. Dar nu toate cunoștințele sunt științifice. Pe lângă acestea, există straturi de cunoștințe pre-științifice și extra-științifice, obiective și subiective. Cunoștințele non-științifice diferă de metodele științifice de obținere, stocare și transfer. Metodele științifice oferă comparativ mai multă obiectivitate, confirmabilitate și reproductibilitate a cunoștințelor. Rezultatele unor astfel de domenii de activitate precum magia, astrologia, numerologia, chiromanța și doctrina spațiului de locuit, levitația și clarviziunea, precum și multe altele pot fi atribuite celor extrac științifice. Statutul cunoștințelor religioase este considerat controversat, deși existența sa în textele religioase și influența sa asupra conștiinței multor oameni nu poate fi pusă la îndoială. Principalul criteriu pentru a distinge cunoștințele pre-științifice de cele științifice este măsura validității lor raționale: cu cât o astfel de validitate este mai mare, cu atât mai multe cunoștințe susțin că sunt științifice. Cogniția rațională este un mod uman complex, inerent de a reflecta realitatea prin gândire. Se caracterizează prin: dependența de rezultatele reflectării senzoriale, medierea prin sentimente; abstractitatea și generalitatea imaginilor emergente; reproducerea obiectelor la nivel de entități, conexiuni și relații interne regulate. Principalele forme de cunoaștere rațională includ concepte, judecăți, inferențe, legi, ipoteze, teorii. Cunoștințele academice sunt desprinse în mod vizibil de proces cunoștințe științifice, ordonat, subordonat, exprimat într-un limbaj accesibil elevilor și, în cele din urmă, prezentat în manual într-o varietate de sarcini care însoțesc manualul și studierea procesului... Într-un sens, cunoștințele educaționale sunt obiective și subiective în același timp. Fiind obiective în general, enunțate în texte științifice și în materiale educaționale, ele se transformă în cunoaștere subiectivă în procesul asimilării lor. În același timp, una sau alta distorsiune subiectivă a cunoștințelor propuse are loc aproape întotdeauna. Cunoașterea poate fi, de asemenea, obiectiv adevărată și obiectiv falsă. Cunoașterea falsă apare ca urmare a denaturării și, mai mult, ca rezultat al propagandei deliberate din partea grupurilor interesate, partide, asociații etc. În principiu, corpurile educaționale nu diseminează cunoștințe false în mod obiectiv, cu excepția unor ideologeme și mituri politice în schimbare combinate cu cunoștințe obiective sau parțial obiective în domeniul istoriei, filozofiei, religiei, științelor politice și altele asemenea, referite la științele umaniste. Cunoașterea obiectivă falsă există sub formă de ignoranță, pseudo-cunoaștere și doar minciuni. Au existat multe cunoștințe false la cursurile de istorie. Prin urmare, nu este o coincidență faptul că manualele de istorie trebuiau (și probabil că trebuie să fie) schimbate mai des decât altele. Unele cunoștințe pot fi semnificative sau nu semnificative. În acest din urmă caz, putem vorbi despre o neînțelegere a esenței. Dimpotrivă, înțelegerea, conform Z.I. Kalmykova este o penetrare mentală în esența realității cognitive, abstractizarea și generalizarea legilor sale. De asemenea, ea distinge mai multe niveluri de înțelegere. Primul nivel este elementar - ca act de citire a unui text, în procesul căruia există o tranziție de la semne grafice la cuvinte și propoziții. Al doilea nivel de înțelegere - lexical - stabilește legături între cuvinte și obiectele și fenomenele realității care le corespund, fără a ține cont de conținutul textului în ansamblu. La al treilea nivel - sintactic - sensul cuvintelor este specificat în funcție de conexiunile lor formale și logice din propoziție (1, p. 84-105). Cunoaștere, cultură, moralitate și educație Conceptul de cunoaștere nu poate fi considerat în afara problemelor culturale. „Cultura, adevărata cultură”, scria omul de știință și scriitor francez Jean Rostand, „este mult mai mică decât se crede în mod obișnuit, este legată de acumularea de date factuale. Este mai degrabă o abilitate bine cunoscută de a înțelege, refracta, gândi. A fi cult nu înseamnă să îți umpli creierul cu numere, date, nume. Acesta este un nivel de judecată, o exactitate logică, o dorință de dovezi, o înțelegere a complexității lucrurilor și a dificultății problemelor ridicate. Este capacitatea de îndoială, de simț al proporției, de modestie de judecată și toleranță față de ignoranță. Aceasta este credința că „nu poți avea niciodată dreptate până la capăt”. Legătura dintre cunoaștere și cultură este reglementată de așa-numitul sentiment al proporției. China antică o persoană perfectă era considerată pe bună dreptate una care știa să se oprească la ceea ce nu știa. Un exemplu de încălcare a sensului notat al proporției poate fi găsit în istoria recentă a pedagogiei sovietice. În el, fiecare element al cunoștințelor educaționale, în cadrul așa-numitei educații educaționale, trebuia să formeze devotament față de anumite idei, persoane și o convingere de neclintit în corectitudinea tuturor cunoștințelor oferite (adesea forțate), care erau adesea realizat, de altfel, într-o formă vulgarizată. Este puțin probabil ca cineva să susțină că studiul științei nu are întotdeauna un impact educațional pozitiv asupra studenților. Educația fără creștere este periculoasă atât pentru individ, cât și pentru societate. Articolele anterioare au remarcat deja convingerea vechilor preoți egipteni și a membrilor ordinii pitagoreicilor că, pentru binele societății, numai oamenii vrednici și decenți ar trebui inițiați în secretele științelor. Aceeași idee este confirmată în așa-numita filozofie a hermetismului, care subliniază că „progresul” înțeles în mod fals al umanității dă naștere titanilor minții și pigmeilor spiritului, oameni cu o conștiință și o sensibilitate plictisitoare (2). Această situație a fost exprimată cel mai clar de filosoful rus I. A. Ilyin. „Educația fără creștere nu se formează, ci dezlănțuie și strică o persoană, deoarece aceasta îi oferă la dispoziție oportunități vitale, abilități tehnice, pe care el, fiind lipsit de spirit, începe să le abuzeze”. Clasificări ale tipurilor de cunoștințe Există multe încercări de clasificare a tipurilor de cunoștințe, dar nu există una care să satisfacă pe deplin nevoile practice. De exemplu, cunoașterea lui I.Ya. Lerner a inclus termeni și concepte, fapte, legi și teorii, cunoștințe metodologice (cunoașterea metodelor), cunoștințe evaluative, cunoștințe abstracte și concrete, cunoștințe empirice și teoretice (3). O încercare de a construi o clasificare a cunoștințelor folosind mai multe baze de diviziune a fost făcută de E.T. Dyrankova (4). Ierarhia tipurilor de cunoaștere a școlarilor se găsește în opera lui V.P. Maksakovsky. Cel mai înalt loc în ierarhia sa este ocupat de cunoașterea legilor șia regularităților științifice. Aceasta este urmată de cunoașterea teoriilor științifice, paradigme, concepte, ipoteze, concepte generale și individuale, termeni, fapte. Această serie este închisă prin reprezentări (5, p. 6). În opera clasică a lui B. Bloom și a colegilor săi (6), se disting trei domenii ale activității educaționale și o ierarhie a nivelurilor de pregătire. V cognitiv sfera de acolo sunt formulate următoarele niveluri: 1. Cunoașterea, permițând reproducerea faptelor, listarea numelor fenomenelor și obiectelor studiate. Totul aici se bazează pe reproducerea informațiilor memorate; 2. Înțelegerea cunoștințelor reproduse. O modalitate bună de a testa înțelegerea este de a cere elevilor să reproducă materialul în propriile lor cuvinte, să ofere exemple; 3. Aplicarea cunoștințelor, mai ales într-o situație nouă; 4. Capacitatea de a analiza și sintetiza semnele; 5. Abilitatea de a evalua, de a trage o concluzie generală. Acesta este cel mai înalt nivel de fitness. În sfera psihologic iasă în evidență:

    percepția indicațiilor individuale, a semnelor, a răspunsului la acestea;

    manifestarea interesului pentru informațiile de care aveți nevoie;

    organizarea, structurarea informațiilor primite, sistematizare;

    capacitatea de a ierarhiza informațiile primite pe niveluri.

V psihomotorie sferă:

  • idee despre cum să acționezi;

    disponibilitatea de a efectua acțiuni sub îndrumarea unui profesor;

    executarea independentă a acțiunilor.

La aceste bine-cunoscute clasificări, autorul acestui articol adaugă și propria listă de tipuri de cunoștințe, formulată exclusiv pentru rezolvarea problemelor de măsurare pedagogică. Dar mai multe despre asta în articolul următor.

La pregătirea colecției s-au folosit materiale

Doctor în științe pedagogice, profesor Vadim Avanesov

Pregătit de A.N. Oshmarin,

metodolog al centrului educațional și metodologic

Departamentul de Educație al administrației de stat a districtului Dzhankoy,

Capitolul 1 - Teste: Istorie și teorie

1. Din adâncurile secolelor ……………………………………………… .1

2. Sfârșitul secolului al XIX-lea …………………………………………………… 4

3. Începutul secolului XX ………………………………………………… .6

4. Tendințe ale secolului al XX-lea …………………………………………… ... 8

5. Perioada sovietică ……………………………………………… 11

6. Anii cincizeci …………………………………………… ... 14

7. Sistemul de asimilare completă a cunoștințelor …………………………… .17

Capitolul doi - Teste: teorie și metodologie pentru dezvoltarea lor

1. Începutul teoriei. Atitudinea față de teste ……………………….… 20

2. Definiția testului pedagogic ………………………… ..23

3. Teste tradiționale ………………………………………… ..26

4. Teste netradiționale ………………………………………… ..29

6. Principii pentru dezvoltarea conținutului testului ……………………… ..37

7. Dificultatea testului și a elementelor testate ………………………… .40

Document

Adesea, elevii pun întrebarea: de ce trebuie să studiem istoria sociologiei, să știm ceva care este pentru totdeauna un lucru din trecut și care este greu de folosit în activitățile curente? Nu ar fi mai bine să începem imediat studiind metodele și principiile dezvoltării tehnologiilor sociale,

mob_info