Domanda:
Valuto gli esami insieme a un collega ma non sono d'accordo con il loro voto. Cosa dovrei fare?
Bollehenk
2018-10-24 12:30:27 UTC
view on stackexchange narkive permalink

Recentemente ho valutato esami (50 pz.) insieme a un collega di un altro dipartimento. Mi sentivo come se il mio collega stesse assegnando troppi punti per risposte errate / incomplete. Ad esempio, assegnare punti solo per scrivere le informazioni sulla domanda (valore e unità di parametri) sul foglio delle risposte; o l'assegnazione di punti per aver copiato una delle formule sul foglio delle formule nel foglio delle risposte mentre non è specificatamente descritta nel modello di valutazione

Durante la valutazione degli esami ne ho discusso con il mio collega e ho deciso di seguire principalmente il suo "sistema di assegnazione dei punti" in modo da non creare una classificazione ingiusta tra i sottogruppi della popolazione totale. In seguito, ne ho discusso di nuovo, ma mi sembra che il mio collega non voglia cambiare il suo stile di valutazione.

Quali sono i prossimi passi che potrei fare? È necessario che l'intera università abbia lo stesso stile di valutazione?

ps: Il corso è tenuto dal loro dipartimento e da quest'anno ho aiutato perché si sovrappone alla mia esperienza. Ha un tasso di superamento del ~ 50%.

ps2: Non è che il suo sistema di assegnazione dei punti sia così lento che gli studenti con un 3/10 riceveranno improvvisamente un 6/10, ma cambierà sicuramente esito del superamento del corso per alcuni studenti.

Perché ritieni che il tuo collega stia dando troppi punti?Le persone non saranno d'accordo, questo è solo un dato di fatto nella vita e, a meno che tu non possa fornire argomenti validi e oggettivi perché lui sia troppo `` perso '' (cosa che immagino sia impossibile quando si valuta in quanto persone diverse valutano parti diverse in una risposta in modo diverso), suonacome se tu dovessi accettare di non essere d'accordo
Esempi sono: assegnazione di punti per la semplice scrittura delle informazioni sulla domanda (valore e unità di parametri) sul foglio delle risposte.O assegnare punti per la copia di una delle formule sul foglio delle formule nel foglio delle risposte mentre non è specificamente descritto nel modello di valutazione.
@Bollehenk - a che livello di studio si sta svolgendo?Assegnare voti parziali per identificare le tecniche corrette (formule) non sembra * necessariamente * irragionevole, sebbene l'estrazione dei valori / unità possa essere discutibile a seconda della quantità di lavoro che sarebbe necessaria per estrarli e del livello di studio.
È altrettanto valido per lui venire qui e fare la stessa domanda ma dire che "stai assegnando troppo pochi punti per risposte errate / incomplete"?
Sarebbe utile sapere in che campo si trova. La soggettività è molto più alta in alcune discipline (Classica, Filosofia) rispetto ad altre (Ingegneria meccanica ... ecc.).
@J ... dato che gli esempi sono valori, unità, parametri e formule, azzarderei un'ipotesi su un campo STEM.
Cosa penseresti di un altro dipartimento che ti chiedesse di cambiare il modo in cui valuti i tuoi corsi?
@Kevin Non ho visto nulla al riguardo nella domanda, ma ora vedo che è stato notato nei commenti.Probabilmente dovresti modificare quei dettagli nella domanda.
Sette risposte:
Ben
2018-10-24 14:43:35 UTC
view on stackexchange narkive permalink

Invita ogni persona a valutare domande diverse, non studenti diversi .

La coerenza nella valutazione è importante ed è ingiusto per gli studenti se la loro i voti dipendono sostanzialmente dall'assegnazione del loro lavoro a un selezionatore. Per questo motivo, se devi dividere i compiti di valutazione con un altro collega per un particolare elemento di valutazione, è meglio dividere i compiti di valutazione per le domande piuttosto che dividere il voto degli studenti . Quindi, ad esempio, una persona valuta Q1-3 su tutti i documenti e l'altra persona valuta Q4-6 su tutti i documenti . In questo modo ogni studente viene valutato dalla stessa persona per la stessa domanda. (Logisticamente, ognuno di voi dovrebbe valutare le proprie domande su metà dei fogli, quindi scambiare.)

Sembra che questa nave abbia già navigato e che tu abbia commesso l'errore da principiante di dividere la valutazione per gli studenti, con persone diverse che contrassegnano studenti diversi. Sembra anche che tu abbia provato a discuterne con il tuo collega, ma hai esaurito i tentativi di cambiare la sua valutazione . In tal caso, anche se il tuo stile di valutazione è superiore a quello del tuo collega, l'adattamento al suo livello di valutazione per questa valutazione è probabilmente una seconda migliore opzione ragionevole, semplicemente per mantenere la coerenza del livello dei voti assegnati . In futuro, cerca di evitare il problema tutti insieme suddividendo la valutazione in domande anziché in studenti.

Devo essere d'accordo qui, dividere le domande è MOLTO meglio che dividere gli studenti, e ho provato entrambe le cose in passato.
In realtà è una meraviglia che questo metodo non sia obbligatorio / applicato dall'università
Nel primo esame di matematica che ho scritto, la valutazione è stata effettuata in meno di 24 ore utilizzando una "catena di montaggio", con ogni AT che valutava una domanda.Una volta che la prima AT ha valutato la prima domanda del primo esame, la seconda AT può iniziare a lavorare sulla seconda domanda del primo esame, i tempi di risposta sono ridotti al minimo e nessun esame scivola da nessuna parte nel processo di scambio.L'assistente personale del prof ha poi solo riassunto i punti e il prof ha firmato l'esame.
Un mio amico sta facendo l'AT in Canada e usa esattamente questo sistema.Infatti i fogli di carta vengono scansionati, un software divide le immagini in diverse domande e una delle domande viene assegnata a un TA e fanno la valutazione online in parallelo, quindi chi è più veloce non deve aspettare gli altri AT prima di otteneregli esami da valutare.Ovviamente richiede un ottimo sistema per la scansione e la suddivisione altrimenti non è fattibile.
Proprio per questo motivo, utilizziamo fogli di risposta pinzati in cui ciascuno la risposta a ciascuna domanda deve essere fornita su un foglio separato.Dopo che gli esami sono stati consegnati, separiamo gli esami e distribuiamo le domande ai selezionatori, in modo che un selezionatore riceva tutti i fogli con una domanda particolare
@damian Grazie per avermi finalmente fatto capire perché ho dovuto scrivere il mio nome / ID su ogni pagina di (alcuni) miei esami.
La coerenza nella valutazione è (quasi) impossibile IMHO.La sua presunzione è una presunzione.Ma - dividere le domande è davvero una buona cosa da fare.
@mbrig non è necessariamente solo perché molte persone contrassegnano pagine separate, mettere il tuo nome su ogni foglio garantisce che se una pagina si allenta per qualsiasi motivo può ancora essere abbinata allo studente corretto.
Vale la pena sottolineare che questo non è ancora l'ideale: se l'esame presenta domande di tipo A e B e si correggono solo i tipi B, può accadere che studenti con livello di abilità simile, ma uno sia buono in A e uno lo siabravo in B, prendi voti abbastanza diversi.Quindi, se possibile, credo che sia bene cercare di non dividere le domande in base al tipo di domanda
@David alcuni motivi per cui questo approccio non è obbligatorio.Uno è che per classi numerose (molte centinaia) non è fattibile.Un altro è che avere più marcatori consente la moderazione, evitando che una domanda venga valutata in un modo completamente diverso dalle altre.Ma se hai più marcatori di una domanda, devi avere uno schema di valutazione che sia concordato da tutti i marcatori e rispettato (sebbene possa evolversi man mano che si incontrano risposte valide diverse).
@DaveCousineau potrebbe essere, ma se ti viene chiesto di fare un esercizio per pagina -o qualcosa di simile- immagino che il commento precedente sia giusto ...
Sebbene questo risolva gli aspetti pratici degli studenti che ottengono lo stesso voto sulla stessa domanda, non risolve il problema del fatto che lo schema di valutazione dell'altra persona è insoddisfacente in primo luogo;né risolve il problema attualmente a portata di mano: due persone valutano la stessa domanda con metodi diversi.Questa soluzione impedirebbe questo problema, ma non lo risolverà una volta che si è verificato
R.M.
2018-10-24 20:04:24 UTC
view on stackexchange narkive permalink

È l'istruttore registrato il responsabile ultimo della conduzione del corso, inclusa la valutazione *. Poiché sembra che tu non sia l'istruttore del record, ma piuttosto solo qualcuno che sta aiutando a valutare, non è proprio il tuo compito determinare quale sia o non sia la valutazione appropriata.

Se hai un disaccordo con un altro selezionatore su come valutare gli esami e non può risolverlo utilizzando le informazioni già fornite (hai detto che il modello di valutazione era insufficiente per farlo), quindi è opportuno parlarne con la persona responsabile di quel corso ( l'istruttore del record), e guarda cosa dicono al riguardo.

Ora certamente non vuoi disturbarli su ogni piccolo dettaglio della valutazione, ma se si tratta di differenze su larga scala, dove filosofico le differenze su come condurre la valutazione cambierebbero sostanzialmente i voti degli studenti, questo è esattamente il genere di cose che la persona responsabile del corso dovrebbe mediare.

Tieni presente che le cose diventano un po 'più complesse quando si tratta di un corso tenuto da un team, dove ci sono un certo numero di istruttori "primari". Tuttavia, in queste situazioni è normalmente il caso in cui ogni istruttore prende l'iniziativa su un determinato argomento. In quanto tali, dovrebbero essere considerati l'opinione primaria su questioni specifiche del loro argomento. (Le preoccupazioni che riguardano più argomenti dovrebbero essere decise con il consenso reciproco degli istruttori "primari".)


*) A condizione che alcuni corsi debbano soddisfare gli standard di dipartimento o di accreditamento. Ma anche in questi casi, è l'istruttore di registrazione che è responsabile di assicurarsi che tali standard siano seguiti.

Questa risposta sembra confondere la nozione amministrativa di responsabilità con la nozione accademica di responsabilità.In termini semplici, non mi piacciono le valutazioni ingiuste e la cattiva pratica accademica nei miei moduli anche se non sono un leader formale del modulo.
@DmitrySavostyanov Non sto certo insinuando che dovresti sopportare pratiche sleali o che non dovresti assumerti la responsabilità accademica delle tue azioni se non sei l'istruttore del record.Sto solo dicendo che la persona che è responsabile in ultima analisi di come viene gestito il corso è la persona con il suo nome sul catalogo del corso.- La domanda dell'OP è una delle due persone che hanno oneste differenze filosofiche su come interpretare una rubrica ambigua.Stavo solo facendo notare che dovrebbero consultare la persona responsabile della rubrica.
kwah
2018-10-25 05:02:02 UTC
view on stackexchange narkive permalink

Nel mio istituto è tipico raddoppiare il 20% delle domande ai fini della standardizzazione / moderazione.

Ciò potrebbe significare che l'80% ottiene un contrassegno singolo e il 20% riceve un contrassegno doppio potrebbe significare che due marker valutano il 60% ciascuno (2x una sovrapposizione del 10%). Per le valutazioni di basso peso questa è vista come una best practice raccomandata, pur essendo obbligatoria per le valutazioni di peso elevato.

Se tali accordi per la standardizzazione / moderazione dei voti non esistono all'interno del tuo istituto, forse vale la pena suggerire che questo (o qualcosa di simile) sia implementato.

Senza conoscere il proprio dipartimento, è difficile dire se sia appropriato (o fattibile) suggerire che sia implementato per la tua attuale coorte di contributi, altrimenti fai parte di una spinta per implementare un cambiamento più ampio.


Alcune note sul processo, per i curiosi:

Dove c'è una differenza tra più marcatori per ogni singolo invio, spetta ai marcatori stabilirsi su un punteggio concordato. Laddove non è possibile stabilire un punteggio concordato, viene inoltrato al dipartimento per la mediazione.

Se viene identificata una differenza significativa tra più indicatori in più invii, l'intera coorte deve essere contrassegnata due volte (e qualsiasi differenza nel punteggio deve essere riconciliata come descritto sopra). Il nostro parametro di riferimento per una "differenza significativa" è una deviazione media (correzione)> = 7%.

einpoklum
2018-10-25 04:06:50 UTC
view on stackexchange narkive permalink

In primo luogo, il suggerimento di @ Ben di dividere la valutazione verticalmente anziché orizzontalmente - domande piuttosto che studenti - è buono e pratico indipendentemente da qualsiasi altra cosa.

Detto questo, suggerisco consideri quanto segue:

  1. Abbandona la fantasia, o forse meglio, la presunzione, che la valutazione sia coerente. Non lo è, a causa di un'infinità di fattori: esami non di difficoltà costante; la distribuzione delle capacità della popolazione studentesca non è sincronizzata con la definizione della curva di valutazione; il senso di gravità degli errori differisce per la stessa persona per i primi incontri e per gli ultimi incontri; gli umori cambiano; pregiudizi inconsci (ad esempio: contro persone con una calligrafia sciatta); e così via.
  2. Prova a programmare una discussione sulla politica di valutazione di tutti i selezionatori e gli autori dell'esame, prima che venga dato il prossimo esame (il prossimo semestre?). In questa discussione, fai apparire alcuni scenari specifici che richiedono un giudizio più preciso piuttosto che semplicemente "quanti punti per quale domanda".
  3. Considera l'idea di discutere per una valutazione più grossolana nel corso. Sono un fan di Pass / Fail (o Pass / Fail / Eccellente) e non mi piacciono le scale numeriche, in particolare 0..100 o i voti frazionari. Posso essere sicuro di guardare qualcuno e dire "Sì, hai capito quello che abbiamo insegnato qui, passa". oppure "No, non capisci - fallisci". E se qualcuno è borderline, allora è una questione di politica se superarlo o fallirlo (io personalmente tenderei a fallire). Ma non posso davvero giustificare il motivo per cui qualcuno è un 63 mentre un'altra persona è un 64,7. Sento di aiutare solo qualche meccanismo industriale arbitrario di manipolazione di massa assegnando questo tipo di numeri alle persone.

PS: questi tre suggerimenti sono per lo più ortogonali.

"* Rinuncia alla [fantasia / presunzione] che la valutazione sia coerente. Non è *".Infatti.Questo è sottorappresentato, in questo thread ma anche nelle università.La valutazione può influire sugli anni di vita di qualcuno: non tutti sono o un A etero o un fallimento completo, quindi per molti studenti queste differenze hanno un impatto.Di solito andava bene per me personalmente, ma ho visto così tanti studenti lavorare sodo e poi fallire un corso mentre i loro coetanei passavano, anche se quei coetanei avevano la stessa probabilità di essere migliori quanto peggiori.Non solo lo stile / i pregiudizi di valutazione, anche lo studio delle pagine giuste crea varianza.
@Luc: Penso che tu stia spiegando come la valutazione non sia sempre _pertinente_, piuttosto che non _consistente_.Stavo parlando della classificazione del lavoro presentato che si potrebbe sostenere è della stessa qualità e rappresenta la stessa padronanza del materiale.
La valutazione è incoerente, ma è una cosa negativa.È meglio cercare di aumentare la consistenza piuttosto che diminuirla.
fjack
2018-10-26 05:19:14 UTC
view on stackexchange narkive permalink

Le risposte che hai già ottenuto sono davvero eccellenti. Volevo solo aggiungere una piccola osservazione. Dici di aver valutato questi esami

con un collega di un altro dipartimento

e che

Il corso è tenuto dal loro dipartimento e da quest'anno ho aiutato perché coincide con la mia esperienza

Per tua stessa ammissione, tu sono, più o meno, ospiti nel loro dipartimento, che fanno loro un favore aiutandoli Ciò significa che i voti, in definitiva, non sono una tua responsabilità .

Dmitry Grigoryev
2018-10-24 20:25:07 UTC
view on stackexchange narkive permalink

Se un numero significativo di lavori completi è stato valutato da persone diverse, potresti prendere in considerazione l'aggiunta di una correzione in modo che i lavori eseguiti da ciascun selezionatore abbiano lo stesso voto medio (e, idealmente, la stessa varianza). Questo non elimina tutte le incongruenze, ma almeno rende la valutazione statisticamente equa.

Suona bene in teoria, ma come ci si arriva?
L'equità statistica è utile solo per i rapporti statistici.Per gli studenti è necessario spiegare perché i punti vengono assegnati / tolti, nonché fornire feedback utili e suggerimenti per miglioramenti.
afrothetics
2018-10-26 03:23:29 UTC
view on stackexchange narkive permalink

Un'ottima discussione e mi piace leggere i commenti. Come studente universitario, ho affrontato pregiudizi, estremi in due casi, nella valutazione durante i miei primi 2 anni. Solo grazie alla perseveranza e al tutoraggio di due professori sono riuscito a superarlo. Pertanto, il principio guida nella mia carriera di insegnante era quello di lasciare che gli studenti riuscissero o fallissero in base ai propri meriti .

Come @einpokum, ho detestato la curva a campana credendo che fosse sia antiquata che ingiusta. Un gorilla nella stanza è il fatto che alcuni studenti in ogni campus, principalmente attraverso varie organizzazioni, in particolare quelle di lettere greche, hanno accesso a esami e documenti rispetto agli studenti non collegati. Come studente laureato ho perso una serie di documenti valutati da professori che li lasciavano fuori dagli uffici dipartimentali. E, come professore, ho stabilito che un paio di documenti che mi sono stati sottoposti erano stati plagiati. Proteggere l'equità della valutazione degli studenti è una responsabilità istituzionale.

Nella mia esperienza, dopo il mio primo anno di insegnamento a livello universitario, ho istituito quello che ho chiamato gradimento dello sviluppo , credendo che gli insegnanti hanno la responsabilità di fornire un quadro in cui tutti gli studenti abbiano un'opportunità di successo. Questo è un concetto che ho imparato quando ero all'asilo da due insegnanti molto intelligenti, e da allora è rimasto nella mia coscienza. La loro applicazione era esclusivamente ambientale. Anche l'approccio che ho usato era ambientale, ma incentrato sulla valutazione degli studenti, ed era in tre fasi:

  1. Gli studenti hanno sostenuto un esame, che è stato valutato da me e successivamente da altri come i numeri degli studenti nei miei corsi generali è aumentato, da meno di 20 all'inizio, a oltre 100.

  2. Una volta conosciuti i voti, gli studenti potevano fare domanda per sostenere nuovamente l'esame per metà i punti per ogni domanda che hanno "perso" nell'esame iniziale. Questi verrebbero aggiunti al loro voto precedente.

  3. Se non sono ancora soddisfatti, potrebbero sostenere un esame orale prima dell'intera classe che poi valuterà il loro rendimento.

Anche se molti hanno optato per # 2, nessuno ha presentato domanda per l'opzione 3. Speravo che almeno uno determinasse come avrebbero risposto gli studenti.

Solo dopo aver completato la seconda fase la classe ha superato l'esame insieme per condividere i propri pensieri su ogni domanda e le risposte attese. Successivamente, questo è stato modificato per consentire agli studenti di superare l'esame con gli assistenti studenti o altri professori a seconda del corso.

Un secondo principio nella mia valutazione, che gli studenti hanno appreso alla fine, era che i tre esami precedenti avevano meno impatto sul voto finale rispetto a come hanno fatto su una finale completa; e che questi esami e la discussione di follow-up sono stati progettati per aiutarli a ottenere risultati migliori in finale. In effetti, uno studente potrebbe fare male in tutti gli altri esami (salvo scarsa frequenza o comunque in mancanza di parametri minimi), ottenere un A in finale e ottenere un A per un voto. Ad alcuni studenti, senza dubbio, è apparso come un regalo, ma hanno ottenuto un voto migliore. Perché? Credevo che le finali fossero progettate non per ottenere una percentuale di un voto in relazione a tutti gli altri criteri, ma per testare ciò che hanno appreso in modo completo sull'argomento del corso. Valutare gli esami finali è stato uno dei miei piaceri di base, così come il caffè gourmet che ho bevuto per superarli. :)

Potrei aggiungere che gli esami non erano gli unici fattori che entrano in una valutazione finale, ma recensioni di libri, rapporti su relatori o attività nel campus pertinenti alla classe o quiz che hanno attivato non facendo domande quando suggerito dalla mia domanda alla fine di ogni lezione - ci sono domande? Come molti di voi, sospetto che l'insegnamento implichi l'apprendimento di concetti complessi e la loro riduzione al livello di terza media in modo che la maggior parte degli studenti dal primo al secondo anno possa comprendere di cosa stiamo parlando.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 4.0 con cui è distribuito.
Loading...