Potrei essere in grado di rispondere a questa domanda da un background in psicometria. Dove lavoro produciamo molti test che sono tutti standardizzati e poi equiparati per essere messi sulla stessa scala. Queste scale, tuttavia, da un test all'altro, non sono correlate, a meno che, naturalmente, i due diversi test non abbiano completato uno studio di equiparazione per determinare il fattore di spostamento per trasferire una scala da, ad esempio, Test 1 alla scala del Test 2.
Per costruire una scala, analizziamo prima i dati del test, quindi i dati di risposta degli studenti e i dati dell'elemento (domanda). Facciamo l'analisi utilizzando il modello Rasch, che prende in considerazione solo due variabili, le abilità degli studenti e le difficoltà degli item. Questo ci permette di costruire un set di dati che contiene i livelli logit delle abilità degli studenti e delle difficoltà degli oggetti.
Definizione di Logit:
Un logit è un'unità di misurazione per riportare le differenze relative tra le stime delle capacità candidate e le difficoltà degli oggetti. I log sono un livello di misurazione dell'intervallo uguale, il che significa che la distanza tra ogni punto della scala è uguale (1-2 = 99-100).
Una volta create le tabelle logit possono essere usati per creare una scala applicando una semplice trasformazione lineare, come:
punteggio scala = 10 * difficoltà logit + 250
In alcuni del lavoro che svolgo abbiamo punteggi di scala che in realtà sono inferiori a 0, tuttavia la maggior parte del lavoro che svolgo, i punteggi di scala sono costruiti in modo tale che il minimo sia intorno a 200 circa. La costruzione della scala è per la maggior parte del tutto arbitraria.
Se desideri vedere come vengono calcolati i logit di studenti e oggetti, leggi:
https://en.wikipedia.org/wiki/Rasch_model#The_mathematical_form_of_the_Rasch_model_for_dichotomous_data
Anche come nota extra: ci sono altri modelli per fare analisi di test, come il 2PL (introduce un parametro aggiuntivo al modello Rasch (1PL), la discriminazione degli elementi), il 3PL (introduce un parametro aggiuntivo al 2PL, che è un fattore di ipotesi, questo crea una probabilità minima di ottenere l'articolo errato che dipende dal valore della tua ipotesi), c'è anche un 4PL che aggiunge un parametro aggiuntivo (lo slip paremeter, che crea una probabilità di soffitto, che non è 1, per ottenere un articolo corretto).
Spero che questo aiuti e fornisca alcune informazioni extra che potrebbero essere utili.