Publicado
2016-06-28

Una aplicación de valores plausibles a la calificación de pruebas estandarizadas vía simulación

An aplication of plausible values to the standaridzed test scoring through simulation

DOI: https://doi.org/10.15332/s2027-3355.2016.0001.03
Michel Felipe Córdoba Perozo

Resumen (es)

El uso de los valores plausibles en evaluaciones estandarizadas de gran escala, desempeña el papel de imputación que se requiere cuando el marco de referenciaes muy grande y cada individuo no aborda la totalidad de los ítems puestos en producción. En dicho caso se recurre a la definición de un diseño por bloques quegarantice una cuota adecuada de individuos evaluados por cada ítem para que elmarco de referencia sea abordado con suficiencia por toda la población objeto deestudio. En general el método de imputación consiste en encontrar la distribución a posteriori del rasgo latente que es asociado a la habilidad del individuo, mediante la ponderación de la distribución que induce el modelo de Teoría de Respuesta al Ítem y una regresión latente asociada a algunas variables medidas en el individuo. El presente escrito muestra un ejemplo de simulación en donde se pueden observar de manera sencilla las bondades que brinda el método en los resultados agregados bajo este esquema de aplicación particular.
Palabras clave (es): valores plausibles, imputación de datos, rasgo latente, pruebas estandarizadas .

Resumen (en)

The use of Plausible Values in large scale standarized tests, develop the role of imputation when the reference framework is too large and each person can not adress the totality of the items in the production. In that case appleal to block design definition that ensures an appropiate share of individuals per item aiming that the framework is addressed smugly across the study population is necessary. In general the imputation methos consist in find the posterior distribution of the feature latent that is associated to the individual hability, by weighting distribution that induces model item response theory and regression associated with some latent variables measured in the individual. This paper shows an example of simulation where you can easily see the advantages offered by the method in the aggregate results of this particle scheme application

Referencias

Aitkin, M. & Aitkin, I. (2011), Statistical Modeling of the National Assessment of Educational Progress, Nueva York: Springer.

Bock, R. D. & Aitkin, M. (1981), ‘Marginal maximum likelihood estimation of item parameters: Application of an em algorithm’, Psychometrika 46(4), 443–459.

Bock, R. D. & Mislevy, R. J. (1982), ‘Adaptive EAP estimation of ability in a microcomputer environment’, Applied psychological measurement 6(4), 431–444.

Gonz´alez, E. & Rutkowski, L. (2010), ‘Principles of multiple matrix booklet designs and parameter recovery in large-scale assessments’, IERI monograph series: Issues and methodologies in large-scale assessments.

Harwell, M. R., Baker, F. B. & Zwarts, M. (1988), ‘Item parameter estimation via marginal maximum likelihood and an em algorithm: A didactic.’, Journal of Educational and Behavioral Statistics .

Hulin, C. L., Drasgow, F. & Parsons, C. K. (1983), Item response theory: Application to psychological measurement., Dow Jones-Irwin, Homewood, IL. Informe técnico SABER 5o. y 9o. 2009 (n.d.), Technical report.

Kass, R. & Steffey, D. (1989), ‘Approximate bayesian inference in conditionally independent hierarchical models (parametric empirical bayes models)’, Journal of the American Statistical Association 84(407), 717–726.

Rubin, D. B. (1991), ‘EM and beyond’, Psychometrika 56(2), 241–254

Dimensions

PlumX

Visitas

1467

Descargas

Los datos de descarga aún no están disponibles.

Cómo citar

Córdoba Perozo, M. F. (2016). Una aplicación de valores plausibles a la calificación de pruebas estandarizadas vía simulación. Comunicaciones En Estadística, 9(1), 55-78 (51. https://doi.org/10.15332/s2027-3355.2016.0001.03