Una aplicación de valores plausibles a la calificación de pruebas estandarizadas vía simulación
An aplication of plausible values to the standaridzed test scoring through simulation
Archivos adicionales
Resumen (es)
El uso de los valores plausibles en evaluaciones estandarizadas de gran escala, desempeña el papel de imputación que se requiere cuando el marco de referenciaes muy grande y cada individuo no aborda la totalidad de los ítems puestos en producción. En dicho caso se recurre a la definición de un diseño por bloques quegarantice una cuota adecuada de individuos evaluados por cada ítem para que elmarco de referencia sea abordado con suficiencia por toda la población objeto deestudio. En general el método de imputación consiste en encontrar la distribución a posteriori del rasgo latente que es asociado a la habilidad del individuo, mediante la ponderación de la distribución que induce el modelo de Teoría de Respuesta al Ítem y una regresión latente asociada a algunas variables medidas en el individuo. El presente escrito muestra un ejemplo de simulación en donde se pueden observar de manera sencilla las bondades que brinda el método en los resultados agregados bajo este esquema de aplicación particular.Resumen (en)
The use of Plausible Values in large scale standarized tests, develop the role of imputation when the reference framework is too large and each person can not adress the totality of the items in the production. In that case appleal to block design definition that ensures an appropiate share of individuals per item aiming that the framework is addressed smugly across the study population is necessary. In general the imputation methos consist in find the posterior distribution of the feature latent that is associated to the individual hability, by weighting distribution that induces model item response theory and regression associated with some latent variables measured in the individual. This paper shows an example of simulation where you can easily see the advantages offered by the method in the aggregate results of this particle scheme application
Referencias
Aitkin, M. & Aitkin, I. (2011), Statistical Modeling of the National Assessment of Educational Progress, Nueva York: Springer.
Bock, R. D. & Aitkin, M. (1981), ‘Marginal maximum likelihood estimation of item parameters: Application of an em algorithm’, Psychometrika 46(4), 443–459.
Bock, R. D. & Mislevy, R. J. (1982), ‘Adaptive EAP estimation of ability in a microcomputer environment’, Applied psychological measurement 6(4), 431–444.
Gonz´alez, E. & Rutkowski, L. (2010), ‘Principles of multiple matrix booklet designs and parameter recovery in large-scale assessments’, IERI monograph series: Issues and methodologies in large-scale assessments.
Harwell, M. R., Baker, F. B. & Zwarts, M. (1988), ‘Item parameter estimation via marginal maximum likelihood and an em algorithm: A didactic.’, Journal of Educational and Behavioral Statistics .
Hulin, C. L., Drasgow, F. & Parsons, C. K. (1983), Item response theory: Application to psychological measurement., Dow Jones-Irwin, Homewood, IL. Informe técnico SABER 5o. y 9o. 2009 (n.d.), Technical report.
Kass, R. & Steffey, D. (1989), ‘Approximate bayesian inference in conditionally independent hierarchical models (parametric empirical bayes models)’, Journal of the American Statistical Association 84(407), 717–726.
Rubin, D. B. (1991), ‘EM and beyond’, Psychometrika 56(2), 241–254
Cómo citar
Licencia
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)