Predicción de la producción diaria de leche en bovinos Gyr a través de métodos de aprendizaje supervisado
Resumen (es)
La Asociación Colombiana de Criadores de Ganado Cebú - ASOCEBU, tiene interés en desarrollar una máquina para predecir la producción total diaria de leche empleando mediciones de producción parciales en ganado Gyr y, en particular, responder dos preguntas: 1) ¿puede un método predictivo de referencia ser superado por métodos desarrollados a nivel local? 2) ¿cuál de los dos registros parciales (AM o PM) tiene un mejor desempeño predictivo? Por lo tanto, el objetivo de este artículo fue desarrollar una máquina predictiva para la producción diaria de leche en bovinos Gyr utilizando registros parciales, intervalo entre ordeños, días en lactancia, y número de partos (n=13806), mediante la implementación de métodos de aprendizaje supervisado. Además de la máquina predictiva de referencia, varias combinaciones de variables de entrada y modelo o método de aprendizaje fueron consideradas. Se emplearon redes neuronales artificiales, máquinas de soporte vectorial, bosques aleatorios y regresión lineal cuyos parámetros de localización se estimaron mediante mínimos cuadrados o los métodos de encogimiento Ridge y Lasso. El desempeño predictivo (DP) se evaluó mediante validación cruzada utilizando las siguientes funciones de error: la raíz del error cuadrático medio (RECM) y el error absoluto medio (EAM). Se encontró que una red neuronal artificial con una capa oculta empleando el registro parcial AM, intervalo entre ordeños, número de partos y días en leche como variables de entrada presentó el mejor DP (RECM=1.5042, EAM=1.1389), pero en general, el desempeño de los diferentes métodos fue similar. Todas las máquinas cuyos parámetros se aprendieron empleando los datos locales fueron superiores al método de referencia y los registros parciales de la mañana presentaron mejor DP que los de la tarde. Estos resultados permiten direccionar el programa de control lechero de ASOCEBU y generan un método “a la medida” para predecir la producción total diaria de leche en ganado Gyr en Colombia, un componente importante de los programas de mejoramiento genético y modelamiento del nivel productivo en esta raza.
Resumen (en)
The Asociación Colombiana de Criadores de Ganado Cebú - ASOCEBU, has interest in developing a machine to predict total daily milk yield using partial production measurements in Gyr cattle and, in particular, answering two questions: 1) can a reference predictive method be outperformed by locally developed methods? 2) which one of the two partial records (AM or PM) has a better predictive performance? Therefore, the objective of this paper was to develop a predictive machine for daily milk yield in Gyr cattle using partial records, milking interval, days in milk, and parity (n=13806), by implementing supervised learning methods. Besides the reference predictive machine, several combinations of input variables and model or learning method were considered. Artificial neural networks, support vector machines, random forests, and linear regression with location parameters estimated via least squares, or the shrinkage methods Ridge and Lasso were used. The predictive performance (PP) was assessed through crossvalidation using the following error functions: square root of mean square error (RMSE) and mean absolute error (MAE). It was found that an artificial neural network with a single hidden layer and the AM partial record, milking interval, parity and days in milk as input variables had the best PP (RMSE=1.5042, MAE=1.1389), but in general, the performance of the methods was similar. All machines whose parameters were learned using local data outperformed the reference method and the morning partial records showed a better PP than those from the afternoon. These results permit guiding ASOCEBU’s milk control program and generate a “tailormade” method to predict total daily milk yield of Gyr cattle in Colombia, a relevant component of the genetic improvement and productivity modelling programs of this breed.
Referencias
D. P. Berry, F. Buckley, and P. Dillon. Body condition score and live-weight effects on milk production in irish holstein-friesian dairy cows. Animal, 1(9):1351–1359, 2007. DOI: https://doi.org/10.1017/S1751731107000419
C. M. Bishop. Linear models for classification. Pattern recognition and machine learning, pages 179–224, 2006.
M. Cassandro, P. Carnier, L. Gallo, R. Mantovani, B. Contiero, G. Bittante, and G. Jansen. Bias and accuracy of single milking testing schemes to estimate daily and lactation milk yield. Journal of dairy science, 78(12):2884–2893, 1995. DOI: https://doi.org/10.3168/jds.S0022-0302(95)76919-3
M. F. Cerón Muñoz, J. D. Corrales Álvarez, and J. P. Ramírez Arias. Predicción de la producción de leche, porcentaje de grasa y proteína diaria a partir de registros del ordeño de la mañana o de la tarde en vacas holstein en pastoreo. Livestock Research for Rural Development, 29(9):166, 2017.
M. A. Delorenzo and G. R. Wiggans. Factors for estimating daily yield of milk, fat, and protein from a single milking for herds milked twice a day. Journal of Dairy Science, 69(9):2386–2394, 1986. DOI: https://doi.org/10.3168/jds.S0022-0302(86)80678-6
D. Ferro, J. Gil, A. Jim´enez, C. Manrique, and C. A. Martínez. Estimation of lactation curves of gyr cattle and some associated production parameters in the colombian low tropic. Revista Colombiana de Ciencias Pecuarias, 35(1), 2022. DOI: https://doi.org/10.17533/udea.rccp.v35n1a01
W. Grzesiak, R. Lacroix, J. W´ojcik, and P. Blaszczyk. A comparison of neural network and multiple regression predictions for 305-day lactation yield using partial lactation records. Canadian Journal of Animal Science, 83(2):307–310, 2003. DOI: https://doi.org/10.4141/A02-002
G. L. Hargrove and G. R. Gilbert. Differences in morning and evening sample milkings and adjustment to daily weights and percents. Journal of Dairy Science, 67(1):194–200, 1984. DOI: https://doi.org/10.3168/jds.S0022-0302(84)81284-9
T. Hastie, R. Tibshirani, J. H. Friedman, and J. H. Friedman. The elements of statistical learning: data mining, inference, and prediction, volume 2. Springer, 2009. DOI: https://doi.org/10.1007/978-0-387-84858-7
ICAR. Knowledge Management in Agriculture. THE GLOBAL STANDARD FOR LIVESTOCK DATA, 2016. URL http://www.icar.org.in/en/information-resources.htm.
G. James, D. Witten, T. Hastie, and R. Tibshirani. An introduction to statistical learning, volume 112. Springer, 2013. DOI: https://doi.org/10.1007/978-1-4614-7138-7
D. Lee and H. Min. Estimation of daily milk yields from am/pm milking records. Journal of Animal Science and Technology, 55(6):489–500, 2013. DOI: https://doi.org/10.5187/JAST.2013.55.6.489
Z. Liu, R. Reents, F. Reinhardt, and K. Kuwan. Approaches to estimating daily yield from single milk testing schemes and use of am-pm records in test-day model genetic evaluation in dairy cattle. Journal of Dairy Science, 83(11):2672–2682, 2000. DOI: https://doi.org/10.3168/jds.S0022-0302(00)75161-7
A. Lo, H. Chernoff, T. Zheng, and S.-H. Lo. Why significant variables aren’t automatically good predictors. Proceedings of the National Academy of Sciences, 112(45):13892–13897, 2015. DOI: https://doi.org/10.1073/pnas.1518285112
R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria, 2021. URL https: //www.R-project.org/.
J. D. Rodr´ıguez Neira, G. A. Correa Londoño, and J. J. Echeverri Zuluaga. Prediction models for total milk yield and fat percentage using partial samples. Revista Facultad Nacional de Agronomía Medellín, 66(1):6909–6917, 2013.
Cómo citar
Licencia

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)