Publicado
2022-06-30

Predicción de la producción diaria de leche en bovinos Gyr a través de métodos de aprendizaje supervisado

DOI: https://doi.org/10.15332/23393076.9182
Alberto Zea
Dagoberto Bermúdez
Ariel Jiménez
Germán Gómez
Carlos Martínez

Resumen (es)

La Asociación Colombiana de Criadores de Ganado Cebú - ASOCEBU, tiene interés en desarrollar una máquina para predecir la producción total diaria de leche empleando mediciones de producción parciales en ganado Gyr y, en particular, responder dos  preguntas: 1) ¿puede un método predictivo de referencia ser superado por métodos desarrollados a nivel local? 2) ¿cuál de los dos  registros parciales (AM o PM) tiene un mejor desempeño predictivo? Por lo tanto, el objetivo de este artículo fue desarrollar una  máquina predictiva para la producción diaria de leche en bovinos Gyr utilizando registros parciales, intervalo entre ordeños, días en lactancia, y número de partos (n=13806), mediante la implementación de métodos de aprendizaje supervisado. Además de la  máquina predictiva de referencia, varias combinaciones de variables de entrada y modelo o método de aprendizaje fueron  consideradas. Se emplearon redes neuronales artificiales, máquinas de soporte vectorial, bosques aleatorios y regresión lineal cuyos  parámetros de localización se estimaron mediante mínimos cuadrados o los métodos de encogimiento Ridge y Lasso. El desempeño  predictivo (DP) se evaluó mediante validación cruzada utilizando las siguientes funciones de error: la raíz del error cuadrático medio  (RECM) y el error absoluto medio (EAM). Se encontró que una red neuronal artificial con una capa oculta empleando el registro  parcial AM, intervalo entre ordeños, número de partos y días en leche como variables de entrada presentó el mejor DP (RECM=1.5042, EAM=1.1389), pero en general, el desempeño de los diferentes métodos fue similar. Todas las máquinas cuyos  parámetros se aprendieron empleando los datos locales fueron superiores al método de referencia y los registros parciales de la  mañana presentaron mejor DP que los de la tarde. Estos resultados permiten direccionar el programa de control lechero de  ASOCEBU y generan un método “a la medida” para predecir la producción total diaria de leche en ganado Gyr en Colombia, un  componente importante de los programas de mejoramiento genético y modelamiento del nivel productivo en esta raza. 

Palabras clave (es): aprendizaje automático, control lechero, validación cruzada

Resumen (en)

The Asociación Colombiana de Criadores de Ganado Cebú - ASOCEBU, has interest in developing a machine to predict total daily milk  yield using partial production measurements in Gyr cattle and, in particular, answering two questions: 1) can a reference  predictive method be outperformed by locally developed methods? 2) which one of the two partial records (AM or PM) has a better  predictive performance? Therefore, the objective of this paper was to develop a predictive machine for daily milk yield in Gyr cattle  using partial records, milking interval, days in milk, and parity (n=13806), by implementing supervised learning methods. Besides the  reference predictive machine, several combinations of input variables and model or learning method were considered. Artificial  neural networks, support vector machines, random forests, and linear regression with location parameters estimated via least squares, or the shrinkage methods Ridge and Lasso were used. The predictive performance (PP) was assessed through  crossvalidation using the following error functions: square root of mean square error (RMSE) and mean absolute error (MAE). It was  found that an artificial neural network with a single hidden layer and the AM partial record, milking interval, parity and days in milk as input variables had the best PP (RMSE=1.5042, MAE=1.1389), but in general, the performance of the methods was similar. All  machines whose parameters were learned using local data outperformed the reference method and the morning partial records  showed a better PP than those from the afternoon. These results permit guiding ASOCEBU’s milk control program and generate a  “tailormade” method to predict total daily milk yield of Gyr cattle in Colombia, a relevant component of the genetic improvement  and productivity modelling programs of this breed. 

 

Palabras clave (en): machine learning, milk control, cross validation

Referencias

D. P. Berry, F. Buckley, and P. Dillon. Body condition score and live-weight effects on milk production in irish holstein-friesian dairy cows. Animal, 1(9):1351–1359, 2007. DOI: https://doi.org/10.1017/S1751731107000419

C. M. Bishop. Linear models for classification. Pattern recognition and machine learning, pages 179–224, 2006.

M. Cassandro, P. Carnier, L. Gallo, R. Mantovani, B. Contiero, G. Bittante, and G. Jansen. Bias and accuracy of single milking testing schemes to estimate daily and lactation milk yield. Journal of dairy science, 78(12):2884–2893, 1995. DOI: https://doi.org/10.3168/jds.S0022-0302(95)76919-3

M. F. Cerón Muñoz, J. D. Corrales Álvarez, and J. P. Ramírez Arias. Predicción de la producción de leche, porcentaje de grasa y proteína diaria a partir de registros del ordeño de la mañana o de la tarde en vacas holstein en pastoreo. Livestock Research for Rural Development, 29(9):166, 2017.

M. A. Delorenzo and G. R. Wiggans. Factors for estimating daily yield of milk, fat, and protein from a single milking for herds milked twice a day. Journal of Dairy Science, 69(9):2386–2394, 1986. DOI: https://doi.org/10.3168/jds.S0022-0302(86)80678-6

D. Ferro, J. Gil, A. Jim´enez, C. Manrique, and C. A. Martínez. Estimation of lactation curves of gyr cattle and some associated production parameters in the colombian low tropic. Revista Colombiana de Ciencias Pecuarias, 35(1), 2022. DOI: https://doi.org/10.17533/udea.rccp.v35n1a01

W. Grzesiak, R. Lacroix, J. W´ojcik, and P. Blaszczyk. A comparison of neural network and multiple regression predictions for 305-day lactation yield using partial lactation records. Canadian Journal of Animal Science, 83(2):307–310, 2003. DOI: https://doi.org/10.4141/A02-002

G. L. Hargrove and G. R. Gilbert. Differences in morning and evening sample milkings and adjustment to daily weights and percents. Journal of Dairy Science, 67(1):194–200, 1984. DOI: https://doi.org/10.3168/jds.S0022-0302(84)81284-9

T. Hastie, R. Tibshirani, J. H. Friedman, and J. H. Friedman. The elements of statistical learning: data mining, inference, and prediction, volume 2. Springer, 2009. DOI: https://doi.org/10.1007/978-0-387-84858-7

ICAR. Knowledge Management in Agriculture. THE GLOBAL STANDARD FOR LIVESTOCK DATA, 2016. URL http://www.icar.org.in/en/information-resources.htm.

G. James, D. Witten, T. Hastie, and R. Tibshirani. An introduction to statistical learning, volume 112. Springer, 2013. DOI: https://doi.org/10.1007/978-1-4614-7138-7

D. Lee and H. Min. Estimation of daily milk yields from am/pm milking records. Journal of Animal Science and Technology, 55(6):489–500, 2013. DOI: https://doi.org/10.5187/JAST.2013.55.6.489

Z. Liu, R. Reents, F. Reinhardt, and K. Kuwan. Approaches to estimating daily yield from single milk testing schemes and use of am-pm records in test-day model genetic evaluation in dairy cattle. Journal of Dairy Science, 83(11):2672–2682, 2000. DOI: https://doi.org/10.3168/jds.S0022-0302(00)75161-7

A. Lo, H. Chernoff, T. Zheng, and S.-H. Lo. Why significant variables aren’t automatically good predictors. Proceedings of the National Academy of Sciences, 112(45):13892–13897, 2015. DOI: https://doi.org/10.1073/pnas.1518285112

R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria, 2021. URL https: //www.R-project.org/.

J. D. Rodr´ıguez Neira, G. A. Correa Londoño, and J. J. Echeverri Zuluaga. Prediction models for total milk yield and fat percentage using partial samples. Revista Facultad Nacional de Agronomía Medellín, 66(1):6909–6917, 2013.

Cómo citar

Zea, A., Bermúdez, D., Jiménez, A., Gómez, G., & Martínez, C. (2022). Predicción de la producción diaria de leche en bovinos Gyr a través de métodos de aprendizaje supervisado. Comunicaciones En Estadística, 15(1), 35-47. https://doi.org/10.15332/23393076.9182

Artículos más leídos del mismo autor/a