A New approach to predict nutrient content in Costa Rican soils using spectroscopy and machine-learning.

Fecha
2019-12
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad EARTH
Resumen

Reducing the cost and time of the soil analysis process becomes a priority in order to be more efficient day by day. That is one of the reasons why the use of visible and near infrared (vis-NIR) spectroscopy along with the application of chemometric models for nutrient prediction becomes important. To develop this study, a total of 1634 samples were collected. Parameters such as macronutrients (P, K, S, Ca, Mg) and micronutrients (Zn, Cu, Fe, Mn, B) and other elements for example Si and Na were analyzed. Different data preprocessing techniques were applied in addition to three different chemometric models: Random Forest, Partial Least Square Regression and Memory-Based Learning. Of a total of 19 processed variables, they resulted nine models with R2 values greater than 0.8 and an RPD greater than 2. In comparison between the models, memory-based learning obtained the highest coefficients for the prediction of nutrient content in agricultural soils in Costa Rica. Iron was the nutrient with the greatest predictive capacity with an R2 of 0.92 and an RPD of 3.62. Our results confirm that vis-NIR gives a good confidence in the prediction of some soil parameters.


Reducir el costo y tiempo del proceso de análisis de suelos se vuelve una prioridad en busca de ser más eficientes día a día. Esa es una de las razones por las cuales el uso de espectroscopía visible e infraroja junto con la aplicación de modelos quimiometricos para la predicción de nutrientes toma importancia. Para la realización del presente estudio se colectaron un total de 1634 muestras las cuales contaron con análisis de macronutrientes (P, K, S, Ca, Mg), micronutrientes (Zn, Cu, Fe, Mn, B) y otros elementos tales como Si y Na. Se aplicaron diferentes tecnicas de preprocesamiento de datos además de tres distintos modelos quimiometricos: Random Forest, Regresión de Cuadrados Mínimos y Memory-Based Learning. De 19 variables procesadas un total de nueve dieron modelos con valores de R2 mayores a 0,8 y un RPD mayor a 2. En comparación entre los modelos, Memory Based Learning obtuvo los coeficientes más altos. Hiero fue el nutriente que tuvo los mejores valores para su prediccion con un R2 de 0. 92 y un RPD de 3.62. Nuestros resultados demuestran el gran potencial de vis-NIR espectroradiometría combinado con algoritmos de Aprendizaje Automático para predecir propiedades de suelo de Costa Rica.

Descripción
Palabras clave
ANALISIS DEL SUELO, ESPECTROSCOPIA, COSTA RICA
Citación