fbpx

AGRUPAMIENTO DE UNIDADES GEOLÓGICAS CON K-MEDIAS

Agrupamiento de unidades geológicas con aprendizaje de máquinas no supervisado, como alternativa al método tradicional para el modelamiento geológico


Definición de dominios geológicos mediante metodología tradicional:

El concepto de dominios geológicos, se entiende como zonas con sentido espacial y geológico, en los cuales la variable de interés principal tiene un comportamiento homogéneo o variación mínima. Estos pueden formarse a partir de variables geológicas del tipo: litología, alteración, mineralización, estructural, entre otras que influyan sobre una variable de interés.

La metodología tradicional se resume en la interpretación de los resultados estadísticos descriptivos por unidad geológica, el agrupamiento de estas unidades respetando el carácter de homogeneidad para la variable en estudio, y la concordancia a nivel espacial y geológico. Finalmente se construyen los volúmenes denominados dominios geológicos siguiendo los patrones del agrupamiento.

A continuación, se presenta el agrupamiento de dominios como base para un estudio comparativo, el cual tiene como variable de interés principal, las concentraciones de cobre total (CuT %). De la tabla 1, cabe señalar que el código litológico es una variable categórica y representa las etiquetas del tipo de roca al cual corresponde cada observación.



Se puede observar en la tabla 2, que existen 4 unidades litológicas que sobresalen del resto; Andesita (429), Arcosa (431), Ocoitas (414) y Diorita (462) ordenadas de forma descendente por su tamaño.



La unidad litológica cuaternaria (401), como se puede apreciar en la figura 1, es la que posee la mayor ley media de cobre, sin embargo, también es la que posee la mayor dispersión, lo que señala existencia de concentraciones tanto bajas como altas mezcladas, siendo estas últimas estadísticamente atípicas, y elevando la media en la unidad. Del mismo gráfico de probabilidades, se puede tener una idea temprana de que ciertas litologías mantienen un comportamiento similar y podrían agruparse.   



En una segunda salida gráfica a través del diagrama de cajas y bigotes, es que, desde un punto de vista únicamente estadístico, podríamos agrupar mas de dos unidades litológicas en un dominio, por ejemplo, las unidades 457, 461 y 462, mantienen una muy leve diferencia en medidas de tendencia central y variabilidad.



Bajo un escenario de similitud estadística, teniendo como criterio unificar unidades litológicas, que no superen en un 20% la variación entre sus medias y desviaciones estándar para el cobre total, quedaría:



Sin embargo, es de conocimiento que la generación de dominios geológicos, debe respetar el carácter espacial de los datos. Esto último quiere decir que las unidades solo pueden agruparse con aquellas otras que se encuentren contiguas o bien se conozca en detalle su correlación geológica. En este caso, visualmente se ha validado que el agrupamiento por similitud estadística, respeta el carácter espacial que busca la definición de dominios. Los gráficos de contacto no se han incorporado de momento a este escrito.  


Sin embargo, el carácter geológico es el primordial para realizar un agrupamiento integral, y es finalmente el que se presenta como base para este estudio en la tabla 4, dejando solo como una propuesta matemática el anterior presentado en la tabla 3.



Se puede observar en la tabla 4 que se mezclan unidades litológicas con leyes medias más distantes, por ejemplo, el grupo 1 une una media de 0.30 % CuT con 0.42% CuT, al igual que en el grupo 3 que se mezclan concentraciones muy bajas del tipo 0.09% CuT con otras mas altas de 0.41% CuT. Esto a priori podría verse como un posible error, sin embargo, el peso que aportan ciertas leyes es insignificante a la hora de influir en la ley media del grupo. El grupo 5 por ejemplo, con y sin esta ley baja de 0.09%, mantiene una media de 0.32% CuT, al aportar solo con un 0.13% en la ponderación.





Finalmente, este agrupamiento de unidades litológicas, es la entrada para el modelado de dominios geológicos.


Definición de dominios geológicos mediante k-medias:

El algoritmo de aprendizaje automático no supervisado k-medias, funciona básicamente agrupando los datos por una medida de similitud (distancia euclidiana) y requiere ser inicializado asignándole el número de grupos (k=1, 2, 3, n). El número óptimo de “k” se puede determinar usando el método del codo de Jambú.


Selección de características a utilizar para el agrupamiento:

Se utilizará la variable de interés comercial cobre total junto a la litología. Para esta ultima fue necesario una transformación preliminar, dado que es una variable cualitativa. Al ser 14 litologías, cada una de ellas tendrá un valor discreto de 1,2,3,4…14.


Estandarización de las características:

Las variables seleccionadas son transformadas al punto de presentar una media 0 y varianza 1, esta transformación tiene como objetivo que ambas características tengan la misma influencia sobre el agrupamiento.



Al iterar un numero total de 10 escenarios de agrupamiento mediante k-medias con métrica de distancia euclidiana, el agrupamiento en 4 grupos (clusters), viene a ser el óptimo.



De manera visual, y observando las unidades litológicas más importantes, se puede ver que la roca intrusiva se mantiene bastante similar entre la metodología de agrupamiento tradicional y k medias. Luego k-medias tiende mezclar en un único dominio la roca arcosa con la andesítica, esto producto que la ley media de cobre total entre ambos dominios es poco variante.  



La metodología de k-medias tiende a agrupar de manera mas selectiva sus datos, diferenciándose cada grupo por tener sus propias estadísticas. El cluster «0» esta mayormente influenciado por una roca del tipo Ocoita con concentraciones muy pobres en cobre, el cluster «1» por una roca intrusiva con leyes intermedias de buen potencial, el cluster «2» es el más pequeño y sobresale del resto por una ley mucho mas alta e influenciada por una mixtura de tipos de roca, lo cual lo hace desplegarse en distintos sectores y no de forma uniforme como el resto. El cluster «3» esta predominado por roca Arcosa y Andesítica con leyes bajas.




La discusión en este punto se centra en buscar la justificación geológica para con el agrupamiento tradicional, dado que existen dominios en los cuales el comportamiento de la variable de interés es similar, por ejemplo véase los dominios 100, 200 y 300 de la figura 4. Esta discusión ya será parte de una retroalimentación futura, que por ahora quedará solo en el levantamiento. 


Algunas variaciones en el uso de k-medias, sería el incorporar nuevas características geológicas, como la mineralización y la alteración, y ver como estas influyen en el agrupamiento. Variaciones que también quedaran como trabajos futuros. 


Finalmente señalar que k-medias resulta sumamente interesante de implementar en la definición de dominios geológicos y que su uso considera ahorrar tiempos importantes en comparativa a la metodología tradicional. 

septiembre 10, 2020
top
Nube Minera © 2020