Clasificaciones
Agrupa el conjunto de procesos de clasificación. En procesamiento digital de imágenes, se entiende por clasificaciones a los diferentes algoritmos de agrupamiento de píxeles según similitudes y diferencias en sus valores de número digital (DN, de digital number) para las bandas consideradas y de acuerdo a criterios determinados. Los píxeles así agrupados son separados en diferentes clases. Existen diversos algoritmos de clasificación, de tipo directo o en base a variables estadísticas. La cadena de procesos típica abarca la selección de una capa ráster en el árbol (ver Interfaz de usuario), el acceso al proceso, la configuración de parámetros específicos de éste, la selección espectral y el recorte espacial de la imagen de entrada, y la elección de opciones para el archivo de salida.
En el caso de que la capa ráster a ser clasificada posea una cantidad significativa de su superficie sin imagen o con datos no válidos, debe asignarse un valor inválido adecuado para la misma (ver 3Gestión de datos) antes de realizar la clasificación.
La selección espectral indica las bandas de la imagen de entrada a ser consideradas. La definición del recorte espacial puede realizarse mediante el ingreso de los pares de coordenadas correspondientes a los esquineros superior izquierdo e inferior derecho según el modelo ráster (línea/píxel) o el sistema de referencia geodésico seleccionado, sea geográfico (coordenadas geográficas decimales o sexagesimales) o proyectado (coordenadas planas), o bien por la extensión de la vista (haciendo doble clic con el puntero sobre el visualizador correspondiente) o de la capa temática elegida (haciendo doble clic sobre la misma en la lista de capas).
En el caso de tomar el recorte espacial de una capa, se recomienda que ésta posea el mismo sistema de referencia geodésico que la imagen a ser recortada.
Clasificación directa
En la clasificación directa se emplean criterios simples para delimitar directamente recintos de agrupamiento. El algoritmo asigna cada píxel a una clase o a ninguna, de acuerdo a su pertenencia con respecto a los recintos establecidos.
Los píxeles que pertenecen a más de un recinto son asignados a la clase de número inferior.
Clasificación multi-nivel
La clasificación multi-nivel agrupa los píxeles que pertenecen a un mismo recinto, delimitado mediante múltiples niveles, que corresponden a intervalos de valores en cada una de las bandas. Cada recinto conforma un (híper) paralelepípedo ortogonal en el espacio DN, un sistema de coordenadas cartesianas n-dimensional con un eje correspondiente a cada una de las n bandas en la imagen, donde se representa a cada píxel de ésta como un punto definido por sus respectivos valores de DN en las diferentes bandas.

Paralelepípedo en espacio DN tridimensional.
Deben especificarse la cantidad de clases, sus nombres y los respectivos valores mínimo y máximo para cada banda. Además, puede elegirse un color para cada clase y otro para la agrupación de píxeles no clasificados (clase Sin clase).

Definición de intervalos para clasificación multi-nivel.
Este algoritmo es intuitivo y posee complejidad computacional mínima, pero su precisión depende del conocimiento previo de la distribución de los datos en el espacio DN para cada recinto establecido. Su exactitud es especialmente baja cuando los datos poseen alta covarianza o dependencia con ejes oblicuos al sistema cartesiano, lo que es común en imágenes con variaciones de iluminación.
Clasificación por ángulo espectral
El algoritmo de clasificación por ángulo espectral (SAM, de Spectral Angle Mapper)[1] considera cada píxel como un vector representado en el espacio DN, un sistema de coordenadas cartesianas n-dimensional con un eje correspondiente a cada una de las n bandas en la imagen, con origen en el 0 de las coordenadas y extremo en el punto definido por sus respectivos valores de DN en las diferentes bandas.

Vector-píxel objetivo y ángulo espectral en espacio DN tridimensional.
El SAM consiste en la agrupación de los píxeles que pertenecen a un mismo recinto, delimitado en función del vector-píxel del material o variable objetivo, construido a partir de una firma espectral de referencia. Cada recinto conforma un ángulo (híper) sólido alrededor del vector-píxel objetivo en el espacio DN, denominado ángulo espectral.
Deben especificarse la cantidad de clases, sus nombres y las respectivas firmas espectrales de referencia, junto al ángulo máximo de tolerancia (en estereorradianes). Además, puede elegirse un color para cada clase y otro para la agrupación de píxeles no clasificados (clase Sin clase).

Definición de ángulo espectral.
La exactitud de este algoritmo no es afectada por una elevada correlación entre los valores de las bandas, lo que es común en imágenes con variaciones de iluminación.
Clasificación supervisada
En la clasificación supervisada, los recintos de agrupamiento son establecidos en función de parámetros estadísticos sobre la respuesta espectral de píxeles objetivo. Se trata de una técnica de análisis de datos con aprendizaje supervisado, por lo que es preciso definir previamente estos objetivos a partir de uno o varios conjuntos de datos de entrenamiento, que corresponden generalmente a áreas delimitadas por coberturas vectoriales poligonales sobre la misma capa ráster a ser clasificada. Alternativamente, pueden generarse a partir de la importación de variables estadísticas en archivos de texto con valores separados por comas (CSV, extensión .csv), calculadas previamente sobre áreas delimitadas en una imagen con la misma cantidad de bandas.
Una vez asignados los conjuntos de datos, deben elegirse cuáles se emplean, seleccionar el algoritmo a ser utilizado y sus respectivos parámetros de tolerancia. Además, puede elegirse un color para la agrupación de píxeles no clasificados (clase Sin clase). Las clases en la imagen resultante toman su nombre y su color de las áreas de entrenamiento (ver Capas temáticas) correspondientes.

Parámetros de clasificación supervisada en SoPI.
Los píxeles de pertenencia ambigua entre dos o más clases según los criterios del algoritmo seleccionado son asignados a la primera clase definida.
Algoritmos de clasificación supervisada
SoPI soporta cuatro algoritmos clasificadores con aprendizaje supervisado.
Paralelepípedo
En el algoritmo de clasificación por paralelepípedo, cada área de entrenamiento conforma un (híper) paralelepípedo ortogonal en el espacio DN, un sistema de coordenadas cartesianas n-dimensional con un eje correspondiente a cada una de las n bandas en la imagen, donde se representa a cada píxel de ésta como un punto definido por sus respectivos valores de DN en las diferentes bandas. Cada paralelepípedo tiene su centro en el promedio de los valores. El largo de las aristas del paralelepípedo en cada banda es configurable, y corresponde a una cantidad establecida de desvíos estándares para sus valores en esa banda. Este algoritmo asigna cada píxel de la capa ráster clasificada a una clase o a ninguna, de acuerdo a su pertenencia con respecto a los recintos así delimitados.
Este algoritmo es altamente intuitivo y posee complejidad computacional mínima, pero su precisión depende de la distribución de los datos en el espacio DN para cada recinto. Su exactitud es especialmente baja cuando los datos poseen alta covarianza o dependencia con ejes oblicuos al sistema cartesiano, lo que es común en imágenes con variaciones de iluminación.
Distancia Euclidiana mínima
El algoritmo de clasificación por distancia mínima considera cada píxel como un vector representado en el espacio DN, un sistema de coordenadas cartesianas n-dimensional con un eje correspondiente a cada una de las n bandas en la imagen, con origen en el 0 de las coordenadas y extremo en el punto definido por sus respectivos valores de DN en las diferentes bandas. La clasificación calcula las distancias Euclidianas desde el extremo de cada vector-píxel en la imagen hasta el extremo del vector-píxel promedio de cada área de entrenamiento, siendo la similitud entre cada píxel y cada área inversamente proporcional a su respectiva distancia[2]. Este algoritmo asigna cada píxel a la clase correspondiente al recinto más cercano, o a ninguna si la distancia es mayor a la tolerancia máxima configurada.
Este algoritmo posee complejidad computacional moderada y es medianamente intuitivo. Resulta más adecuado que el por paralelepípedo cuando no se conoce la distribución de los datos en el espacio DN para cada recinto.
Máxima verosimilitud (distancia normalizada mínima)
El algoritmo de clasificación por máxima verosimilitud (maximum likelihood)[3] es similar al algoritmo por distancia mínima, pero asume que la distribución de probabilidad para los valores en cada banda de los píxeles en cada área de entrenamiento es normal (Gaussiana). La clasificación calcula la probabilidad de que cada píxel pertenezca a cada recinto así considerado. Este algoritmo asigna cada píxel a la clase correspondiente al recinto más probable, o a ninguna si la probabilidad es menor al umbral definido (en porcentaje).
Este algoritmo es uno de los más utilizados para clasificaciones supervisadas, pero debe contarse con suficientes datos de entrenamiento para que los parámetros estadísticos calculados sean significativos. Su exactitud es baja cuando los datos poseen alta correlación, lo que es común en imágenes con variaciones de iluminación, o son muy homogéneos.
Distancia de Mahalanobis mínima
El algoritmo de clasificación por distancia de Mahalanobis[4] es similar al algoritmo por máxima verosimilitud, pero asume que la covarianza en todos los recintos es igual. La clasificación calcula la probabilidad de que cada píxel pertenezca a cada recinto así considerado. Este algoritmo asigna cada píxel a la clase correspondiente al recinto más cercano, o a ninguna si la distancia es mayor a la tolerancia máxima configurada.
Este algoritmo es más rápido que el de máxima verosimilitud, y es preferible al por distancia mínima cuando existe una elevada correlación entre los valores de las bandas, lo que es común en imágenes con variaciones de iluminación.
Áreas de entrenamiento
Las áreas de entrenamiento para una clasificación supervisada son capas vectoriales poligonales, que deben cargarse (ver Capas temáticas) o generarse (ver Tratamiento vectorial) previamente. Cada cobertura vectorial define un único conjunto de datos de entrenamiento, y para que la aplicación lo reconozca debe utilizarse la opción Asignar a áreas de entrenamiento desde el menú Procesamiento en el menú principal, o bien desde el menú contextual vectorial en el árbol de capas (ver Interfaz de usuario). El ícono de cada capa asignada cambia acordemente.
Las capas vectoriales a ser asignadas como áreas de entrenamiento deben ser de tipo poligonal.
Calcular estadísticas en áreas de clasificación
Calcula las variables estadísticas definidas por el usuario sobre la capa temática ráster seleccionada y dentro de las áreas de entrenamiento o prueba asignadas. Los cálculos posibles son los parámetros básicos como el máximo, el mínimo, la media y el desvío estándar para cada banda, los parámetros de correlación entre bandas expresados como matrices de correlación y covarianza, y el histograma por banda. Los resultados pueden expresarse en cantidad de píxeles o como superficies (de acuerdo a la unidad establecida en el modelo geográfico de la imagen). La selección espectral indica las bandas de la imagen de entrada a ser consideradas.
Como resultado, SoPI despliega un informe con los datos para cada recinto. El mismo puede ser guardado como archivo de texto con valores separados por comas (CSV, extensión .csv), planilla de Microsoft Excel (XLS, .xls) o documento HyperText Markup Language (HTML, .htm). Las variables estadísticas almacenadas en archivos CSV pueden ser utilizadas posteriormente en clasificaciones supervisadas de imágenes con la misma cantidad de bandas.
Clasificación no supervisada
En la clasificación no supervisada, los recintos de agrupamiento son establecidos en función de parámetros obtenidos automáticamente de la misma capa ráster a ser clasificada, mediante análisis estadísticos y operaciones iterativas. Se trata de una técnica de detección de patrones con aprendizaje no supervisado, por lo que no es preciso definir previamente datos de entrenamiento.
Algoritmos de clasificación no supervisada
SoPI soporta únicamente el algoritmo de agrupamiento con aprendizaje no supervisado por K-medias.
K-medias
El algoritmo de agrupación por K-medias (K-means)[5] agrupa el total de píxeles en una cantidad K de clases, de manera que cada uno de éstos pertenece al recinto cuyo centroide se encuentra a la distancia Euclidiana mínima. Luego de una primera asignación de píxeles en recintos respecto a valores iniciales arbitrarios, se vuelven a calcular las medias de cada recinto y se reasignan los píxeles en éstos de acuerdo al nuevo cálculo. Estos dos últimos procesos se actualizan iterativamente hasta que se alcanza la convergencia, definida en función de la tasa de cambio en la clasificación entre las iteraciones (expresada en porcentaje de píxeles), o el límite establecido de iteraciones.

Parámetros de clasificación no supervisada por K-medias.
Pueden adoptarse diferentes criterios para asignar los valores que definen los recintos iniciales.
- Por moda: Las medias iniciales son los respectivos valores más frecuentes de DN para cada banda.
- Píxeles al azar: Las medias iniciales son extraídas de los valores presentes en píxeles al azar de la imagen.
- Por muestra aleatoria: Las medias iniciales se toman aleatoriamente de valores entre los mínimos y máximos para cada banda.
- Por dispersión sobre diagonal: La (híper) diagonal definida por el rango efectivo de las bandas consideradas es dividida en partes iguales y las medias iniciales corresponden a los centros de los segmentos resultantes.
- Por cuantil: El histograma de cada banda se divide en intervalos ecualizados (con la misma cantidad de píxeles) y las medias iniciales se calculan de los recintos así definidos.
La cantidad de recintos en la primera iteración es igual a la cantidad de clases configurada.
El algoritmo por K-medias posee elevada complejidad computacional, y tiende a generar clases (híper) esféricas y de tamaño similar.
La clasificación puede optimizarse con una correcta elección del número de clases K.
Referencias
[1] Kruse, Fred A.; Lefkoff, A. B.; Boardman, J. B.; Heidebrecht, K. B.; Shapiro, A. T.; Barloon, P. J. & Goetz, A. F. H. 1993.
The Spectral Image Processing System (SIPS) - Interactive Visualization and Analysis of Imaging spectrometer Data.
Remote Sensing of Environment, vol. 44 (issues 2/3): pp. 145-163; May/June 1993. www.hgimaging.com/PDF/Kruse_SIP_RSE93.pdf
[2] Wacker, A. G. & Landgrebe, David A. 1972.
Minimum Distance Classification in Remote Sensing.
1st Canadian Symposium on Remote Sensing (CSRS), Laboratory for Applications of Remote Sensing (LARS) Technical Report #030772; February 1972.
docs.lib.purdue.edu/larstech/25
[3] Zenzo, S. D.; Bernstein, R.; Degloria, S. D. & Kolsky, H. G. 1987.
Gaussian Maximum Likelihood and Contextual Classification Algorithms for Multicrop Classification.
IEEE Transactions on Geoscience and Remote Sensing (TGRS), vol. GE-25 (issue 6): pp. 805-814; November 1987.
dx.doi.org/10.1109/TGRS.1987.289752
[4] Mahalanobis, Prasanta Chandra. 1936.
On the generalised distance in statistics.
National Institute of Sciences of India Proceedings, vol. 2 (issue 1): pp. 49-55; April 1936. www.unt.edu/rss/class/Jon/MiscDocs/1936_Mahalanobis.pdf
[5] MacQueen, J. 1967.
Some methods for classification and analysis of multivariate observations.
5th Berkeley Symposium on Mathematical Statistics and Probability Proceedings, vol. 1: pp. 281–297; April 1976.
projecteuclid.org/download/pdf_1/euclid.bsmsp/1200512992
|