Open-access Identificación de abejas sin aguijón (Apidae: Meliponini) a partir de la clasificación de los descriptores SIFT de una imagen del ala derecha anterior

Identification of stingless bees beginning from the classification of SIFT descriptors of an image of the right forewing

Resumen

Se ha comprobado que la información morfométrica de un ala se puede usar para identificar la especie de algunos insectos, incluidas las abejas. En el presente trabajo se utiliza la información contenida en la fotografía de un ala para discriminar la especie de abejas nativas costarricenses sin aguijón. El método propuesto es un algoritmo discriminador basado en la clasificación de los descriptores SIFT de los puntos clave de la imagen del ala anterior derecha. Los especímenes usados en la investigación se recolectaron directamente de los nidos en diferentes zonas geográficas de Costa Rica y corresponden a 18 especies de 10 géneros. El algoritmo fue validado con 436 imágenes de alas con un resultado de 81% de éxito en la discriminación por género y de 76% a nivel de especie.

Palabras clave: Abejas sin aguijón; clasificación de especies; procesamiento de imágenes; descriptores SIFT; agrupamiento aglomerativo jerárquico

Abstract

It has been found that morphological information contained in a wing can be used to identify the species of certain insects, including bees. This paper uses the information contained in the photograph of a wing to discriminate the specie of native stingless bees. A discriminator algorithm based on SIFT is proposed. Specimens used in the research were collected directly from the nests in different geographic areas of Costa Rica and correspond to 18 species of 10 genders. The proposed algorithm was validated with 436 images with 81% success in gender discrimination and 76% for the species.

Keywords: Stingless bees; classification; image processing; SIFT descriptors; clustering

Introducción

Las abejas son insectos con alas de la familia Apoidea, orden Hymenoptera. Existen más de 20.000 especies documentadas alrededor del mundo (Michener, 2007). Se consideran el grupo de polinizadores más importantes, tanto de plantas silvestres como de cultivos (Quesada Euan, 2009). Existen numerosos estudios que demuestran su importancia económica en la industria agrícola, pero su aporte al ecosistema natural es difícil de cuantificar. Según proyecciones de la Organización de las Naciones Unidas (ONU), para el año 2050 la población mundial será de más de 9.000 millones de personas, lo que implicará una gran demanda de alimentos, y de ahí la importancia de las abejas para la supervivencia humana y la conservación de la biodiversidad. No obstante, la sobreexplotación de los bosques y el uso de pesticidas han causado la disminución en el número de colonias de Apis mellifera (Apidae: Apini) y efectos adversos no cuantificados en otras especies, entre ellas las abejas nativas sin aguijón (Apidae: Meliponini) (Meléndez, Meneses & Kevan, 2013; Thompson, 2012; Whitehorn, O’Connor, Walkers & Goulson, 2012).

Las abejas nativas sin aguijón tienen un aguijón atrofiado que no pueden utilizar para la defensa. Se conocen más de 400 especies, de las cuales 300 se encuentran en los trópicos y subtrópicos de América. En Costa Rica hay al menos 20 géneros y 59 especies (Camargo & Pedro, 2007) y la mayoría habitan por debajo de los 1500 msnm. Las especies más utilizadas en Costa Rica para la meliponicultura son Tetragonisca angustula y Melipona beecheii.

El cuerpo de una abeja se compone de tres partes: cabeza, tórax y abdomen. El tórax está formado por el protórax, el mesotórax y el metatórax. Cada una de estas partes tiene un par de patas. Las alas de las abejas son membranosas y crecen en el tórax, un par en el mesotórax y otro par en el metatórax. Las membranas superior e inferior de las alas cubren una red de tubos endurecidos, llamados nervios o venas, que le dan rigidez a éstas.

Trabajos relacionados

Tradicionalmente, para la identificación de especies, el experto -melitólogo- utiliza una clave dicotómica (clave taxonómica) que consta de un número de pasos organizados, cada uno de los cuales tiene dos opciones mutuamente excluyentes. Conforme se avanza en la identificación, estas opciones se van descartando. Las claves dicotómicas utilizan características fáciles de observar en el espécimen y con pares de afirmaciones contrapuestas como, por ejemplo, “ojos labros” contra “ojos con pelos”.

Se ha demostrado que es posible identificar especies de insectos usando únicamente la morfometría del ala, ya que su variabilidad entre especies es mayor que dentro de la misma especie. Incluso las diferencias permiten discriminar entre subespecies (Hall, 2011; Tofilski, 2008a; Tofilski, 2008b; Tüzün & Yüksel, 2011). Las alas de los insectos son membranosas y poseen venas o nervaduras visibles, lo que permite la creación de un diagrama claro de su estructura. El uso de indicadores morfométricos ha cobrado relevancia recientemente (Breuker, Gibbs, Van Dongen, Merckx & Van Dyck, 2010; Hall, 2011; Hall, MacLeod & Wardhana, 2014), lo que ha motivado el desarrollo de sistemas de clasificación que utilizan las características morfométricas del ala (Abou Shara & Al Ghamdi, 2012; Arbuckle, Schröder, Steinhage & Wittmann, 2001; Breuker, Gibbs, Van Dongen, Merckx & Van Dyck, 2010). En general, estos sistemas identifican las especies mediante métodos morfométricos basados en el análisis multivariado de distancias y ángulos. En el cuadro 1 se muestra un resumen de algunos de estos sistemas y sus principales características.

Como se puede observar, existen varios sistemas capaces de clasificar especies de abejas de forma eficiente. Sin embargo, todos tienen limitaciones, entre ellas están que ninguno se ha desarrollado específicamente para la discriminación de abejas sin aguijón, por lo general discriminan pocas especies y géneros, en su mayoría no son completamente automáticos, requieren intervención activa de un usuario, requieren de una gran cantidad de información y algunos demandan muchas horas de entrenamiento.

Debido a esto, se considera que el desarrollo de un sistema automático de discriminación de abejas sin aguijón a partir de una fotografía del ala es relevante. En el presente trabajo se propone un sistema de fácil uso, ya que únicamente requiere una fotografía de un ala derecha anterior y con ella se logra identificar la especie más probable a la que pertenece el ala.

Cuadro 1
Sistemas para la clasificación automática de los insectos.

Base de datos y colección de especímenes

Las colecciones de especímenes de abejas son fundamentales para realizar estudios taxonómicos y constituyen la base de muchos tipos de estudio sobre biodiversidad y población. La falta de colecciones entomológicas apropiadas que cubran el inventario de todo el país es una de las debilidades que se presenta al realizar este tipo de estudios.

En esta investigación, la creación de la base de datos incluyó la preparación de tres colecciones: una de especímenes de abejas montadas en alfileres entomológicos, otra de alas derechas anteriores y posteriores montadas en un medio de preservación inerte y una de fotografías de estas placas.

Colección de especímenes

Parte de los especímenes utilizados se tomó de la colección de abejas nativas sin aguijón del Centro de Investigaciones Apícolas Tropicales (CINAT). Se revisaron todos los especímenes para seleccionar aquellos cuya ala derecha, anterior y posterior estuviera en perfectas condiciones. Para las especies de las que no se obtuvieron individuos con sus alas en perfectas condiciones, fue necesario realizar visitas de campo para ubicar nidos, de donde se recolectaron los especímenes necesarios para la investigación.

Las abejas se recolectaron directamente de los nidos en diferentes zonas geográficas de Costa Rica (figura 1), utilizando red entomológica y succionadores de plástico. Se usó una “cámara de muerte” con acetato de etilo para matar rápidamente al insecto y evitar daños en las alas. Las muestras se trasladaron al CINAT, donde se realizó el proceso de preservación de los ejemplares, el montaje y la identificación respectiva. Para cada ejemplar se registró la información necesaria para su identificación taxonómica: país, provincia, cantón, fecha, nombre del recolector, muestra en nido o en flor, etc.

Colección de alas

Se extrajo el ala derecha anterior y posterior de las abejas, se cortó en la base del mesotórax con navajilla y tijeras de disección para facilitar el desprendimiento y no dañarla. Se quitó el residuo de la base del ala para su montaje en un portaobjetos con una gota de bálsamo de Canadá. Se usó una lámpara de 50 W para suavizar el bálsamo y permitir que la muestra quedara inmersa en el sustrato sin ser dañada. Se colocó el cubreobjetos con presión moderada para extraer las burbujas y evitar el desplazamiento del ala. Las alas en estudio se dejaron reposar sobre papel toalla por 24 horas antes de ser fotografiadas y almacenadas. La colección de alas comprende un total de 879 placas.

Figura 1
Zonas geográficas de los sitios de recolección.

Colección de fotografías

Para la toma adecuada de las fotografías se estableció un protocolo (Herrera et al., 2013). Las imágenes fueron tomadas con un estereoscopio Olympus modelo SZX16 con una cámara integrada marca Olympus modelo DP72, con una fuente de luz circular intralux 4000-1 con una intensidad de entre 1400 y 1600fc, dependiendo de la muestra. La resolución en el milimétrico fue de 2x con una apertura focal de 1/4. Para la captura de imágenes se utilizó un sistema TWAIN con exposición manual, tiempo de exposición 60%, sensibilidad ISO 200 y una resolución Live 1360 x 1024 y un snap 4140 x 3096.

Las fotografías se almacenaron en una base de datos, agrupadas por especie. La colección comprende un total de 1758 fotografías.

Procesamiento de las imágenes

Para la sustracción del fondo de cada una de las fotografías se utilizaron histogramas, discriminación por umbrales y operadores morfológicos. Las fotografías presentaban dos tipos de fondos: uno con un tono gris y otro con presencia de azul. Para determinar el tipo de fondo de cada fotografía se utilizó el espacio de color HSV y una cota, calculada empíricamente. Una vez identificado el tipo de fondo, se hizo un filtrado mediante umbralización (Otsu) ajustado experimentalmente, para determinar cuáles pixeles se convertirían en blancos y cuáles en negros. En la figura 2 se muestra este proceso; la región en blanco de la fotografía (b) corresponde a lo que se identificó como ala y la fotografía (c) es el resultado del proceso de eliminación del fondo.

Algunas fotografías presentaban dos alas, siendo la de interés la ubicada más al centro de la imagen, según el protocolo establecido en Herrera et al. (2013). Para resolver esto, se calcularon los centros de masa de todas las regiones blancas y se eligió como el ala de interés aquella cuya distancia del centro de masa al centro de la imagen fuese menor.

Figura 2
(a) fotografía original de la colección, (b) fotografía obtenida luego del filtrado por umbral, conversión a blanco y negro y operaciones morfológicas, (c) resultado del proceso de eliminación de fondo.

Aprendizaje

En la figura 3 se muestra el esquema del proceso de entrenamiento propuesto:

Para cada imagen de entrenamiento se extraen sus descriptores SIFT.

Se realiza un agrupamiento aglomerativo jerárquico de los descriptores extraídos.

Para cada descriptor en cada grupo se almacena su correspondiente especie.

Se espera que cada grupo sea representativo de una única especie, pero la práctica demuestra que esto no siempre sucede, ya que existen grupos que comparten descriptores de varias especies. Por lo tanto, fue necesario resolver esta ambigüedad en la etapa de clasificación.

Descriptores SIFT de puntos clave

El Scale Invariant Feature Transform (SIFT) es un transformación propuesta por David Lowe en 1999, cuya idea básica es representar una imagen mediante puntos clave (Lowe, 1999).

El método SIFT reduce la imagen a un conjunto de parámetros invariantes a la escala y rotación. Esto lo logra mediante la creación de pirámides de scale-space y la convolución con funciones gaussianas. La imagen obtenida por diferencia de gaussianas logra resaltar los bordes y esquinas de la imagen.

Figura 3
Esquema del proceso de entrenamiento.

Una vez calculadas las diferencias gaussianas, se identifican los candidatos a máximos y mínimos entre los puntos que no se anularon. La comparación de cada punto con sus vecinos se hace en la escala próxima. Luego estos se discriminan por estabilidad.

Para asignar la orientación a los puntos clave (x, y) calculados en la etapa anterior, se utilizan la magnitud del gradiente y la orientación. Con la información obtenida se asigna a cada punto clave un conjunto de características, entre las que se destacan la posición, la orientación y las rotaciones del gradiente (para lograr invariancia respecto a rotaciones en 2D o cambios de puntos de perspectiva en 3D). Así, a cada punto clave se le asocia una matriz de 4x4x8, es decir, un vector de tamaño 128, llamado descriptor del punto clave.

Agrupamiento de los descriptores

Para construir los grupos de descriptores se usó el agrupamiento aglomerativo jerárquico. Según este método, dados F descriptores extraídos de las imágenes de entrenamiento, el agrupamiento se inicia con F grupos, cada uno conteniendo un único descriptor. En cada iteración, se unen los dos grupos con mayor proximidad.

Para determinar la proximidad entre grupos se utilizó la agregación de salto promedio con la métrica euclídea (Trejos, Castillo & González, 2014). Esta se define como la distancia promedio de todo descriptor de un grupo a todo descriptor del otro grupo:

Aquí, M y N son el número de descriptores de cada uno de los grupos G p y G q respectivamente, d p i es el i-ésimo descriptor del grupo G p y d p j es el j-ésimo descriptor del grupo G q .

El agrupamiento aglomerativo en cada iteración va uniendo grupos hasta que un criterio de parada detiene el proceso, después de lo cual se obtienen grupos donde la proximidad entre cada par de grupos está por encima de un valor dado. Este valor determina el criterio de parada, que en nuestro caso fue determinado experimentalmente.

Las principales desventajas del agrupamiento aglomerativo son sus excesivos requerimientos en tiempo de ejecución y de memoria, que son del orden de O (- F 2 ) .

Clasificación de una nueva imagen

Dada una nueva imagen, la clasificación se lleva a cabo de la siguiente forma:

Primero se extraen los descriptores SIFT de la imagen.

Luego, cada uno de estos descriptores se clasifica en uno de los grupos del modelo aprendido.

Por último, se determina la especie más probable a la que pertenece la imagen de entrada.

En la figura 4 se muestra el esquema del proceso de discriminación propuesto. Primero se extraen los descriptores d 1 , d 2 ,..., d F de la imagen que se desea identificar. Luego, mediante análisis discriminante lineal (Johnson, 2000), se clasifica cada uno de estos descriptores d i en uno de los grupos G j obtenidos en el proceso de entrenamiento. Por último, se seleccionan las k especies más probables para la imagen de entrada. Para esto se calculan las sumas de las probabilidades de ocurrencia dado cada uno de los grupos seleccionados en la etapa anterior:

Luego se eligen los k valores mayores para cada imagen de entrada. Aquí P(E i |G j ) es la probabilidad de que la especie sea E i dado el grupo G j y P(G j ) es la probabilidad del grupo G j .

El algoritmo fue programado en MatLab y se utilizó la biblioteca VLFeat para la obtención de los descriptores SIFT de los puntos clave de una imagen.

Figura 4
Esquema del proceso de discriminación.

Resultados

La obtención y análisis de los resultados se hizo de la siguiente forma:

Se usó una muestra pequeña de imágenes para calibrar los procesos de eliminación de fondo y la obtención de los descriptores SIFT.

Se entrenó el algoritmo con una muestra de 8 imágenes por especie y se utilizaron 18 especies para un total de 144 imágenes, como se muestra en el cuadro 2.

Se validó el algoritmo con una muestra de 436 imágenes totalmente diferentes a las utilizadas en las etapas anteriores.

Cuadro 2
Totalidad de especies utilizadas en la etapa de entrenamiento.

Para la etapa de validación se utilizó una muestra de 436 fotografías que corresponden a 18 especies de 10 géneros. Debido a que no se pudo recolectar una cantidad suficiente de especímenes para 6 de las especies, el algoritmo se entrenó con 24 especies y se validó con 18.

Los resultados del proceso de validación con k=1 se tabularon en una matriz de discriminación cruzada, como se muestra en el cuadro 3. Por ejemplo, de las 30 imágenes de la especie Partamona orizabaensis, 27 fueron identificadas correctamente, 2 fueron identificadas como de la especie Trigona fulviventris y 1 como de la especie Geotrigona lutzi. Se usaron colores para agrupar las especies de un género, por ejemplo, para las de Trigona se utilizó el color naranja.

En el cuadro 4 se resumen los resultados de la etapa de validación usando un valor de k=1 (considerando únicamente la especie más probable). El porcentaje promedio de éxito para la discriminación por especie fue de 76,3%, mientras que para la discriminación por género alcanzó 80,7%.

En el cuadro 4 observamos que la discriminación por género para el caso de Trigona es del 100%, no así la discriminación por especie, que es de un 70,7%, pero es importante notar que ninguna de las imágenes de esta especie está clasificada como de otra especie (cuadro 3). Esto sugiere que las alas de las especies de este género son muy similares entre sí, pero tienen cierto grado de diferencia con las alas de las especies de otros géneros.

Esto lleva a pensar que, con el propósito de poder discriminar entre especies de ciertos géneros, como en el caso de Trigona, tal vez sea necesario considerar otros discriminadores que no se encuentran en las alas como, por ejemplo, color del abdomen, vellosidad en las patas o antenas, etc.

Obsérvese que para 10 de las 18 especies y 7 de los 10 géneros el porcentaje de discriminación es superior o igual al 90%; en algunos de los trabajos consultados se obtienen porcentajes similares pero para menos especies (Francoy, Silva, Nunes-Silva, Menezes & ImperatrizFonseca, 2007; Abou Shara & Al Ghamdi , 2012; Tofilski, 2008b).

Los porcentajes de discriminación más bajos que se obtuvieron corresponden a las especies Melipona costaricensis y Tetragona ziegleri, las cuales en su mayoría son identificadas como alguna de las especie del género Trigona, 9 y 16, respectivamente (cuadro 3).

Es usual que los algoritmos de este tipo respondan con las dos opciones más probables; al permitir esto los resultados mejoran, siendo de 84,41% para discriminación por género y de 83,95% para discriminación por especie, como se muestra en el cuadro 5.

Cuadro 3
Matriz de discriminación cruzada.

Cuadro 4
Porcentaje de éxito considerando las especies más probables, k=1 .

Cuadro 5
Porcentajes de éxito considerando las dos especies más probables, k= 2.

Conclusiones

Hemos podido comprobar que es posible identificar el género y la especie de abejas nativas sin aguijón a partir de la fotografía del ala derecha anterior, con porcentajes de éxito que rondan el 84%.

Con base en la información dada por expertos en estudios apícolas, existen especies cuyas alas son muy similares entre sí, por lo que su identificación se realiza considerando otros aspectos como: color de ciertas partes del cuerpo, vellosidad, tamaño de las patas o antenas, etc. Por ejemplo, las alas de las especies Trigona silvestriana y Trigona fulviventris son muy similares pero se diferencian por la coloración del abdomen. Por eso, al incorporar algunos de estos discriminadores, los porcentajes de éxito podrían mejorar.

Aún quedan algunas tareas pendientes, como investigar las razones de que los porcentajes de discriminación para las especies Melipona costaricensis y Tetragona ziegleri sean los más bajos; evaluar otras técnicas para el proceso de clasificación de descriptores e incorporar más especies en los procesos de entrenamiento y validación.

Agradecimiento

Agradecemos a la Vicerrectora de Investigación del Instituto Tecnológico de Costa Rica por el apoyo brindado al proyecto de investigación: Sistema automático de clasificación de abejas sin aguijón (Apidae: Meliponini) basado en el contorno y venación de sus alas, código VIE 54021701-0101.

Bibliografía

  • Abou Shara, H. & Al Ghamdi , A. (2012). Studies on wings symmetry and honey bee races discrimination by using standard and gometric morphometrics. Biotechnology in Animal Husbandry, 28(3), 575-584.
  • Arbuckle, T., Schröder, S., Steinhage, V., & Wittmann, D. (2001). Identification and Monitoring of Bee Species using ABIS. Proceedings of the 15th International Symposium Informatics for Environmental Protection (pp. 425-430). Zurich: EMPA.
  • Breuker, C., Gibbs, M., Van Dongen, S., Merckx, T. & Van Dyck, H. (2010). The Use of Geometric Morphometrics in Studying Butterfly Wings in an Evolutionary Ecological Context. En A. Elewa (Ed.), Morphometrics for Nonmorphometricians (pp. 271-287). Berlin: Springer.
  • Camargo, J. & Pedro, S. (2007). Meliponini Lepeletier. En J. Moure y D. Urban (Eds.), Catalogue of bees (Hymenoptera, Apoidea) in the neotropical region (pp. 272-578). Curitiba: Sociedade Brasilera de Entomologia.
  • Francoy, T., Silva, R., Nunes-Silva, P., Menezes, C. & Imperatriz-Fonseca, V. (2007). Gender identification of five genera of stingless bees (Apidae, Meliponini) based on wing morphology. Genetics and Molecular Research, 207-214.
  • Francoy, T., Wittman, D., Muller, S., Steinhage, V., Bezerra-Laure, V., De Jong, D. & Goncalves, L. (2008). Identification of africanized honey bees through wing morphometrics: two fast and efficient procedures. Apidologie, 488494.
  • Hall, C. (2011). Automated approacch to bee identification from wing venation. Madison: Universidad de Wisconsin.
  • Hall, M., MacLeod, N. & Wardhana, A. (2014). Use of wing morphometrics to identify populations of the Old World screwworm fly (pp. 549-555). Elsevier.
  • Herrera, E., Aguilar, I., Prendas, P., Figueroa, G., Travieso, C. & Ramírez, M. (2013). Photograph capture protocol for the creation of an automatic classification. En VIII Congreso Mesoamericano de Abejas Nativas (p. 337). Heredia: Universidad Nacional de Costa Rica.
  • Johnson, D. (2000). Métodos multivariados aplicados al análisis de datos. México: International Thomson Editores.
  • Lowe, D. (1999). Object recognition from local scale-invariant features. Proc. International Conference on Computer Vision, 1150-1157.
  • Lowe, D. (2004). Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 91-110.
  • Meléndez, R., Meneses, C. & Kevan, P. (2013). Effects of human disturbance and habitat fragmentation on stingless bees. En P. Vit, P. Silvia y D. Roubik (Eds.), Pot-Honey: A legacy of stingless bees New York: Springer.
  • Michener, C. (2007). The bees of the world. New York: Johns Hopkins University Press.
  • Quesada Euan, J. (2009). Potencial de las abejas nativas en la polinización. Acta Biológica Colombiana, 14(2), 169172.
  • Thompson, H. (2012). Behavioural Effects of Pesticides in Bees. Their Potential for Use in Risk Assessment. Ecotoxicology, 317-330.
  • Tofilski, A. (2008a). Automatic measurements of honeybee wings. En N. MacLeod (Ed.), Automated Taxon Identification in Systematics: Theory, Approaches and Applications (pp. 289-298). Florida: CRC Press.
  • Tofilski, A. (2008b). Using geometric morphometrics and standard morphometry to discriminate three morphometry to discriminate three honeybee subspecies. Apidologie , 39(5), 558-563.
  • Trejos, J., Castillo, W. & González, J. (2014). Análisis multivariado de datos métodos y aplicaciones. San José: Universidad de Costa Rica.
  • Tüzün, A. & Yüksel, S. (December 2011). Use of wing morphometry for the discrimination of some Cerceris (Insecta: Hymenoptera:Crabronidae Species). African Journal of Biotechnology, 10(80), 18569-18580.
  • Whitehorn, P., O’Connor, S., Walkers, F. & Goulson, D. (2012). Neonicotinoid pesticide reduces bumble bee colony growth and queen production. Science, 336, 351-352.

Fechas de Publicación

  • Publicación en esta colección
    May-May 2016

Histórico

  • Recibido
    19 Jun 2015
  • Acepto
    26 Set 2015
location_on
None Cartago, Costa Rica, Cartago, Cartago, Costa Rica, CR, 159-7050 , 25502336, 25525354 - E-mail: alramirez@itcr.ac.cr
rss_feed Acompanhe os números deste periódico no seu leitor de RSS
Acessibilidade / Reportar erro