Al hacer clic en "Aceptar", acepta que se almacenen cookies en su dispositivo para mejorar la navegación por el sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para obtener más información.
Conocimientos

Seguimiento de objetos: una tecnología en el corazón de la visión automatizada

Escrito por
Daniella
Publicado el
2024-10-24
Tiempo de lectura
Esto es un texto dentro de un bloque div.
min
📘 ÍNDICE
Muchas gracias. Hemos recibido su envío.
¡Uy! Algo ha ido mal al enviar el formulario.

El seguimiento de objetos es una técnica importante en el campo de la visión por ordenador, que permite seguir la posición y los movimientos de un objeto en una secuencia de imágenes o vídeos. Gracias a los avances de la inteligencia artificial, esta tecnología ha progresado notablemente, sobre todo con el uso de redes neuronales profundas. Estos modelos no sólo permiten rastrear objetos con precisión, sino también gestionar entornos complejos en los que los objetos pueden moverse rápidamente, cambiar de forma o enmascararse temporalmente.

Además, es importante señalar que el uso de esta técnica requiere no solo utilizar los algoritmos de inteligencia artificial adecuados, sino también utilizar 🔗 datos etiquetados para mejorar (y medir) el rendimiento de los sistemas de seguimiento. Combinando la IA con algoritmos de seguimiento de objetos, es posible lograr un seguimiento de una fiabilidad y precisión sin precedentes, lo que promete aplicaciones cada vez más potentes, ¡sobre todo en el campo del análisis de vídeo en tiempo real!

🧐 ¿Tienes curiosidad por saber más sobreel seguimiento de objetos? ¡Te lo contamos todo en este artículo!

¿Qué es el seguimiento de objetos?

El seguimiento de objetos es una tarea de visión por ordenador que consiste en rastrear la posición de un objeto específico a lo largo del tiempo en una secuencia de imágenes o vídeos. A diferencia de la simple 🔗 detección de objetosque identifica su ubicación en una sola imagen, el seguimiento de objetos sigue a ese objeto a lo largo de varias imágenes, lo que permite capturar su movimiento y sus interacciones con el entorno.

El proceso de seguimiento de objetos implica varios pasos clave. En primer lugar, el objeto debe detectarse en una imagen o vídeo mediante un algoritmo de detección. Una vez identificado, el algoritmo de seguimiento asigna un identificador al objeto para poder seguirlo a lo largo de las imágenes posteriores.

A continuación, el algoritmo predice la posición futura del objeto, teniendo en cuenta sus movimientos anteriores y las características de su entorno. Ajusta constantemente su predicción de movimiento a medida que el objeto se desplaza, incluso en caso de variaciones como un cambio de ángulo, de forma o la aparición de obstáculos (oclusión). Para garantizar un seguimiento preciso, es necesario que la información de seguimiento se actualice correctamente, sobre todo cuando cambia el aspecto del objeto o éste queda temporalmente ocluido.

Ejemplo de un caso de uso consistente en anotar un vehículo (en azul arriba), utilizando la funcionalidad Object Tracking de CVAT (fuente: 🔗 Innovatiana)

¿Cuáles son los principales algoritmos de seguimiento de objetos que se utilizan hoy en día?

En la actualidad, se utilizan habitualmente varios algoritmos para realizar el seguimiento y el análisis de objetos en visión por ordenador. Estos algoritmos, incluidas las redes neuronales profundas, varían en términos de precisión, velocidad y capacidad para manejar situaciones complejas como la oclusión o los cambios rápidos en el objeto rastreado. Es esencial utilizar la última versión de los algoritmos o modelos para mejorar el rendimiento del seguimiento de objetos.

He aquí los principales algoritmos utilizados actualmente:

KCF(filtro de correlación kernelizado)

Este algoritmo utiliza filtros de correlación para rastrear objetos en tiempo real con un bajo consumo de recursos. Es rápido y eficaz para rastrear objetos en entornos relativamente estables, pero puede ser menos efectivo en caso de oclusión o cambios drásticos en la apariencia del objeto.

MOSSE(Suma mínima de error cuadrático de salida)

MOSSE es un algoritmo de seguimiento muy rápido que utiliza filtros de correlación basados en la optimización del error cuadrático. Es adecuado para aplicaciones en tiempo real en las que la velocidad es más importante que la precisión absoluta. Sin embargo, su robustez puede verse limitada en entornos complejos.

CSRT(Filtro de Correlación Discriminativa con Fiabilidad de Canal y Espacial)

CSRT es una mejora de los algoritmos basados en filtros de correlación, como KCF. Tiene en cuenta la fiabilidad espacial y la discriminación de canales para lograr un seguimiento más preciso. Aunque es más lento que el KCF, maneja mejor las situaciones en las que cambia el aspecto del objeto o se produce una oclusión.

MedianFlow

Este algoritmo se centra en el seguimiento de objetos mediante la evaluación de trayectorias entre imágenes. Funciona muy bien con movimientos lentos y predecibles y es capaz de detectar errores de seguimiento, pero es menos adecuado para movimientos rápidos u objetos que sufren grandes transformaciones.

TLD(Seguimiento, Aprendizaje y Detección)

TLD combina el seguimiento con el aprendizaje continuo y la 🔗 detección de objetos. Es capaz de volver a aprender un objeto si desaparece momentáneamente del campo de visión o cambia de aspecto. Esta flexibilidad lo convierte en un potente algoritmo para rastrear objetos en entornos dinámicos, pero puede ser más lento que otros métodos.

DeepSORT(Seguimiento sencillo en línea y en tiempo real con una métrica de asociación profunda)

Este algoritmo combina el seguimiento de objetos en tiempo real con características extraídas mediante redes neuronales profundas. Es especialmente eficaz para el seguimiento de varios objetos en escenas complejas y para casos en los que los objetos siguen trayectorias impredecibles. Se suele utilizar con redes de detección de objetos como 🔗 YOLO o Faster R-CNN.

Redes siamesas(SiamRPN, SiamMask)

Las redes siamesas, como SiamRPN y SiamMask, utilizan 🔗 redes neuronales convolucionales para establecer correspondencias entre un modelo de objeto y las imágenes posteriores, lo que facilita el seguimiento. Estos algoritmos ofrecen un equilibrio entre velocidad y precisión, y son robustos a los cambios en la apariencia del objeto.

Filtro Kalman

El filtro de Kalman es un algoritmo probabilístico que predice la posición futura de un objeto a partir de su estado pasado y actual. Se utiliza mucho en sistemas en los que los objetos se mueven de forma predecible. Aunque es muy eficaz para movimientos lineales o ligeramente ruidosos, puede tener dificultades para seguir el ritmo de movimientos no lineales o erráticos.

Filtro de partículas(algoritmo de condensación)

Este algoritmo utiliza una serie de partículas para estimar la posición de un objeto, teniendo en cuenta las incertidumbres de su movimiento. El filtro de partículas es más flexible que el filtro de Kalman y puede manejar movimientos más complejos y no lineales. Sin embargo, es más costoso desde el punto de vista computacional.

Flujo óptico

El flujo óptico es un método que rastrea objetos analizando los movimientos de los píxeles entre imágenes. Resulta especialmente útil para rastrear objetos deformables o que cambian rápidamente, pero puede ser sensible a las variaciones de iluminación y es costoso desde el punto de vista computacional para imágenes de gran tamaño.

Logotipo


¿Ha pensado en crear conjuntos de datos a medida para sus casos de uso de Object Tracking?
No espere más, nuestro equipo de etiquetadores de datos especializados en visión por ordenador puede ayudarle a crear grandes conjuntos de datos de alta calidad. No dude en ponerse en contacto con nosotros.

¿Por qué es esencial la anotación de datos para el seguimiento de objetos en la IA?

Volvamos a nuestra actividad principal de preparar conjuntos de datos para alimentar pipelines de inteligencia artificial, también conocida como "🔗 anotación de datos".. Se trata de un componente esencial del seguimiento de objetos en inteligencia artificial (IA) porque la creación de metadatos (en otras palabras, añadir una capa semántica a los datos en bruto) desempeña un papel fundamental en el entrenamiento de modelos de visión por ordenador.

He aquí por qué la anotación de datos es tan importante en este campo:

1. Entrenamiento de modelos supervisados

El seguimiento de objetos basado en IA se basa generalmente en modelos supervisados, que requieren grandes cantidades de datos etiquetados para aprender a reconocer, detectar y seguir objetos específicos en una secuencia de vídeo o imagen. Estas anotaciones proporcionan información sobre la posición, la clase y, a veces, el aspecto de los objetos en cada imagen. Sin datos debidamente anotados, los modelos de IA no pueden aprender a distinguir entre objetos, lo que compromete su capacidad para rastrearlos con precisión.

2. Delimitación de los objetos a rastrear

La anotación de datos permite definir claramente los recuadros delimitadores (🔗 Cuadros delimitadores) alrededor de los objetos a rastrear. Estas delimitaciones permiten al algoritmo deseguimiento de objetos entender dónde empieza y termina un objeto. En algunos casos, anotaciones más avanzadas como 🔗 máscaras de segmentación se utilizan para identificar los contornos exactos del objeto, lo que resulta esencial para un seguimiento preciso, sobre todo en entornos complejos.

3. Mejorar la precisión del modelo

Los datos anotados proporcionan una base sobre la que el modelo ajusta constantemente sus predicciones y parámetros. Cuanto más precisas y variadas sean las anotaciones, mejor podrá el modelo seguir objetos en entornos diversos, teniendo en cuenta los cambios de escala, ángulo, oclusión o deformación. Por otra parte, unos datos incompletos o mal anotados pueden dar lugar a modelos sesgados o inexactos.

4. Gestión de escenarios complejos

Las anotaciones permiten captar situaciones complejas y difíciles del mundo real, como laoclusión (cuando el objeto está temporalmente enmascarado), los movimientos rápidos, los objetos parcialmente visibles o las interacciones entre varios objetos. Estas anotaciones son esenciales para que los algoritmos de entrenamiento puedan predecir correctamente la trayectoria de un objeto, incluso cuando desaparece momentáneamente del campo de visión.

5. Facilitar el seguimiento de varios objetos

En los casos en que es necesario rastrear varios objetos simultáneamente, la anotación de datos adquiere una importancia aún mayor. Los modelos deseguimiento de objetos múltiples dependen de la correcta asignación deidentificadores únicos a cada objeto, de modo que puedan seguirse individualmente a lo largo de la secuencia. Unas anotaciones adecuadas permiten disociar los objetos y evitar confusiones entre ellos, sobre todo cuando interactúan o se solapan.

6. Enriquecer los modelos mediante la diversidad de datos

Los modelos de IA requieren datos diversificados para poder generalizar adecuadamente. Las anotaciones ayudan a enriquecer estos datos incluyendo distintos tipos de objetos, desde distintos ángulos, con variaciones de luz y movimiento, y en distintos entornos. Esto hace que los modelos sean más robustos y puedan adaptarse mejor a las condiciones reales durante su despliegue.

7. Validación y evaluación del rendimiento

Por último, la anotación también es esencial en las fases de validación y evaluación de los modelos de IA. Los datos anotados se utilizan para medir la precisión de los algoritmos de seguimiento comparando sus predicciones con la realidad. Esto ayuda a detectar errores, ajustar parámetros y mejorar el rendimiento de los modelos antes de utilizarlos en producción. Una validación y evaluación adecuadas son necesarias para garantizar el éxito del seguimiento de objetos, asegurando resultados precisos y fiables.

Conclusión

El seguimiento de objetos, potenciado por las capacidades de la inteligencia artificial, es hoy una herramienta esencial en el campo de la visión por ordenador. Gracias a algoritmos cada vez más potentes y a conjuntos de datos de alta calidad (es decir, imágenes y vídeos enriquecidos con etiquetas semánticas), los sistemas de seguimiento de objetos pueden operar en entornos complejos y cumplir requisitos de precisión en tiempo real.

Esta técnica tiene aplicaciones en sectores tan diversos como la seguridad, la robótica, los vehículos autónomos y el análisis deportivo. A medida que las técnicas de anotación y los métodos de Deep Learning siguen evolucionando, los algoritmos de seguimiento de objetos son cada vez más robustos y flexibles, lo que hace que la visión automatizada sea más fiable que nunca. Y a medida que mejora el acceso a los recursos de datos, ¡estas innovaciones prometen transformar aún más la forma en que interactuamos con el mundo visual!

Preguntas más frecuentes

El seguimiento de objetos es una técnica de visión por ordenador que consiste en rastrear la posición de un objeto específico a lo largo del tiempo en una secuencia de imágenes o vídeos. A diferencia de la detección de objetos, que identifica la ubicación de un objeto en una sola imagen, el seguimiento capta los movimientos e interacciones de ese objeto en un entorno continuo, lo que hace que el análisis sea dinámico y en tiempo real.
Se suelen utilizar varios algoritmos, como KCF para el seguimiento rápido en tiempo real, DeepSORT para el seguimiento simultáneo de varios objetos y redes siamesas (SiamRPN, SiamMask) para mejorar la precisión en diversos entornos. Estos algoritmos se aplican en seguridad, vehículos autónomos, robótica y análisis deportivo, donde es importante un seguimiento rápido y preciso de los objetos.
La anotación de datos, mediante la adición de etiquetas y metadatos, permite a los modelos de inteligencia artificial aprender a identificar y rastrear objetos con precisión. Delimita los objetos, proporciona información sobre su clase y posición y mejora la capacidad de los modelos para gestionar entornos complejos. Sin una anotación de alta calidad, es probable que los modelos tengan una precisión limitada.
Los principales retos son la oclusión (cuando el objeto se enmascara temporalmente), los cambios de forma y los movimientos rápidos. Para superarlos, algoritmos avanzados como CSRT y DeepSORT utilizan métodos de predicción y actualización constantes que permiten continuar el seguimiento aunque el objeto desaparezca momentáneamente o cambie de aspecto.
El seguimiento de objetos se utiliza ampliamente en seguridad (vigilancia con cámaras), transporte (vehículos autónomos), robótica, deporte (análisis de los movimientos de los atletas) y comercio minorista (análisis de los flujos de clientes). Estas aplicaciones permiten optimizar la seguridad, mejorar el rendimiento deportivo y comprender mejor el comportamiento de los consumidores en tiempo real.