Secciones
Sociedad

Física chilena modela la retina humana para enseñar a la IA a predecir movimiento en video

El sistema ACCLIP superó en precisión estructural a los mejores modelos existentes en tres pruebas de referencia internacional. El equipo trabaja en integrar el modelo en un robot arácnido para que anticipe y esquive objetos en movimiento en entornos dinámicos.

Un modelo de inteligencia artificial desarrollado por la física chilena Soraya Mora predice el movimiento de objetos en video con precisión de hasta casi un minuto hacia el futuro, superando en coherencia estructural a los mejores sistemas existentes en tres pruebas de referencia internacional.

El sistema, llamado ACCLIP, toma como referencia el mecanismo con que la retina humana rastrea objetos en movimiento: en lugar de procesar la escena completa, identifica puntos de interés y calcula su desplazamiento entre fotogramas.

“El flujo óptico busca puntos de interés como los bordes de un objeto y mide cuánto se movieron de una imagen a la siguiente. La retina no ve el objeto completo porque sino sería mucha información, lo que hace es detectar puntos de interés y va trazando cuál es el movimiento a través del tiempo”, explicó la investigadora postdoctoral del Centro Ciencia & Vida, de la Fundación Ciencia & Vida y la Universidad San Sebastián (FCV-USS).

Los sistemas de IA que procesan video enfrentan un límite: las arquitecturas convolucionales predicen bien el movimiento en horizontes cortos, pero pierden coherencia al extender el número de fotogramas. Los modelos recurrentes mejoran la consistencia temporal, pero tienen alto costo computacional. Los métodos basados en flujo óptico existentes tampoco resolvían el problema: cada horizonte temporal requería un nuevo cálculo completo. ACCLIP apuntó a cerrar esa brecha.

Para identificar dónde incorporar el flujo óptico, Mora construyó tres modelos inspirados en distintos niveles de la jerarquía del sistema nervioso visual: uno análogo a la retina, otro a la corteza visual y un tercero, ACCLIP, a la corteza de asociación cerebral. “Fui moviendo el flujo óptico a distintos niveles análogos al sistema nervioso para ver cuál generaba mejores predicciones. El que mejor funcionó fue ACCLIP”, relató la investigadora.

El sistema tiene un límite claro: predice bien el movimiento, pero pierde fidelidad en la forma del objeto cuando la secuencia se extiende. La causa son las sombras: el flujo óptico detecta bordes y contornos, que desaparecen en zonas oscuras. En escenas de tráfico urbano, el modelo mantiene calidad aceptable hasta los 18 fotogramas. “Si logro mejorar cómo calculo el flujo óptico en zonas oscuras, la predicción va a ser exacta tanto en movimiento como en imagen, en horizontes largos”, afirma Mora.

Los sistemas de visión robótica actuales detectan objetos en tiempo real, pero no anticipan trayectorias. El equipo ya trabaja en integrar ACCLIP en un robot arácnido.

Notas relacionadas












Bielsa, un hombre aparte

Bielsa, un hombre aparte

Bielsa gana los partidos en la conferencia de prensa, y los gana respondiendo siempre otra cosa de la que le preguntan. Es un hombre aparte, distinto y único, pero es también en todo eso un hombre de este tiempo.

Foto del Columnista Rafael Gumucio Rafael Gumucio