En las películas de superhéroes, como las de Marvel, existen escenas donde una Inteligencia Artificial puede reconocer objetos al observarlos, como Jarvis en Iron Man. Si bien aún no existe esta plataforma, las personas de Facebook se están acercando, creando una IA que lleva lo 2D a 3D.

Del plano al relieve

En una publicación de blog hoy Facebook destacó sus últimos avances con respecto a la comprensión inteligente del contenido con machine learning. Dice que, en conjunto sus sistemas se pueden usar para detectar incluso objetos complejos de primer plano y de fondo. Utilizan como ejemplo las patas de una silla o muebles superpuestos.

Imagen de referencia del post de Facebook sobre su Inteligencia Artificial
Imagen de referencia del post de Facebook sobre su Inteligencia Artificial

“Nuestra investigación se basa en los avances recientes en el uso del machine learning para predecir y localizar objetos en una imagen, así como nuevas herramientas y arquitecturas para la comprensión de formas en 3D”, escribieron los investigadores de Facebook Georgia Gkioxari, Shubham Tulsiani y David Novotny en una publicación de blog.

“La comprensión tridimensional desempeñará un papel central en el avance de la capacidad de los sistemas de inteligencia artificial para comprender, interpretar y operar más de cerca en el mundo real”.

Una de las obras destacadas es Mesh R-CNN, una plataforma que puede predecir formas tridimensionales a partir de imágenes de objetos desordenados y ocluidos.

Facebook dice que Mesh R-CNN detecta con éxito objetos de todas las categorías y estima su forma tridimensional completa en escenas de muebles.

También con cuerpos

Otro sistema desarrollado por Facebook, Canonical 3D Pose Networks, abreviado C3DPO, aborda escenarios en que las imágenes correspondientes no están disponibles para la capacitación. Construye reconstrucciones de modelos tridimensionales de puntos clave, logrando resultados de reconstrucción utilizando la supervisión bidimensional de puntos clave.

C3DPO toca un modelo de reconstrucción que predice los parámetros del punto de vista de la cámara correspondiente y las ubicaciones de los puntos clave tridimensionales. Un componente auxiliar aprende junto con el modelo para abordar la ambigüedad introducida en la factorización de puntos de vista y formas tridimensionales.

Imagen de Facebook sobre la reconstrucción de su Inteligencia Artificial de C3DPO
Imagen de Facebook sobre la reconstrucción de su Inteligencia Artificial de C3DPO

Impacto

Más allá de acercanos a las plataformas de Inteligencia Artificial expuestas en las películas. Las personas de Facebook están mejorando las capacidades de otras tecnologías, particularmente la de Realidad Aumentada. Con estas mejoras, los objetos de la RA gradualmente empezarán a mejorar y parecer más reales.

Deja un comentario