En diversas ocasiones hemos expuesto sobre esta tecnología que está cambiando al mundo como lo conocemos, siendo la Inteligencia Artificial. Particularmente, nos hemos enfocado en machine learning, siendo los algoritmos por la cual la plataforma aprende. Sin embargo, hemos evitado el tema de costos para entrenar. En esta ocasión trataremos de sus avances.

Situación

El proceso de entrenar a las IA es un tema delicado, dado que debe poseer la cantidad suficiente de ejemplos para aprender. Por esta razón, las empresas que se dedican a investigar y desarrollar nuevas plataformas invierten una cantidad considerable de recursos. Por lo cual, es de suponer que nuevos y pequeños emprendedores les cuesta ingresar a este mercado.

Sin embargo, los investigadores del MIT, con las personas de IBM Watson IA Lab, han desarrollado una nueva técnica para entrenar modelos de reconocimiento de video en un teléfono u otro dispositivo con una capacidad de procesamiento muy limitada.

Típicamente, un algoritmo procesa el video dividiéndolo en cuadros de imagen y ejecutando algoritmos de reconocimiento en cada uno de ellos. Luego junta las acciones que se muestran en el video al ver cómo cambian los objetos en los cuadros posteriores. El método requiere que el algoritmo “recuerde” lo que ha visto en cada cuadro y el orden en que lo ha visto. Esto es innecesariamente ineficiente, por lo cual, consume recursos demás.

En el nuevo enfoque, el algoritmo IA extrae bocetos básicos de los objetos en cada cuadro y los superpone uno encima del otro. Por lo tanto, ya no tiene que recordar lo que sucedió. De esta forma, el algoritmo puede tener una impresión del paso del tiempo al observar cómo los objetos se mueven a través del espacio en los bocetos.

En las pruebas, los investigadores descubrieron que el nuevo enfoque podría entrenar a los modelos de reconocimiento de video tres veces más rápido. También fue capaz de clasificar rápidamente los gestos con las manos con una pequeña computadora y una cámara funcionando solo con suficiente energía para alimentar la luz de una bicicleta.

Impacto

Esta nueva técnica podría ayudar a reducir los retrasos y los costos de cómputo en las aplicaciones que se basan en Inteligencia Artificial comerciales existentes de visión por computadora.

Podría, por ejemplo, hacer que los autos autónomos sean más seguros al acelerar su reacción a la información visual entrante. La técnica también podría desbloquear nuevas aplicaciones que antes no eran posibles, como habilitar teléfonos para ayudar a diagnosticar pacientes o analizar imágenes médicas.

Deja un comentario