Microsoft: nuevo software que podría narrar fotografías

Microsoft

La división de investigación de Microsoft parece que ha desarrollado un nuevo sistema de inteligencia artificial que puede generar historias de forma automática utilizando tan solo tus fotos, intentando en el proceso no solo explicar qué es lo que sucede exactamente en esas imágenes; sino que también detallaría el contexto y los sentimientos de dichas personas. Este proceso de desarrollo de narración de historias está basado en sistemas de inteligencia artificial capaces de identificar objetivos, después de haber aprendido de ciertos ejemplos tal y como explican desde la web LiveScience. Los investigadores primero configuraron el sistema para que analizase una serie de imágenes parecidas, y después buscase en la red más ejemplos para poder identificar mayor cantidad de objetos que fuesen de la misma categoría. No solo eso, el equipo de investigación de Microsoft ha acudido al Amazon Mechanical Turk, un servicio por el cual la gente puede describir escenas de un puñado de fotos. de ese modo, los sistemas de inteligencia artificial aprenden de los mismos y acaban generaron nuevos al unir diferentes imágenes con más de una descripción. Hay un total de 8100 fotos dentro de este proyecto en su fase de prueba, de modo que se pueda determinar lo bien que la tecnología de IA funciona y si puede crear historias basadas en la información ya recibida.

Microsoft hará las actualizaciones de Windows 10 más rápidas y cortas

Microsoft-logo

Una forma de marcar la diferencia

Con este nuevo software, se podría avanzar dentro del ámbito de los sistemas de reconocimiento fotográfico que ya conocemos hoy en día. Con este cambio, pasaría de una simple descripción que dijera cosas como “esto es la foto de una familia” o “es la foto de una tarta” a oraciones más complejas como pueden ser “la familia se reunió para comer tarta juntos”.

De momento parece que la tecnología se encuentra en sus primeros pasos, por lo que parece que aún tardará algún tiempo en mejorar lo suficiente como para que resulte útil. Parece que los investigadores ya han topado con algunos problemas que podrían aparecer si se popularizase, como por ejemplo los problemas para distinguir ciertas palabras. También se habla de que en algunos exámenes, se terminaba describiendo cada foto simplemente como “genial”.

Aunque queda mucho margen de mejora aún, parece que Microsoft está muy implicada y quiere aplicar esta tecnología no solo a fotos, sino a videos también y otras formas de contenido multimedia. Puede ser una ayuda para gente con problemas de vista y podría servir como herramienta para facilitar el acceso a las nuevas redes sociales para estas personas.

Déjanos tu comentario

avatar
wpDiscuz