La empresa fabricante de tarjetas gráficas NVidia lleva algunas semanas dándonos bastantes noticias: la compra de ARM, la creación de su nueva generación de tarjetas gráficas que mejora «en teoría» hasta un 20% el rendimiento de la anterior generación y por último, un sistema en la nube que, potenciado por Inteligencia Artificial gracias a sus procesadores GPU mejoran considerablemente la forma en la que hoy día hacemos videoconferencias.
El sistema NVIDIA Maxine es una plataforma de videoconferencia potenciada por Inteligencia Artificial que, tal y como podéis ver en el siguiente vídeo, mejora las videoconferencias en tiempo real gracias a varias ventajas:
Super-Resolución (permite gracias a la inteligencia artificial) crear un vídeo de alta calidad basado en un vídeo de «baja calidad» de manera que, aunque el ancho de banda sea muy limitado, al receptor de la videoconferencia obtendrá una calidad de imagen casi perfecta. Por supuesto, no puede inventar lo que no existe… pero hablando de Inteligencia Artificial… ¿por qué no?
AutoFrame permite al sistema rastrear y rastrea y mover la sección de video para que siempre esté en el centro de la imagen
Virtual Background, y es que si esta funcionalidad ya estaba en la mayoría de sistemas de videoconferencias, parece ser que con una GPU y un poco de IA, la detección de fondos puede ser algo mucho más fácil.
Denoise, para aquellos que tienen bastante ruido de fondo y necesitan que un sistema de IA analice el audio y filtre convenientemente el ruido que no sea el del interlocutor.
Avatar: de la misma manera que lo hacen los Memojis de Apple, NVidia ha encontrado otra forma de aplicar los movimientos de la cara a figuras y avatares.
Traducción en tiempo real, y es que esto también es algo que tienen algunos sistemas, gracias a la conexión con una fuente de reconocimiento y traducción automática como la de Google.
Compresión de vídeo. Esto considero que es algo muy, muy interesante, y es que permite al sistema reconocer tu cara, los gestos y los movimientos para crear por Inteligencia Artificial tu propia imagen con la nueva postura sin llegar a transmitir todo el frame, únicamente la posición de los puntos clave.
Alineamiento de la cara, y es que ahora gracias a las redes neuronales GAN ya pueden «autocompletar» la información que les falta y pueden mover la cabeza de la persona rellenando con información nueva los datos que no tienen. El resultado es impresionante.
El vídeo completo podéis verlo aquí, y así poder ver en pleno funcionamiento estas nuevas características. Al parecer ya hay empresas que lo están utilizando para sus sistemas de videoconferencia, no tiene pinta de barato, pero lo que sí está claro es que NVidia está dando unos pasos muy grandes para convertirse en otra de las empresas de oro.
Otro vídeo por si os habéis quedado con ganas de más