Hacemos balance del año en VAZZINE. Un 2021 espectacular para los diferentes canales de contenido (YouTube, ‘Espresso con Víctor’, ‘Café con Víctor’, magazine y newsletter). Y un año con hitos tan importantes como la charla que pude mantener con Craig Federighi, vicepresidente de software de Apple. Una entrevista que sirvió para que nos explicara por dónde pasa el futuro de uno de sus productos estrella: Siri.
SPOTLIGHT
– La entrevista con Craig Federighi, uno de los highlights del año
– El senior Vice President de ingeniería de Apple nos explicó en qué consiste la evolución de Siri
– Una charla que tuvo lugar después de la Keynote de Apple celebrada en junio del 2021
Desde que en marzo de 2020 estalló la pandemia global, las redes crearon el meme de que el mundo se paró en 2019 y tanto el propio 2020 como el año que estamos a punto de despedir, no eran más que bises. Como las canciones finales de un concierto. Más allá de reírnos con el meme y el running gag, no podemos estar más en desacuerdo.
El año 2021 ha sido apasionante y, fuera del Covid, pasará a la historia por muchos más motivos. Solo a nivel tech, encontramos que las grandes corporaciones tecnológicas se arremangaron para lanzar productos y gadgets que mejoraran esta nueva normalidad. Por no hablar de la explosión del trabajo en remoto y las facilidades que compañías como Apple nos han presentado para ello.
Siri tiene más versatilidad en las respuestas, fluye más natural y ofrece voz masculina y femenina.
Entre todas las novedades que Apple nos ha ido trayendo durante este 2021, una muy importante se presentó durante la celebración de la Keynote inaugural de la conferencia de desarrolladores de Apple, la WWDC 2021. En dicha conferencia del 7 de junio, la empresa con sede en Cupertino nos habló de la siguiente versión de su sistema operativo. Un iOS 15 que finalmente llegó en octubre. Y de algo más concreto aún, de la transformación de Siri en un asistente de voz mucho más independiente.
Para profundizar en las mejoras de Siri y que pudieran ser explicadas de manera inside, el equipo de House of VA quiso tirarle la caña a los máximos ejecutivos de Apple. ¿Por qué no hablar con alguno de los responsables de manera directa? El resultado fue espectacular: un Facetime con Craig Federighi, vicepresidente de software de Apple, que convertí en una entrevista para el canal de YouTube.
¿Qué tiene pensado la compañía con este asistente?
El asistente virtual de voz de Apple lleva nueve años con nosotros. Un Siri que está en todos los dispositivos de la compañía: iPhone, iPad, ordenador… ¡y hasta en la tele! Pero, puestos a profundizar, podemos decir que aún le faltaban algunos pasos. Hoy es 2021 (casi 2022) y octubre del 2011 ha quedado muy lejos. La competencia existente, con los asistentes de Google y el Alexa de Amazon, es feroz. Rivales que, por citar un solo ejemplo, ya permiten reservar mesas en un restaurante. Por todo ello, una de las preguntas que quedaban en el aire era: ¿quién nos escucha al otro lado?
De todo ello quise hablar con Craig Federighi, vicepresidente de software de Apple. Fue a través de un FaceTime que mantuve con él y que se convirtió en uno de los grandes hitos de este 2021. Quise preguntarle qué ha llevado a Apple a actualizar Siri. Mejoras que van más allá del incremento de la versatilidad en las respuestas, de la voz que fluye más natural o de la posibilidad de escoger entre voz masculina o femenina. Porque la mayor de las implementaciones la encontramos en cómo las consultas ya no tienen porque mandarse ahí fuera.
“Con el tiempo, más y más cosas se harán solamente en el dispositivo”.
Siri va a procesar nuestros comandos dentro del dispositivo. Y algunos de esos comandos no van a necesitar el uso de Internet. ¿Cuáles eran los motivos? ¿Se van a beneficiar terceras apps de esta característica offline de Siri? Craig nos contestó en profundidad.
Hemos estado muchos años trabajando para mover todo el ML, todo el proceso de aprendizaje automático al dispositivo, ya que es el lugar que mejor protege tu actividad, para que tus datos nunca tengan que salir de tu dispositivo y también puede darte el mejor rendimiento, porque toda la computación está ahí. Por tanto, hemos construido estas capacidades en cada generación de chips para darnos más potencia en el dispositivo y hacer esto. Así que hemos llegado a un punto con el Neural Engine de Apple en el que podemos hacer una síntesis natural de la voz. Oyes hablar a Siri y es una voz natural”.
Craig Federighi, vicepresidente de software de Apple
En la entrevista con Craig Federighi pudimos entender cómo “todo el reconocimiento de voz” (es decir, cómo Siri entiende lo que dices) pasaba por una mejora en “el procesamiento de lenguaje natural”. Esto es gracias a Neural Engine, que se ha ido perfilando y perfeccionando para que el asistente acabe siendo independiente de una conexión a la red: “Empezamos con algunos comandos que ejecutan todo el procesamiento de tu voz que ocurre en tu dispositivo y, dependiendo de lo que pidas, algunas cosas se pueden hacer estando offline completamente y otras veces hablará al servidor. Con el tiempo, más y más cosas se harán solamente en el dispositivo”.
Si el presente se basa en “algunas cosas que se pueden hacer estando offline completamente y otras veces hablará al servidor”, el futuro solo puede pasar por Siri siendo quién realice el procesamiento en nuestros dispositivos. Pero, ¿estas mejoras se aplicarán a terceros? ¿Los desarrolladores lo podrán usar en apps que funcionen más rápido con Siri?
La respuesta sobre cómo iban a implementar estas mejoras fue sorprendente. No quieren que Siri se limite a un asistente para productos de Apple. Sino que vaya más allá del ecosistema y otros fabricantes lo integren a sus productos. Por ejemplo, al termostato para subir o bajar la temperatura. Abrir Siri a los fabricantes es un gran movimiento.
El futuro de Siri es prometedor
El objetivo es que cada vez existan más cosas dentro de iPhone y que Siri sea más independiente a la hora de mandar datos fuera. El hecho de que Siri pueda funcionar en gran medida dentro de los iPhone sin tener que mandar ninguna grabación de voz a un servidor externo, resulta indispensable.
Otro de los temas que comentaba Craig Federighi es que no es solo útil para la privacidad, también para la productividad. Las peticiones que le haces al asistente en el día a día (actividades tan cotidianas como el encendido de luces, activar notificaciones o conectar una alarma) al no tener que mandar los datos al exterior, las ejecutará más rápido.
Apple tiene muchos planes para el asistente. Y entre ellos está el hecho de que convertirlo en más seguro y más integrador con otras marcas.