¿Cómo responder a los retos en materia de medio ambiente y desarrollo sostenible?

hace 49 mins

La mujer que, sin saberlo, terminó siendo la voz de Siri

Susan Bennett fue la primera encarnación de este asistente virtual que hoy tiene versiones en varios idiomas y acentos. Un segmento en el que también compiten Google, Amazon y Microsoft.

Flickr - Mike Licht

“Mi vida como una máquina comenzó muy joven”. Susan Bennett está acostumbrada a escuchar su voz en aeropuertos, en cajeros automáticos, en dispositivos GPS. El don de la ubicuidad puede que sea lo suyo, más aún cuando es la voz de Siri, el asistente virtual de Apple, para Norteamérica. (Lea "Apple se la juega por la inclusión de Siri en todos sus dispositivos")

A decir verdad, Siri es un sistema con una multiplicidad de caras, con un desorden de personalidad hecho por diseño. Bennett encarna la herramienta para el inglés de Estados Unidos y Canadá, mientras que Jon Briggs aporta el acento británico y Karen Jacobsen le aporta el toque australiano, por ejemplo.

Bennett es particularmente importante en esta esquizofrenia corporativa, pues fue la primera persona en darle una voz a una herramienta que, para su momento, parecía innovadora. Todo esto sin siquiera saber que sus palabras animaban la vida de millones de iPhone en todo el mundo (Apple ha vendido más de 700 millones de unidades de sus teléfonos inteligentes). (Lea "Cómo la inteligencia artificial puede redefinir el futuro de cosas como el trabajo y la salud")

Esta profesional de doblaje grabó toda la personalidad de Siri durante julio de 2005 en sesiones diarias de cuatro horas en las que, monótonamente, interpretó una vasta cantidad de palabras y sonidos que, en un proceso conocido como concatenación, después son incorporados para proveer al asistente virtual de cierta especie de personalidad.

Siri entró en funcionamiento en 2011, con el iPhone 4S, sin que Bennett estuviera consciente de que su trabajo de lectura de texto había sido añadido en el sistema. Sólo se enteró cuando un amigo, quien también es actor de doblaje, le envió una respuesta de Siri por correo preguntándole “¿eres tú?”.

Lo mismo le sucedió a Briggs y a Jacobsen. Todos grabaron audios para el proceso de concatenación que, una vez hecho, fueron vendidos o licenciados a Apple. “La verdad me asustó un poco descubrir que esa era mi voz”, cuenta Bennett en una de los cientos de entrevistas que ha ofrecido después de revelarse como la voz original de Siri. “Estoy muy acostumbrada a escucharme en los aeropuertos diciendo ‘gracias por usar Delta Airlines’, pero esto es diferente porque se trata de un dispositivo personal, listo para interactuar con la gente desde la palma de la mano”.

A pesar de ser la compañía para millones de usuarios de iPhone, estos profesionales de la voz han sentido por momentos que Apple quizá debería reconocerlos más. Aunque a todos les pagaron el trabajo original de concatenación, ninguno recibió un centavo extra por ser parte de un sistema que bien puede llamarse global. Bennett incluso cuenta que una de las personas que hizo la voz de Siri fue despedida de su trabajo, pues su empleador consideraba que Apple era su competencia. “Su voz le daba vida al iPhone y por eso perdió su empleo”.

Un mundo de asistencia

Amazon, Microsoft, Google y Apple son los grandes nombres detrás de los asistentes virtuales, una forma de interacción entre el dispositivo y el usuario que, aunque busca descomplicar la relación de la persona con su vida digital, puede resultar demasiado complicada de usar o entender para el promedio de los usuarios.

Aunque en un principio fueron diseñados como una especie de sistemas para tomar notas y modificar citas en el calendario, hoy los asistentes virtuales intentan ser casi que compañeros de vida para quienes prefieren no perder un par de minutos haciendo una lista de mercado o verificando qué reuniones tiene planeadas para el día.

Pero más allá de sus limitaciones presentes (varias y notables), el reino de los asistentes virtuales es quizá uno de los campos más prominentes para el desarrollo de inteligencia artificial en términos de reconocimiento de voz y aprendizaje por contexto.

El producto que quizá mejor encarna esta visión es Assistant, de Google. Este producto fue anunciado en mayo de este año durante I/O, la conferencia anual de la empresa. En ella, Sundar Pichai, CEO de la compañía, dijo “estamos en el momento en el que la inteligencia artificial puede dar un gran salto hacia el futuro y redefinir la tecnología de los próximos 10 años” para luego ofrecer una demostración de su perspectiva sobre el futuro de la interacción entre el humano y la máquina. (Lea "La visión de Google para redefinir la forma como interactuamos con las máquinas")

Un usuario puede preguntarle a Google quién dirigió la película “El renacido”. El buscador entrega la respuesta y la persona responde con una frase: “Quiero saber más de él”. “Manejar contrapreguntas de los usuarios es algo muy complicado para un computador, especialmente cuando se hacen informalmente, como lo haría uno en una conversación. Lo que queremos es que Assistant sea capaz de interactuar con la gente hablando, que tenga la capacidad de conversar con los usuarios. Y esto no es fácil”, dijo Pichai.

Assistant es transversal a la experiencia Android, lo que significa que su presencia se sentirá en el carro a través de Android Auto o en la casa cuando esté disponible Google Home, una especie de centro de control para casas inteligentes.

Este último es justo el terreno de Alexa, el asistente de Amazon que puede encontrarse en Echo, el dispositivo para el hogar de la compañía. Aunque no aspira a desarrollar tantas tareas como Assistant, varias pruebas muestran que su reconocimiento de voz es superior al de varios de sus competidores. Y esta ventaja pasa a través de la posibilidad de aprender del usuario, identificar cómo funciona su dicción para entender justo lo que quiere decir cuando lo dice.

Y aquí juegan cosas como identificación de patrones, así como aprendizaje reforzado, una técnica en la que una máquina se prueba contra sí misma para mejorar en sus respuestas ante determinados comandos o comportamientos.

Temas relacionados