Skip to content

Google, la compañía que desafía a la Inteligencia Artificial

Inteligencia Artificial Google

Inteligencia Artificial Google

Jun Rekimoto, un distinguido profesor de interacción hombre-computadora en la Universidad de Tokio, se preparaba para una conferencia cuando empezó a notar algunos mensajes peculiares en los medios de comunicación social. Al parecer, Google Translate, el popular servicio de traducción automática de la empresa, ha mejorado repentinamente y casi infinitamente. Rekimoto probó traducirse a sí mismo y comenzó a experimentar con él. Estaba asombrado. Tuvo que ir a dormir, pero el traductor se negó a relajar su control sobre su imaginación.

Rekimoto escribió sus hallazgos iniciales en un blog. En primer lugar, comparó algunas frases de dos versiones publicadas de “The Great Gatsby”, la traducción de 1957 de Takashi Nozaki y la iteración más reciente de Haruki Murakami, con lo que este nuevo Google Translate fue capaz de reproducir. La traducción de Murakami está escrita “en japonés muy pulido“, explicó Rekimoto, pero la prosa es distintivamente “estilo Murakami“. Por el contrario, la traducción de Google (a pesar de algo “poco natural”) se lee como “más transparente. “

La segunda mitad del puesto de Rekimoto examinó el servicio en la otra dirección, del japonés al inglés. Se desprendió de su propia interpretación japonesa de la apertura a “Las nieves del Kilimanjaro” de Hemingway, luego corrió ese pasaje a través de Google en inglés. Publicó esta versión junto con el original de Hemingway, y procedió a invitar a sus lectores a adivinar cuál era el trabajo de una máquina.

N1

Kilimanjaro es una montaña nevada de 19.710 pies de altura, y se dice que es la montaña más alta de África. Su cumbre occidental se llama Masai “Ngaje Ngai”, la Casa de Dios. Cerca de la cumbre occidental hay la carcasa seca y congelada de un leopardo. Nadie ha explicado lo que el leopardo estaba buscando en esa altitud.

N2

Kilimanjaro es una montaña de 19.710 pies cubiertos de nieve y se dice que es la montaña más alta de África. La cumbre del oeste se llama “Ngaje Ngai” en Masai, la casa de Dios. Cerca de la parte superior del oeste hay un cuerpo seco y congelado de leopardo. Nadie ha explicado nunca qué leopardo quería en esa altitud.

Su cercanía era una fuente de asombro para Rekimoto, que conocía bien las capacidades del servicio anterior. Sólo 24 horas antes, Google habría traducido el mismo pasaje japonés de la siguiente manera:

Kilimanjaro es 19.710 pies de la montaña cubierta de nieve, y se dice que la montaña más alta de África. La parte superior del oeste, “Ngaje Ngai” en la lengua de Maasai, se ha referido como la casa de dios. La parte superior cerca al oeste, hay una carcasa seca, congelada de un leopardo. Si el leopardo tenía lo que la demanda a esa altitud, no hay nadie explicó.

Rekimoto promovió su descubrimiento a sus cientos de miles de seguidores en Twitter, y durante las próximas horas miles de personas transmitieron sus propios experimentos con el servicio de traducción automática. Algunos fueron exitosos, otros significaron principalmente para el efecto cómico. A medida que amaneció en Tokio, Google Translate fue la tendencia número uno del Twitter japonés, justo por encima de algunas series de culto de anime y el tan esperado nuevo single de un supergrupo de ídolos de niñas. Todo el mundo se preguntaba: ¿Cómo se había convertido Google Translate en algo tan extrañamente ingenioso?

Cuatro días después, un par de cientos de periodistas, empresarios y publicistas de todo el mundo se reunieron en la oficina de ingeniería de Google en Londres para un anuncio especial. Los invitados fueron recibidos con las galletas de la fortuna de traducciones calificadas. Sus papeles tenían una frase extranjera de un lado y por otro, una invitación a descargar la aplicación para traducir de Google. Las mesas estaban decoradas con bandejas de donas y batidos, cada una marcada con un letrero que anunciaba su sabor en alemán (zitrone), portugués (baunilha) o español (manzana).

Sadiq Khan, el alcalde de Londres, se puso de pie para hacer algunos comentarios de apertura. Un amigo, comenzó, le había dicho recientemente que le recordaba a Google. -¿Por qué, porque sé todas las respuestas? -preguntó el alcalde. -No -respondió el amigo-, porque siempre estás tratando de terminar mis oraciones. La muchedumbre se burló cortésmente. Khan y concluyó presentando al presidente ejecutivo de Google, Sundar Pichai, quien subió al escenario.

Pichai estuvo en Londres en parte para inaugurar el nuevo edificio de Google, la piedra angular de un nuevo “cuarto de conocimiento” en construcción en King’s Cross, y en parte para desvelar la finalización de la fase inicial de una transformación de la compañía anunciada el año pasado. El Google del futuro, Pichai había dicho en varias ocasiones, iba a ser “inteligencia artificial primero “. Lo que eso significaba en teoría era complicado y había recibido muchas especulaciones. Lo que significaba en la práctica, con cierta suerte, era que pronto los productos de la empresa ya no representarían los frutos de la programación de computadoras tradicionales, sino “el aprendizaje automático“.

Un departamento enrarecido dentro de la compañía, Google Brain, fue fundado hace cinco años sobre este mismo principio: que las “redes neuronales” artificiales que se familiarizan con el mundo a través del ensayo y el error, como los niños pequeños, podrían desarrollar algo como la flexibilidad humana. Esta noción no es nueva,  una versión de ella data de las primeras etapas de la informática moderna, en la década de 1940, pero durante gran parte de su historia la mayoría de los científicos de la computación la consideraron vagamente deshonrosa, incluso mística. Sin embargo, desde 2011, Google Brain ha demostrado que este enfoque de la inteligencia artificial podría resolver muchos problemas que confundieron décadas de esfuerzos convencionales. El reconocimiento del habla no funcionó muy bien hasta que Brain emprendió un esfuerzo para renovarlo; La aplicación de la máquina de aprendizaje hizo su rendimiento en la plataforma móvil de Google, Android, casi tan bueno como la transcripción humana. Lo mismo ocurrió con el reconocimiento de imágenes. Menos de un año atrás, Brain por primera vez comenzó con la renovación intestinal de un producto de consumo completo.

“Translate” de google hizo su debut en 2006 y desde entonces se ha convertido en uno de los activos más confiables y populares de Google; Sirve a más de 500 millones de usuarios mensuales que necesitan 140 mil millones de palabras por día en un idioma diferente. Existe no sólo como su propia aplicación independiente, sino también como una característica integrada dentro de Gmail, Chrome y muchas otras ofertas de Google, donde lo tomamos como un pulsador dado, una parte sin fricción y natural de nuestro comercio digital. Fue sólo con la crisis de los refugiados, explicó Pichai desde el atril, que la compañía llegó a tener en cuenta la importancia geopolítica de Translate: En la pantalla detrás de él apareció un gráfico cuya curva pronunciada indicaba un incremento reciente de cinco traducciones entre árabe y alemán. (También estaba cerca del corazón de Pichai, creció en la India, una tierra dividida por decenas de lenguas). El equipo había ido agregando nuevos idiomas y características, pero las ganancias en calidad en los últimos cuatro años se habían desacelerado considerablemente.

Hasta hoy. A partir del fin de semana anterior, Translate había sido convertido a un sistema basado en inteligencia artificial para gran parte de su tráfico, no sólo en los Estados Unidos, sino también en Europa y Asia: El despliegue incluía traducciones entre inglés y español, francés, portugués, alemán , Chino, japonés, coreano y turco. El resto de los cientos de idiomas de Translate iban a venir, con el objetivo de ocho por mes, para finales del próximo año. La nueva encarnación, para la agradable sorpresa de los propios ingenieros de Google, se había completado en sólo nueve meses. El sistema de inteligencia artificial había demostrado las mejoras de la noche a la mañana iguales a las ganancias totales que el viejo había acumulado durante su curso de la vida entero.

Pichai tiene un afecto por la oscura referencia literaria; dijo un mes antes, en su oficina en Mountain View, California, que en parte existe porque no todo el mundo puede ser como el físico Robert Oppenheimer, que aprendió sánscrito para leer el Bhagavad Gita en el idioma original. En Londres, la diapositiva de los monitores detrás de él se dirigió a una cita de Borges: “Uno no es lo que está por lo que escribe, sino por lo que ha leído.”

Sonriendo, Pichai leyó en voz alta una incómoda versión en inglés de la frase que había sido traducida por el antiguo sistema de Translate: “Uno no es lo que es para lo que escribe, sino para lo que ha leído“.

A la derecha de aquélla se encontraba una nueva versión con formato de A.I.: “No eres lo que escribes, sino lo que has leído“.

La frase “inteligencia artificial” es invocada como si su significado fuera evidente, pero siempre ha sido una fuente de confusión y controversia. Imagínese si volvió a los años 70, paró a alguien en la calle, sacó un smartphone y le muestra su Google Maps. Una vez que lograste convencerla de que no eras un mago extrañamente vestido, y que lo que te sacaste de tu bolsillo no era un amuleto de artes negras, sino simplemente una computadora diminuta más poderosa que la que guió misiones Apolo, Google Maps casi Ciertamente le parecen un ejemplo persuasivo de “inteligencia artificial“. En un sentido muy real, lo es. Puede hacer las cosas que cualquier humano alfabetizado en el mapa puede manejar, como llegar desde su hotel al aeropuerto, aunque puede hacerlo mucho más rápido y confiablemente. También puede hacer cosas que los humanos sencillamente y obviamente no pueden: pueden evaluar

En el minuto en que podemos automatizar una tarea, degradamos la habilidad relevante involucrada a una de mero mecanismo. Hoy en día, Google Maps parece, en el sentido peyorativo del término, robótico: simplemente acepta una demanda explícita (la necesidad de ir de un lugar a otro) y trata de satisfacer esa demanda lo más eficientemente posible. Por lo tanto, los puestos de meta de “inteligencia artificial” retroceden constantemente.

Cuando tiene la oportunidad de hacer distinciones cuidadosas, Pichai diferencia entre las aplicaciones actuales de inteligencia artificial  y el objetivo final de la “inteligencia general artificial“. La inteligencia general artificial no implicará una adhesión obediente a instrucciones explícitas, sino que demostrará una facilidad con lo implícito, lo interpretativo. Será una herramienta general, diseñada para propósitos generales en un contexto general. Pichai cree que el futuro de su compañía depende de algo como esto. Imagínese si pudiera decirle a Google Maps: “Me gustaría ir al aeropuerto, pero necesito parar en el camino para comprar un regalo para mi sobrino”. Una versión más inteligente de ese servicio,  un asistente ubicuo, del tipo que Scarlett Johansson memorablemente desencarnó hace tres años en la película de Spike Jonze “Ella”, sabría todo tipo de cosas que, digamos, un amigo íntimo o un interno sincero podría saber: la edad de tu sobrino, y cuanto ordinariamente te gusta para gastar en regalos para los niños, y donde encontrar una tienda abierta. Pero un Maps verdaderamente inteligente también podría concebir todo tipo de cosas que un amigo cercano no haría, como lo que hace poco ha entrado en moda entre los preescolares de la escuela de su sobrino, o lo que es más importante, lo que sus usuarios realmente quieren. Si una máquina inteligente fuera capaz de discernir alguna intrincada u oscura regularidad en los datos sobre lo que hemos hecho en el pasado, podría extrapolar sobre nuestros deseos posteriores, aunque no los conozcamos por completo.

La nueva ola de asistentes mejorados de inteligencia artificial,  Siri de Apple, M de Facebook, Echo de Amazon, son todas criaturas de aprendizaje automático, construidas con intenciones similares. Los sueños corporativos para el aprendizaje automático, sin embargo, no se agotan con el objetivo de la clarividencia del consumidor. Una filial de imágenes médicas de Samsung anunció este año que sus nuevos dispositivos de ultrasonido podrían detectar el cáncer de mama. Consultores de gestión están cayendo por todas partes a los ejecutivos de preparación para la ampliación de las aplicaciones industriales de las computadoras que se programan. DeepMind, una adquisición de Google de 2014, derrotó al gran maestro humano reinante del antiguo juego de mesa Go, a pesar de las predicciones de que tal logro llevaría otros 10 años.

En un famoso ensayo de 1950, Alan Turing propuso una prueba para una inteligencia general artificial: una computadora que podría, en el transcurso de cinco minutos de intercambio de texto, engañar con éxito a un verdadero interlocutor humano. Una vez que una máquina puede traducir fluidamente entre dos lenguajes naturales, la fundación se ha puesto para una máquina que un día podría “entender” el lenguaje humano lo suficientemente bien como para entablar una conversación plausible. Los miembros de Google Brain, que empujaron y ayudaron a supervisar el proyecto Translate, creen que una máquina de este tipo estaría en camino de servir como un asistente personal inteligente que abarca todo.

Lo que sigue aquí es la historia de cómo un equipo de investigadores e ingenieros de Google, primero uno o dos, luego tres o cuatro, y finalmente más de cien, avanzaron considerablemente en esa dirección. Es una historia poco común de muchas maneras, no menos importante porque desafía muchos de los estereotipos de Silicon Valley a los que nos hemos acostumbrado. No cuenta con personas que piensan que todo será irreconociblemente diferente mañana o al día siguiente debido a algún inquieto tocador en su garaje. No es tampoco una historia sobre personas que piensan que la tecnología resolverá todos nuestros problemas, ni tampoco una sobre personas que piensan que la tecnología está inevitablemente obligada a crear nuevas eras apocalípticas. No se trata de la interrupción, al menos no en la forma en que la palabra tiende a ser utilizada.

Es, de hecho, tres historias superpuestas que convergen en la metamorfosis exitosa de Google Translate a inteligencia artificial. Una historia técnica, una historia institucional y una historia sobre la evolución de las ideas. La historia técnica es sobre un equipo en un producto en una empresa y el proceso por el cual refinaron, probaron e introdujeron una versión completamente nueva de un producto viejo en sólo una cuarta parte del tiempo que cualquiera de ellos mismos podría razonablemente tener esperado. La historia institucional se refiere a los empleados de un pequeño pero influyente grupo de inteligencia artificial dentro de esa compañía y al proceso por el cual su fe intuitiva en algunas viejas no probadas y ampliamente desagradables nociones sobre la informática, alteró a todas las demás compañías dentro de un gran radio. La historia de las ideas es sobre los científicos cognitivos, los psicólogos y los ingenieros rebeldes que trabajaron mucho en la oscuridad, y el proceso por el cual sus convicciones ostensiblemente irracionales finalmente inspiraron un cambio de paradigma en nuestro entendimiento no sólo de la tecnología sino también la consciencia misma.

La primera historia, la historia de Google Translate, tiene lugar en Mountain View durante nueve meses, y explica la transformación de la traducción automática. La segunda historia, la historia de Google Brain y sus muchos competidores, tiene lugar en Silicon Valley durante cinco años, y explica la transformación de toda esa comunidad. La tercera historia, la historia del aprendizaje profundo, tiene lugar en una variedad de laboratorios lejanos:  en Escocia, Suiza, Japón y sobre todo Canadá, durante siete décadas, y podría muy bien contribuir a la revisión de nuestra Auto-Imagen como seres que piensan.