Por estos días, Google da la impresión de estarlo haciendo todo, en todas partes: toma fotografías de su casa desde el espacio exterior, copia raros libros en sánscrito en la India, se abre paso en Madison, la avenida neoyorquina de la moda, entabla peleas con Hollywood y trata de socavar el dominio del software de Microsoft.
Pero, en el fondo, Google sigue siendo un motor de búsqueda. Y sus páginas, que con hiperenlaces azules resaltados sobre un suave fondo blanco son las más visitadas y las más rentables, la han convertido en la compañía más poderosa de internet. Google es ayudante de tareas, navegador y directorio de negocios para 500 millones de usuarios, capaz de encontrar el pedacito más refundido de información en un abrir y cerrar de ojos. Sin embargo, a pesar de lo fácil que resulta exaltar el milagro moderno que es Google, el sitio también es uno de los mayores fastidios del mundo. Millones de veces en el día, los usuarios desisten de buscar un hotel, una receta culinaria o alguna biografía. Aunque Google encuentra lo que los usuarios buscan, no siempre es así.
Por eso, Amit Singhal y cientos de ingenieros más en Google exploran constantemente el motor de búsqueda de la compañía, tratando de cerrar la brecha entre “frecuentemente y siempre”. Singhal es el maestro de lo que Google llama su “algoritmo de clasificación”; es decir, las fórmulas que deciden cuáles páginas Web responden mejor cada pregunta del usuario. Esta es una parte clave del corazón de Google, el departamento de “calidad de búsqueda”, que para la compañía es como un secreto de Estado. Google rara vez permite a un extraño poner un pie en esta unidad, y ha exigido cautela a Singhal cuando habla con los medios sobre el mágico caldo matemático que alimenta los millones de cajas negras que le dan su poder al motor de búsqueda.
Para Google, Singhal y su equipo son muy valiosos por las razones más fundamentales de la competencia, y cree que su capacidad de reducir el número de decepciones de los buscadores es crucial para defenderse de los ataques cada vez más feroces de rivales como Yahoo y Microsoft, y conservar la mina de oro publicitaria que las búsquedas representan.
“El principal valor creado por Google es el del ranking”, afirma John Battelle, director ejecutivo de la red de blogs publicitarios Federated Media, y autor de The Search (“La búsqueda”), un libro sobre Google.
Battelle señala que las tiendas en línea saben que de un cuarto a la mitad de sus visitantes, sobre todo los nuevos, llegan desde los motores de búsqueda, y los sitios de medios comienzan a descubrir que muchas personas están pasando por alto sus páginas de inicio (donde se encuentran las tasas más altas de avisos) y usando a Google para saltar directamente a las páginas que necesitan.
“Google se ha transformado en la sangre vital de internet; hay que estar ahí”, dice Battelle. Los usuarios, evidentemente, no ven la ciencia y el talento que ponen a funcionar las cajas negras y, sin embargo, el equipo de calidad de búsqueda hace alrededor de media docena de ajustes mayores y menores, por semana, a la gran cantidad de fórmulas matemáticas que impulsan el motor de búsqueda.
Estas fórmulas son cada vez mejores en leer la mente de los usuarios, y, por consiguiente, en la interpretación de una pregunta corta. ¿Qué están buscando? ¿Un trabajo, una compra, un dato? Las fórmulas permiten saber si quienes digitan la palabra “manzana” están pensando en la fruta, o si los que la teclean en inglés y con mayúscula (Apple) quieren comprar un computador o un iPod. Y hasta ofrecen opciones para preguntas vagas y corrigen errores evidentes de digitación.
“En los últimos años, la búsqueda ha pasado del ‘dame lo que escribí’ al ‘dame lo que quiero’”, sostiene Singhal, de ascendencia india y con 39 años de edad, que entró a Google en el año 2000 y hoy es un Google Fellow, título que la compañía reserva para sus ingenieros de elite.
Recientemente, Google permitió que un periodista acompañara a Singhal y su equipo durante todo un día, asistiendo a sus reuniones. Hubo numerosas preguntas que Google no pudo responder, pero el grupo contestó mucho más de lo que los medios hubiesen esperado, resolviendo dudas sobre el funcionamiento del sistema.
Puesto que Google constantemente afina su motor, uno de los retos a los que se enfrenta es la escala pura y neta, siendo hoy el sitio Web más popular del mundo, con servicios en 112 idiomas, decenas de millardos de páginas indexadas y el manejo de cientos de millones de búsquedas diarias.
Más intimidante aún es el hecho de que muchas de esas páginas sean trampas creadas por revendedores que pretenden atraer a los navegantes a sus sitios llenos de anuncios, pornografía y fraudes financieros. Al mismo tiempo, los usuarios han llegado al punto de esperar que Google adivine lo que están buscando, con apenas unas pocas palabras como clave.
“Actualmente, las expectativas son mayores”, dice Udi Manber, supervisor general del grupo de calidad de búsqueda de Google. “Al principio, si uno buscaba algo y lo encontraba, era un milagro. Ahora, si uno no encuentra de primerazo lo que desea, algo anda mal”.
El enfoque de Google respecto a la búsqueda es un reflejo de su poco convencional manejo de las prácticas. Cuenta con cientos de ingenieros, entre ellos, expertos en búsqueda sacados de la academia, que trabajan sin organización específica en los proyectos que les interesan a cada uno. Pero cuando se trata del motor de búsqueda (que posee muchos miles de ecuaciones interconectadas) debe volver a revisar el trabajo independiente de los especialistas con rigor objetivo y cuantitativo, para asegurarse de que las nuevas fórmulas no terminen haciendo más daño que bien.
Como siempre, la investigación y el control de calidad implican un acto de equilibrio. “Cuando se hace un cambio, algunas preguntas de los usuarios se afectan en forma positiva, y otras, en forma negativa”, comenta Manber. “Y sólo podemos lanzar cosas que sean 100% positivas”.
Cerca del escritorio de Singhal hay un gran pizarrón blanco lleno de garabatos, gráficas, preguntas y retazos multicolores de algoritmos matemáticos. Las quejas de los usuarios cansados también se apuntan en el pizarrón.
Cualquiera de los 10.000 empleados de Google puede usar su organizador de errores o buganizer, como lo llaman, para informar a Singhal los problemas de búsqueda, y así lo hacen un centenar de veces al día.
Algunas quejas se relacionan con fallas sencillas que deben resolverse de inmediato. Hace poco, una búsqueda de “Revolución francesa” dio como resultado demasiados sitios sobre la reciente campaña presidencial francesa (en las que los candidatos opinaban respecto a diversas revoluciones en política) y no de la caída de Luis XVI. Un pequeño giro en el motor de búsqueda le dio mayor peso a páginas con frases como “Revolución francesa” que a aquellas que simplemente incluían ambas palabras.
Igualmente, los ingenieros se encontraron con un problema mayor: para los usuarios, es importante encontrar empresas locales, pero Google, con frecuencia, depende de apenas un puñado de sitios para encontrar las claves de cuáles negocios son mejores. Dos meses después de que Brougher puso su queja, el grupo de Singhal ya había desarrollado una nueva fórmula matemática para responder las pesquisas de tiendas locales.
Sin embargo, no siempre se apresura a componerlo todo, pues cada cambio afecta las clasificaciones de muchos sitios. “No podemos reaccionar a la primera queja. Lo mejor es esperar que las cosas se asienten”.
El reticente Manber no discute abiertamente la forma de trabajar de su grupo de calidad de búsqueda, que opera repartido en pequeños equipos de ingenieros. Algunos, como los de Singhal, se enfocan en sistemas que procesan las búsquedas luego de que los usuarios las han digitado. Otros trabajan en características que mejoren el despliegue de resultados, como la extracción de snippets o recortes (cortos textos descriptivos que le dan al usuario una idea del contenido del sitio).
Otros miembros del grupo de Manber trabajan en lo zador de errores o buganizer, como lo llaman, para informar a Singhal los problemas de búsqueda, y así lo hacen un centenar de veces al día.
Algunas quejas se relacionan con fallas sencillas que deben resolverse de inmediato. Hace poco, una búsqueda de “Revolución francesa” dio como resultado demasiados sitios sobre la reciente campaña presidencial francesa (en las que los candidatos opinaban respecto a diversas revoluciones en política) y no de la caída de Luis XVI. Un pequeño giro en el motor de búsqueda le dio mayor peso a páginas con frases como “Revolución francesa” que a aquellas que simplemente incluían ambas palabras.
Igualmente, los ingenieros se encontraron con un problema mayor: para los usuarios, es importante encontrar empresas locales, pero Google, con frecuencia, depende de apenas un puñado de sitios para encontrar las claves de cuáles negocios son mejores. Dos meses después de que Brougher puso su queja, el grupo de Singhal ya había desarrollado una nueva fórmula matemática para responder las pesquisas de tiendas locales.
Sin embargo, no siempre se apresura a componerlo todo, pues cada cambio afecta las clasificaciones de muchos sitios. “No podemos reaccionar a la primera queja. Lo mejor es esperar que las cosas se asienten”.
El reticente Manber no discute abiertamente la forma de trabajar de su grupo de calidad de búsqueda, que opera repartido en pequeños equipos de ingenieros. Algunos, como los de Singhal, se enfocan en sistemas que procesan las búsquedas luego de que los usuarios las han digitado. Otros trabajan en características que mejoren el despliegue de resultados, como la extracción de snippets o recortes (cortos textos descriptivos que le dan al usuario una idea del contenido del sitio).
Otros miembros del grupo de Manber trabajan en lo que ocurre antes de que los usuarios puedan siquiera iniciar una búsqueda: llevar un índice gigantesco de todas las páginas Web del mundo. Google tiene cientos de miles de computadores individualizados para explorar constantemente la red con ese propósito.
A medida que Google compila su índice, calcula un número llamado PageRank para cada página encontrada. Esta fue la invención central de los fundadores de la compañía, Page y Sergey Brin. PageRank lleva la cuenta de cuántas veces otros sitios se enlazan con una página determinada. Los sitios más populares, principalmente los que tienen PageRanks altos, son los que tienen más probabilidad de ser de una calidad mejor.
Singhal ha desarrollado un sistema mucho más elaborado para clasificar páginas, que involucra más de 200 tipos de información o lo que Google denomina “señales”. PageRank no es más que una señal. Algunas señales se hallan en páginas Web (como palabras, enlaces, imágenes y otras cosas por el estilo). Otras se extraen de la historia de cómo van cambiando las páginas con el tiempo, y otras más son patrones de datos no descubiertos en los billones de búsquedas que Google ha manejado a través de los años.
Una vez que Google acorrala sus millares de señales, las incorpora en fórmulas que llama “clasificadores”, que tratan de inferir información útil sobre el tipo de búsqueda, a fin de enviar a ese usuario a las páginas de mayor utilidad para él. Los clasificadores pueden decir, por ejemplo, si alguien busca un producto para comprar o la información de una persona, lugar o compañía. Recientemente, Google desarrolló un nuevo clasificador para identificar nombres de personas no famosas. Otro sirve para identificar nombres de marcas.
Como si esto no fuera ya lo suficientemente complicado, los ingenieros de Google deben compensar a los usuarios que no sólo son caprichosos, sino vagos respecto a lo que desean; por lo general, son los que teclean frases ambiguas o palabras mal escritas.
Hace mucho tiempo, Google descifró que los usuarios que digitan “Brittany Speers” por ejemplo, en realidad están buscando a “Britney Spears”. Para abordar este problema, construyó un sistema que entiende las variaciones de las palabras. Tan poderoso es el modelo, que es capaz de buscar páginas con sólo una abreviatura o sinónimo digitado.
Al final, es difícil definir cuán avanzadas son las técnicas de Google, puesto que gran parte de lo que hace (y de lo que hacen sus rivales) se mantiene en secreto. Cuando se miran los resultados, las diferencias entre los motores de búsqueda más importantes son muy sutiles.
“La gente todavía cree que Google es el patrón de oro -explica Battelle-.Su receta secreta es la forma en que estos ingenieros armonizan entre sí mil afinaciones pequeñas”.