NEGOCIOS
Última Actualización: Abril 1st, 2008 - 15:07:33

Leyendo la mente de los buscadores
Octubre 5, 2007, 13:39


Enviar artículo por e-mail

Por estos días, Google da la impresión de  estarlo haciendo todo, en todas partes: toma fotografías de su casa desde el  espacio exterior, copia raros libros en sánscrito en la India, se abre paso en  Madison, la avenida neoyorquina de la moda, entabla peleas con Hollywood y  trata de socavar el dominio del software de Microsoft.
  Pero, en el fondo, Google sigue siendo un  motor de búsqueda. Y sus páginas, que con hiperenlaces azules resaltados sobre  un suave fondo blanco son las más visitadas y las más rentables, la han  convertido en la compañía más poderosa de internet. Google es ayudante de  tareas, navegador y directorio de negocios para 500 millones de usuarios, capaz  de encontrar el pedacito más refundido de información en un abrir y cerrar de  ojos. Sin embargo, a pesar de lo fácil que resulta exaltar el milagro moderno  que es Google, el sitio también es uno de los mayores fastidios del mundo.  Millones de veces en el día, los usuarios desisten de buscar un hotel, una  receta culinaria o alguna biografía. Aunque Google encuentra lo que los  usuarios buscan, no siempre es así.
Por eso, Amit Singhal y cientos de  ingenieros más en Google exploran constantemente el motor de búsqueda de la  compañía, tratando de cerrar la brecha entre “frecuentemente y siempre”.

Singhal es el maestro de lo que Google  llama su “algoritmo de clasificación”; es decir, las fórmulas que deciden  cuáles páginas Web responden mejor cada pregunta del usuario. Esta es una parte  clave del corazón de Google, el departamento de “calidad de búsqueda”, que para  la compañía es como un secreto de Estado. Google rara vez permite a un extraño  poner un pie en esta unidad, y ha exigido cautela a Singhal cuando habla con  los medios sobre el mágico caldo matemático que alimenta los millones de cajas  negras que le dan su poder al motor de búsqueda.
  Para Google, Singhal y su equipo son muy  valiosos por las razones más fundamentales de la competencia, y cree que su  capacidad de reducir el número de decepciones de los buscadores es crucial para  defenderse de los ataques cada vez más feroces de rivales como Yahoo y Microsoft,  y conservar la mina de oro publicitaria que las búsquedas representan.

“El principal valor creado por Google es  el del ranking”, afirma John Battelle, director ejecutivo de la red de blogs  publicitarios Federated Media, y autor de The Search (“La búsqueda”), un libro  sobre Google.
  Battelle señala que las tiendas en línea  saben que de un cuarto a la mitad de sus visitantes, sobre todo los nuevos,  llegan desde los motores de búsqueda, y los sitios de medios comienzan a  descubrir que muchas personas están pasando por alto sus páginas de inicio  (donde se encuentran las tasas más altas de avisos) y usando a Google para  saltar directamente a las páginas que necesitan.
  “Google se ha transformado en la sangre  vital de internet; hay que estar ahí”, dice Battelle. Los usuarios,  evidentemente, no ven la ciencia y el talento que ponen a funcionar las cajas  negras y, sin embargo, el equipo de calidad de búsqueda hace alrededor de media  docena de ajustes mayores y menores, por semana, a la gran cantidad de fórmulas  matemáticas que impulsan el motor de búsqueda.

Estas fórmulas son cada vez mejores en  leer la mente de los usuarios, y, por consiguiente, en la interpretación de una  pregunta corta. ¿Qué están buscando? ¿Un trabajo, una compra, un dato? Las  fórmulas permiten saber si quienes digitan la palabra “manzana” están pensando  en la fruta, o si los que la teclean en inglés y con mayúscula (Apple) quieren  comprar un computador o un iPod. Y hasta ofrecen opciones para preguntas vagas  y corrigen errores evidentes de digitación.
  “En los últimos años, la búsqueda ha  pasado del ‘dame lo que escribí’ al ‘dame lo que quiero’”, sostiene Singhal, de  ascendencia india y con 39 años de edad, que entró a Google en el año 2000 y  hoy es un Google Fellow, título que la compañía reserva para sus ingenieros de  elite.

Recientemente, Google permitió que un  periodista acompañara a Singhal y su equipo durante todo un día, asistiendo a  sus reuniones. Hubo numerosas preguntas que Google no pudo responder, pero el  grupo contestó mucho más de lo que los medios hubiesen esperado, resolviendo  dudas sobre el funcionamiento del sistema.
  Puesto que Google constantemente afina su  motor, uno de los retos a los que se enfrenta es la escala pura y neta, siendo  hoy el sitio Web más popular del mundo, con servicios en 112 idiomas, decenas  de millardos de páginas indexadas y el manejo de cientos de millones de  búsquedas diarias.
  Más intimidante aún es el hecho de que  muchas de esas páginas sean trampas creadas por revendedores que pretenden  atraer a los navegantes a sus sitios llenos de anuncios, pornografía y fraudes  financieros. Al mismo tiempo, los usuarios han llegado al punto de esperar que  Google adivine lo que están buscando, con apenas unas pocas palabras como  clave.

“Actualmente, las expectativas son mayores”,  dice Udi Manber, supervisor general del grupo de calidad de búsqueda de Google.  “Al principio, si uno buscaba algo y lo encontraba, era un milagro. Ahora, si  uno no encuentra de primerazo lo que desea, algo anda mal”.

El enfoque de Google respecto a la  búsqueda es un reflejo de su poco convencional manejo de las prácticas. Cuenta  con cientos de ingenieros, entre ellos, expertos en búsqueda sacados de la  academia, que trabajan sin organización específica en los proyectos que les  interesan a cada uno. Pero cuando se trata del motor de búsqueda (que posee  muchos miles de ecuaciones interconectadas) debe volver a revisar el trabajo  independiente de los especialistas con rigor objetivo y cuantitativo, para  asegurarse de que las nuevas fórmulas no terminen haciendo más daño que bien.

Como siempre, la investigación y el  control de calidad implican un acto de equilibrio. “Cuando se hace un cambio,  algunas preguntas de los usuarios se afectan en forma positiva, y otras, en  forma negativa”, comenta Manber. “Y sólo podemos lanzar cosas que sean 100%  positivas”.
  Cerca del escritorio de Singhal hay un  gran pizarrón blanco lleno de garabatos, gráficas, preguntas y retazos  multicolores de algoritmos matemáticos. Las quejas de los usuarios cansados  también se apuntan en el pizarrón.

Cualquiera de los 10.000 empleados de  Google puede usar su organizador de errores o buganizer, como lo llaman, para  informar a Singhal los problemas de búsqueda, y así lo hacen un centenar de  veces al día.

Algunas quejas se relacionan con fallas  sencillas que deben resolverse de inmediato. Hace poco, una búsqueda de  “Revolución francesa” dio como resultado demasiados sitios sobre la reciente  campaña presidencial francesa (en las que los candidatos opinaban respecto a  diversas revoluciones en política) y no de la caída de Luis XVI. Un pequeño  giro en el motor de búsqueda le dio mayor peso a páginas con frases como  “Revolución francesa” que a aquellas que simplemente incluían ambas palabras.

Igualmente, los ingenieros se encontraron  con un problema mayor: para los usuarios, es importante encontrar empresas  locales, pero Google, con frecuencia, depende de apenas un puñado de sitios  para encontrar las claves de cuáles negocios son mejores. Dos meses después de  que Brougher puso su queja, el grupo de Singhal ya había desarrollado una nueva  fórmula matemática para responder las pesquisas de tiendas locales.
  Sin embargo, no siempre se apresura a  componerlo todo, pues cada cambio afecta las clasificaciones de muchos sitios.  “No podemos reaccionar a la primera queja. Lo mejor es esperar que las cosas se  asienten”.

El reticente Manber no discute  abiertamente la forma de trabajar de su grupo de calidad de búsqueda, que opera  repartido en pequeños equipos de ingenieros. Algunos, como los de Singhal, se enfocan  en sistemas que procesan las búsquedas luego de que los usuarios las han  digitado. Otros trabajan en características que mejoren el despliegue de  resultados, como la extracción de snippets o recortes (cortos textos  descriptivos que le dan al usuario una idea del contenido del sitio).
  Otros miembros del grupo de Manber  trabajan en lo zador de errores o buganizer, como lo llaman, para informar a  Singhal los problemas de búsqueda, y así lo hacen un centenar de veces al día.

Algunas quejas se relacionan con fallas  sencillas que deben resolverse de inmediato. Hace poco, una búsqueda de  “Revolución francesa” dio como resultado demasiados sitios sobre la reciente  campaña presidencial francesa (en las que los candidatos opinaban respecto a  diversas revoluciones en política) y no de la caída de Luis XVI. Un pequeño  giro en el motor de búsqueda le dio mayor peso a páginas con frases como  “Revolución francesa” que a aquellas que simplemente incluían ambas palabras.

Igualmente, los ingenieros se encontraron  con un problema mayor: para los usuarios, es importante encontrar empresas  locales, pero Google, con frecuencia, depende de apenas un puñado de sitios  para encontrar las claves de cuáles negocios son mejores. Dos meses después de  que Brougher puso su queja, el grupo de Singhal ya había desarrollado una nueva  fórmula matemática para responder las pesquisas de tiendas locales.
  Sin embargo, no siempre se apresura a  componerlo todo, pues cada cambio afecta las clasificaciones de muchos sitios.  “No podemos reaccionar a la primera queja. Lo mejor es esperar que las cosas se  asienten”.

El reticente Manber no discute  abiertamente la forma de trabajar de su grupo de calidad de búsqueda, que opera  repartido en pequeños equipos de ingenieros. Algunos, como los de Singhal, se  enfocan en sistemas que procesan las búsquedas luego de que los usuarios las  han digitado. Otros trabajan en características que mejoren el despliegue de  resultados, como la extracción de snippets o recortes (cortos textos  descriptivos que le dan al usuario una idea del contenido del sitio).
  Otros miembros del grupo de Manber  trabajan en lo que ocurre antes de que los usuarios puedan siquiera iniciar una  búsqueda: llevar un índice gigantesco de todas las páginas Web del mundo.  Google tiene cientos de miles de computadores individualizados para explorar  constantemente la red con ese propósito.

A medida que Google compila su índice,  calcula un número llamado PageRank para cada página encontrada. Esta fue la  invención central de los fundadores de la compañía, Page y Sergey Brin.  PageRank lleva la cuenta de cuántas veces otros sitios se enlazan con una  página determinada. Los sitios más populares, principalmente los que tienen  PageRanks altos, son los que tienen más probabilidad de ser de una calidad  mejor.

Singhal ha desarrollado un sistema mucho  más elaborado para clasificar páginas, que involucra más de 200 tipos de  información o lo que Google denomina “señales”. PageRank no es más que una  señal. Algunas señales se hallan en páginas Web (como palabras, enlaces,  imágenes y otras cosas por el estilo). Otras se extraen de la historia de cómo  van cambiando las páginas con el tiempo, y otras más son patrones de datos no  descubiertos en los billones de búsquedas que Google ha manejado a través de  los años.

Una vez que Google acorrala sus millares  de señales, las incorpora en fórmulas que llama “clasificadores”, que tratan de  inferir información útil sobre el tipo de búsqueda, a fin de enviar a ese  usuario a las páginas de mayor utilidad para él. Los clasificadores pueden  decir, por ejemplo, si alguien busca un producto para comprar o la información  de una persona, lugar o compañía. Recientemente, Google desarrolló un nuevo  clasificador para identificar nombres de personas no famosas. Otro sirve para  identificar nombres de marcas.

Como si esto no fuera ya lo  suficientemente complicado, los ingenieros de Google deben compensar a los  usuarios que no sólo son caprichosos, sino vagos respecto a lo que desean; por  lo general, son los que teclean frases ambiguas o palabras mal escritas.
  Hace mucho tiempo, Google descifró que  los usuarios que digitan “Brittany Speers” por ejemplo, en realidad están  buscando a “Britney Spears”. Para abordar este problema, construyó un sistema  que entiende las variaciones de las palabras. Tan poderoso es el modelo, que es  capaz de buscar páginas con sólo una abreviatura o sinónimo digitado.

Al final, es difícil definir cuán  avanzadas son las técnicas de Google, puesto que gran parte de lo que hace (y  de lo que hacen sus rivales) se mantiene en secreto. Cuando se miran los  resultados, las diferencias entre los motores de búsqueda más importantes son  muy sutiles.
  “La gente todavía cree que Google es el  patrón de oro -explica Battelle-.Su receta secreta es la forma en que estos  ingenieros armonizan entre sí mil afinaciones pequeñas”.


Inicio del artículo
Tel: (506) 2204-7444 / 2204-7596 :: Fax: (506) 2204-7606 :: San José Costa Rica, Calle 11 Avenida central y Segunda. :: © 2004 Revista Summa Derechos Reservados.