Blogia
Vanity Fea

John Battelle, The Search

 

A photo on Flickr

(Reseña del libro de John Battelle The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture. Nueva York: Portfolio, 2005). 

 

Los dos primeros capítulos de este libro, y el último, que son los que más me interesan, son una reflexión sobre el concepto de búsqueda en Internet, sus bases y posibilidades. Los ocho capítulos de enmedio hacen una historia de la búsqueda antes de Google, de la compañía protagonista en sí, del surgimiento de un nuevo modelo de negocio en Internet tras el hundimiento de las puntocom, y analizan algunas implicaciones y límites de la política empresarial y la filosofía de Google.  

 

1. The Database of Intentions. Google se compara en el primer epígrafe a nuestro equivalente de la Biblioteca de Alejandría; y en el capítulo final al Poema de Gilgamesh, porque esta vez nos inscribirá a cada uno en la eternidad. Google ha descubierto una clave para hallar lo que nuestra cultura quiere (aunque no, matizaría yo, lo que debería querer). Tras el crecimiento exponencial de la información en Internet, las herramientas de búsqueda, mucho más que los directorios, han hecho posible el manejo e interpretación de esa información. Battelle llama la atención sobre la consitución de un capital informativo de segundo nivel a partir de la información derivada de las búsquedas acumuladas: "the aggregate of all those searches, it turns out, is knowable: it constitutes the database of our intentions" (4). La "base de datos de las intenciones" es "a massive clickstream database of desires, needs, wants, and preferences that can be discovered, subpoenaed, archived, tracked, and exploited for all sorts of ends" (6). En 1984, la interfaz de Macintosh, para Battelle, representaba "humankind's most sophisticated and important artifact ever: a rpresentation of the plastic mind made visible" (4). Google le produjo la impresión de una transformación equiparable del concepto de búsqueda. La búsqueda produce una nueva gramática propia: la combinación de los términos que vayan a producir el resultado deseado. Y se desarrollará a niveles mayores cuando converjan la televisión y la red. También mediante el desarrollo de la búsqueda se producirán herramientas de inteligencia artificial avanzadas -- los siniestros sistemas de control Skynet (de Terminator) o de la Matrix, tienen posibilidades de comenzar su desarrollo a través de sistemas de búsqueda en red. Y el dominio de la búsqueda también tendrá consecuencias políticas, llevando a la reestructuración de las relaciones entre los ciudadanos y los gobiernos. (Vamos, que el escenario de The Net lo ve Battelle como potencialmente extendible a todo el orden económico, social y político). Suponíamos que teclear en un ordenador era un acto efímero, como llamar por teléfono, pero... Ojo con el e-mail en las empresas, y en general. Nuestras redes profesionales (en el trabajo), sociales (con familia y amigos) y económicas (en las compras) son archivables, observables, utilizables. Hay compañías punteras que han aprendido a ofrecer servicios de red de alta calidad (y que dan dinero) interpretando los dibujos que hacen en la red las series de clics. (Como el protagonista de Idoru, de William Gibson, diría yo, aún más que la de Pattern Recognition). Se usa en esto parte de nuestra privacidad... pero la cambiamos gustosamente por comodidad, servicios y poder (12). El uso de las "clickstreams" o series de clics las hace útiles, por tanto información preciosa, que hay que guardar, las convierte así en eternas, y cada una de nuestras más nimias elecciones ante un ordenador queda registrada. El trato implícito esperado por el cliente es: "confío en que no empleéis esta información para el mal: que la mantengáis segura, libre de injerencias gubernamentales o apropiaciones privadas, y que siga bajo nuestro control" --todo lo cual es mucho pedir y mucho suponer.  

2. Who, What, Where, Why, When, and How (Much). Preguntas que debe responder el reportero. La última hay que especificarla: "quién gana dinero con esto, y cuánto". Explica el funcionamiento de una herramienta informática de búsqueda, y cómo Google y otras compañías innovaron en los últimos diez años desarrollando algoritmos y métodos estadísticos para estudiar el índice almacenado, y orientar así la búsqueda hacia mejores resultados. "Search is shaping our cultural grammar in ways we have yet to understand" (25). La búsqueda es, tras el correo electrónico, la herramienta más usada en la red. Y según Pew Internet, buscan más las personas más jóvenes y con mayor nivel educativo. ¿Y qué buscamos? Muchas veces más de lo mismo, cosas predecibles y muy solicitadas, pero el poder de la búsqueda está en posibilitar el número mucho mayor de búsquedas únicas: la "cola larga" del gráfico estadístico es lo que promete viabilidad y beneficios. Apareció el deporte de GoogleWhacking, es decir, dar con una búsqueda que tuviese un único resultado. (Recuerdo que una de mis primeras entradas en mi blog de 2004 (ver 23 de octubre) me comunicaba "you're a Googlewhack!"). Muchas búsquedas, según Andrei Broder (A Taxonomy of Web Search) no son "informacionales" sino "transaccionales" o "navegacionales" - se buscan colecciones de enlaces, o una página que ya se ha visto antes, o información que nos devuelve a la red para hacer algo a través de ella. Hay búsquedas para descubrir algo que debería haber en la red, y búsquedas para recuperar algo que sabemos existe en la red. La escritura nació ligada al almacenamiento y organización de información; la búsqueda de la organización de información pasa por los sistemas de catalogación para llegar a la primera herramienta de búsqueda: SMART, de Gerard Salton, a finales de los 60, que ya introduce criterios estadísticos, y algoritmos de relevancia basados en el feedback recibido. Buscar en la Web, claro, es muy distinto de buscar en un sistema cerrado y controlado. Pero hoy la búsqueda se ha convertido en el negocio de más rápido índice de crecimiento en la historia de los medios de comunicación.  

3. La búsqueda antes de Google. Un buscador consta de una araña que recoge páginas de la red, un índice o base de datos creado a resultas de ese peinado, una interfaz de usuario y un sofware de búsqueda, que busca maneras de presentar el índice de manera inteligente y utilizable. Historia de Archie, WebCrawler, AltaVista (rey de la búsqueda hace ocho años...). Louis Monier, artífice de su éxito por entonces, hoy está rediseñando eBay, donde se aprecia mucho dar exactamente con lo que se busca... Pero fue Lycos, y no AltaVista ni Google, el primer motor que usó los enlaces recibidos por un sitio web como la base de evaluar su relevancia (base del éxito posterior de Google) (53). Y Excite introdujo el concepto de personalización que tanto ha prosperado, con "My Excite", páginas generadas a medida automáticamente (luego en Amazon, Yahoo.. etc.). Mediados los 90, los portales se compraban por cantidades astronómicas (por ejemplo el caso de Terra Lycos...jeje...) pero estaban descuidando, unánimente, el concepto crucial de búsqueda, que había de ser la única manera de hacerlos viables a largo plazo. Google llegó al poder ayudado por Yahoo, quién lo diría hoy. Y ambos por Sequoia Capital. Yahoo, que no es tan viejo, pues data su directorio primitivo, la Guía a la Web de Jerry y David, de 1994. Por cierto, se supone que el significado no era "patán, bruto" (ni "pitecántropo peludo") sino "Yet Another Hierarchical Officious Oracle". Yahoo nació del directorio; inicialmente ignoró la búsqueda, y todavía presenta un modelo de negocio diferenciado del de Google.  

4. Google Is Born. Larry Page observó que el saber enlaces figuraban en una página era trivial, pero que no era cuestión trivial el descubrir qué enlaces había a una página. (69). Viniendo de un ambiente académico, sabía que los conceptos de "peer review" y número de citas recibidas son cruciales para determinar el valor de un documento. "El proceso de citar a otros te confiere el prestigio y autoridad de ellos: un concepto clave en el que se basa la manera en que funciona Google" (71). Se presta a posibles tergiversaciones: intercambio de citas, inflación de citas... pero en conjunto proporciona una metodología para priorizar los artículos publicados. Tim Berners-Lee creo la Web como manera de mejorar algunos aspectos de este sistema. Y Larry Page y Sergei Brin crearon Google para poner remedio a algunos defectos de la Web. Todo basado en el concepto de cita. (Por cierto, que el Xanadu de Ted Nelson también quería hacer del enlace reversible un elemento crucial. Aunque el enlace de doble sentido no podría utilizarse con el sentido informativo que tienen estos "enlaces a" de la Web, invisibles e independientes del documento enlazado. Ahí una de las claves del éxito de la Web, creo). "Page teorizó que una simple contabilizacion de los enlaces que recibe una página sería una guía útil para determinar el ranking de esa página. Y también teorizó que cada enlace necesitaba su propio ranking, basado en el recuento de enlaces de su página de origen" (74). Es la base recursiva del buscador de Google. (Observemos que PageRank se refiere no sólo a "página" sino a "Larry Page"). Nos recuerda Battelle que hace diez años la gente no tenía interés por estar visible para los buscadores, sino más bien suspicacia ante la idea de que indexasen todo el contenido de un sitio. Y los portales pretendían mantener al navegante atrapado, no que se fuese buscando otra cosa. Otras ideas convergieron. Junto con el PageRank, la teoría de Jon Kleinberg sobre la estructura de redes, con nodos y autoridades, es crucial como revolución en la búsqueda. El artículo fundador de Google fue este: "The Anatomy of a Large-Scale Hypertextual Web Search Engine" . Y la base de la viabilidad económica de negocios basados en la búsqueda la puso el fundador de GoTo.com, Bill Gross. Es el siguiente capítulo de Battelle.  

5. A Billion Dollars, One Nickel at a Time: The Internet Gets a New Business Model. El modelo de negocio de Google lo creó Bill Gross, el creador de Gross National Products, de IdeaLab y de GoTo.com, utilizando la famosa "cola larga", que necesita sin embargo para su explotación de resultados de búsqueda muy afinados. Los grandes números de visitas valen muy poco en sí: lo que tiene valor es el tráfico específico, tráfico movido por la intención de comprar bienes o servicios. Y ese tráfico utiliza motores de búsqueda. Gross creía que toda búsqueda guiada por algoritmos sería en última instancia derrotada por los spammers (es la batalla que hoy lleva Google). Y opinaba que "para matar el spam, hay que añadire la fricción del dinero a la ecuación" -- cobrando al anunciante. Así, se puede poner precio a la búsqueda y al clic. Con el modelo de GoTo.com (luego rebautizado Overture), los anunciantes sólo pagan cuando se pincha en su anuncio: así todos contentos. Google tuvo que pagar derechos a Overture al copiarles el modelo de negocio, para evitar cuestiones legales pendientes en el momento molesto de salir a bolsa. Microsoft y Yahoo se encontraron a fines de 2002 con que el nuevo modelo económico los dejaba atrás de Google en cuestiones básicas: la búsqueda (MSN y Yahoo habían delegado en Inktomi y Google) - la red de búsquedas pagadas (donde utilizaban los servicios de Overture) y su propio registro de tráfico (que sí tenían tanto Google como MSN y Yahoo). De ahí la ventaja cogida por Google. Gross vendió Overture, y sigue trabajando en afinar los perfiles de búsqueda y en derrotar al spam y los cliqueadores parásitos, pesadilla de Google...  

6. Google 2000-2004: Zero to $3 Billion in Five Years. Pues eso. Algunas claves del éxito de Google: Su sistema descentralizado en muchos muchos ordenadores. Google se posiciona inteligentemente, por ejemplo compranod Usenet, lo que supone pasar activamente a buscar información nueva, en lugar de sólo pasar la araña por la Web. El cambio al modelo de Overture: ranking de anuncios por popularidad. Cuestiones de management y personalidad de la empresa. La trinidad Page, Brin y Eric Schmidt, sobre todo Page y Brin, y su liderazgo muy directo, un tanto maniático-genial e intervencionista en cada cuestión de la empresa. El lema: "Don't Be Evil" -- problemático a medida que Google adquiere cada vez mayor poder económico e intelectual. Muy bueno el comentario de Jeff Bezos, de Amazon, al respecto. "Bueno, uno no debería ser malvado, claro, pero vamos, tampoco debería haber por qué presumir de eso" (139). La misión autoproclamada de Google: "Organizar la información del mundo y hacerla universalmente accesible y útil" (140). Lanzamiento de Google News por los días del 11-S (que los americanos llaman 9/11): "Los sucesos del 11-S le mostraron a Google y al mundo que Google tenía en la mano algo más que un servicio de búsqueda: tenía una ventaja extraordinaria: la capacidad de almacenar cualquier información, en cualquier momento, y mostrarla a cualquiera que la solicitase" (144). Ambivalencias ante Google: simpatías y desconfianzas que van surgiendo. Froogle... Adquisición de Blogger... Adsense... siguen las decisiones inteligentes y adecuadas a su modelo de negocio (cruciales los blogs para la "cola larga"). La caricatura del "Googlebot" que controla la Tierra.  

7. The Search Economy. Google da, Google quita; puedes pasar de la cabeza de sus resultados "objetivos" a la "larga cola"-- tras uno de los retoques y actualizaciones que dan periódicamente a sus algoritmos, lo que se llama el "baile de Google". Todo intentando luchar contra los que pretenden manipular el sistema y "optimizarse" con estrategias que Google considere inaceptables. De hecho, dada la batalla librada en torno a la obtención de un buen ranking en Google, no se puede decir que los resultados de Google sean automáticos o neutrales: se ven afectado por cuestiones de política editorial, y estrategias de lucha contra el spam. Muchos sitios comerciales desaparecieron de los primeros puestos... y puede que por motivos interesados aparte de la genérica lucha contra el spam: "Después de todo, por qué comprar AdWords si tu sitio ya tiene todo el tráfico que necesita con los resultados orgánicos de la búsqueda?" (165). Google cambió las ideas sobre anuncios en la red, al cambiar de un modelo basado en el contenido de los anuncios (modelo Web 1.0) y derivado de los medios impresos o TV, a un modelo basado en la intención del comprador (modelo que se desarrolla en la Web 2.0 y que según Battelle va a refinarse más con la inclusión de anuncios interactivos en la televisión/video digital, con anuncios ligados a las preferencias de visionado y de consumo de los televidentes. Es un modelo que se va a desarrollar "inevitablemente", "convierte al medio en un nuevo canal de venta" (170), uniendo al anuncio la posibilidad de consumo inmediato a través del propio medio, y efectuando una transformación crucial en los gastos de marketing y publicidad: los hace pasar de una dimensión especulativa e hipotética a una realidad basada en datos medibles, y uniendo más sólidamente la búsqueda, los trazos de movimiento en red dejados por el consumidor, y el consumo en sí. ¿Qué resultados tiene esta personalización? ¿Fragmentación? Por ejemplo, las noticias "a la carta" se convierten en un bien de consumo. Y sin embargo los grandes medios deben entrar al trapo, no pueden ignorar la competencia de la red, no pueden "aislarse de la conversación". Ni los negocios... las páginas amarillas van a estar en Internet de un modo mucho más directo, detallado e interactivo, afinando la competencia entre negocios locales. El nuevo modelo se basará en información públicamente disponible para todos en la red, y la capacidad creciente de usuarios y empresas de utilizarla en beneficio propio. Mientras surgen problemas inesperados, de copyright de marcas, de palabras que usadas de una manera u otra en la búsqueda dan unos resultados apetecidos o no... Y aquí Google tiene mucho que decir, porque "Google es más que otra compañía cualquiera. En lo tocante al ecosistema Internet, Google es el ambiente, el tiempo que hace" (183). El asunto de American Blinds, una marca de persianas que ha llevado a Google a juicio, es crucial. Puede que Google tenga que cambiar su política con respecto a los términos de búsqueda que sean marcas registradas. Otros problemas: los negocios basados en clics masivos y fraudulentos... Google vive en una batalla perpetua con estos fenómenos, por ser quien es.  

8. Search, Privacy, Government, and Evil. Epígrafe: "Esto pasa a tu expediente de modo permanente" -- El director de la escuela. Google hace replantear qué es información privada. Se venía dando por hecho que la información públicamente disponible era, sin embargo, difícil de conseguir. Con Google es fácil, y vemos nuestros datos retratados en la red de maneras molestas o alarmantes. Todos nos gugleamos a nosotros y a otros. ¿Qué significará pronto que alguien no figure? Es aconsejable autoguglearse, a ver qué dicen de uno. "En la era Google, toda nueva relación empieza con una búsqueda en Google" (193). "Debería nuestra sociedad prohibir lo digital por ley, y trazar la línea de lo que es público en la información que figure en papel, almacenada en la oficina de algún escribiente mohoso?" El Tribunal Supremo de Florida se planteó esta cuestión del acceso en red a los datos públicos, y la dejó pendiente para su resolución en 2005. (No sé si será el resultado de esta revisión, pero un servidor legal de Florida especifica que "Florida's public records law requires that information received in connection with court business must be made available to anyone upon request, unless the information is subject to a specific exemption" -- no especifica cómo). "Gracias a la búsqueda, debemos enfrentarnos a una de las cuestiones más significativas y difíciles a que se pueda enfrentar una democracia: el equilibrio entre el derecho de un ciudadano a la privacidad y el derecho de alguien (sea una empresa, un gobierno, u otro ciudadano) a saber" (193). O quizá, prosigue Battelle, no se trate tanto del derecho a saber como de un control de la capacidad de saber. Hay cantidades masivas de información personal identificable almacenadas. "Pero nuestra cultura todavía aún está por captar las implicaciones de toda esa información, cuánto más la necesidad de protegerse de su posible mala utilización" (194). "Search me" - "A mí que me registren": Anuncios intrusivos en G-Mail. Pero Google puede seguir todo tu uso de la red, no sólo tu e-mail. Todo ha dejado de ser efímero, se ha vuelto eterno, parte de la "Base de Datos de las Intenciones". Quizá toda esa información jamás se haga públicamente disponible. Pero podría ser mal utilizada por quienes tienen acceso a ella. Nuestra relación con Google se basa en la confianza. Pero leyes como el PATRIOT Act buscan controlar todo tipo de comunicaciones electrónicas, que supone una reinterpretación de la Cuarta Enmienda de la Constitución USA, la que protege contra "unreasonable searches" (199). Por cierto, el PATRIOT Act "prohibe a las compañías que comuniquen a nadie que el gobierno ha solicitado información de esa compañía" (200). La Ciudad de Nueva York (irónicamente) emitió, como algunas otras, una declaración repudiando esta ley. De todas maneras, el Gran Hemano podría no estar en el Gobierno sino en la empresa privada. Google, con su poder, y su voluntad de "no ser malos", han colaborado sin embargo con el gobierno chino para poder entrar en China aun a costa de ofrecer una versión censurada de la red.


9. Google Goes Public.
Pues eso, la salida a bolsa, los resultados espectaculares... y todo, todavía, sin un plan claro de a dónde quiere llegar la compañía (Supongo que lo que ha citado antes de "organizar la información del mundo" no lo considera Battelle un plan claro -- al menos en términos empresariales).  

10. Google Today, Google Tomorrow. "Quien tiene gran poder debería usarlo con suavidad" (Séneca). La fase introspectiva de Google, desde la segunda mitad de 2004. Page y Brin redactaron "las Tablillas"-- "una declaración definitiva de qué es lo que hace que Google sea Google" (231). El contenido no se ha hecho público. Google ha sido la compañía de crecimiento más rápido de la historia: un 400.000 por ciento en cinco años. Análisis de la competencia: Yahoo. Esta no está guiada directamente por los creadores de la misma, como lo está Google. Yahoo intenta un enfoque más personalizado en los posibles intereses diversos de los usuarios, aunque Google tampoco ofrece resultados de búsqueda puramente cuantitativos, sino diversificados por áreas de interés. Yahoo está más explícitamente abierto a especificar sus planes editoriales y comericales, y a la intervención humana en orientar esos planes. "A Google, al contrario, le repele la idea de volverse una empresa guidada por su contenido o por políticas editoriales" (240)-- Para Yahoo, humanos primero, tecnología después: Yahoo surgió de un directorio hecho por humanos, Google de un algoritmo de búsqueda. Pero compiten en el mismo terreno, y sus estrategias, aunque diferentes, los han hecho moverse hacia el terreno del otro. Google no se conforma con la búsqueda: Fusion, por ejemplo, proporcionará a los usuarios más margen de integración de los distintos servicios a su gusto (moviéndose hacia el terreno que han andado Yahoo, AOL, MSN y otros..). ¿El futuro? Bien, organizar la informacion personal, OK. Pero también transformarse en el mercado global, desplazando a eBay. Y eso hacerlo organizando la información global: sacando partido de la computerización del mundo que se va a producir a todos los niveles, a medida que el mundo físico y la Web converjan, y todo objeto esté informatizado y la información esté en red y accesible y controlable a través de Google. Google como universidad, como compañía telefónica, como Amazon más eBay ... los límites no están claros.  

11. Perfect Search. Epígrafes de Vannevar Bush ("As We May Think"), sobre la infinita tarea de computar las actividades de millones de personas, y de Isaac Asimov ("The Last Question") sobre lo que yo suelo llamar "el apocalipsis de la comunicación total" -- "All collected data had come to a final end. Nothing was left to be collected. // But all collected data had yet to be completely correlated and put together in all possible relationships..." (El límite en Asimov es la reversión de la entropía. En visiones menos místicas puede ser una especie de Matrix. Por cierto, esta idea de "el apocalipsis de la comunicación total" se parece mucho al plan de John Poindexter presentado al Pentágono en 2002, "Total Information Awareness", que pretendía hacer un seguimiento de todas las fuentes de información, y que seguramente pervive, corregido y mejorado, a la sombra del Patriot Act... Battelle lo menciona en la p. 289). "El buscador del futuro no es un buscador como los que conocemos, es más bien como un agente inteligente" (252). La búsqueda se extenderá fuera de los ordenadores, a los teléfonos, aparatos de todo tipo... todos tendrán capacidad de conexión y de ser buscados. Es la condición para la búsqueda perfecta, la acumulación masiva de miles de patrones de búsqueda, lo que Battelle llama la "Fuerza de los Muchos". (Puede verse al respecto también este artículo de Tim O'Reilly, "¿Qué es la Web 2?"). Se requiere mayor usabilidad del rastro de clics que dejamos, narrativizarlo en cierto modo, hacerlo comprensible, retomable, una referencia. Están saliendo muchas herramientas que permiten hacer eso precisamente, sacar sentido a los dibujos de huellas que dejamos en Internet. (Los "atajos" de Yahoo, o su búsqueda contextual Y!Q; la "búsqueda programática" de AOL; Amazon, con su buscador A9, fue el primero en introducir el concepto de "historial de búsqueda" en sus resultados (Google lo hizo a continuación). Buscaremos, o tendremos opción de buscar, nuestra Web personal, la que ya hemos visitado, o la que otros con intereses similares han visitado (Amazon y su sistema de recomendaciones tienen un gran potencial de desarrollo futuro). La Web semántica, propuesta (¡también!) por Tim Berners-Lee, e implementada a través del etiquetado que posibilita el lenguaje RDF ("Resource Description Framework"). Los esquemas globales producidos por miles de etiquetados, las "folksonomías", crean un nuevo tipo de relevancia. La proliferación de los enlaces en los blogs utiliza la Fuerza de los Muchos para hacer emerger una taxonomía elaborada colectivamente. Otro tipo de aproximación a la búsqueda "perfecta": WebFountain. Intenta etiquetar los documentos de manera inteligente, no automática, y permitiendo la elaboración de búsquedas complejas con un gran número de variables: haciendo la red accesible a las demandas detalladas de un cliente (es un servicio caro de IBM). Quizá el futuro esté en su convergencia con la ubicuidad y "simplicidad" de Google. Otro factor a tener en cuenta: los buscadores específicos para un ámbito determinado: buscadores académicos, profesionales, de negocios... y la futura conexión entre ellos. Luego: hay que reintroducir la versión temporal en la Web: permitirnos acceder a la Web de 1998, no sólo a la actual, por ejemplo (la Waybackmachine es el primer paso sólo en esto...). La búsqueda personalizada, como en el Furl de LookSmart, que te archiva todos los sitios que visitas. La perfección saldrá de la convergencia de todas estas tendencias, y Google es el punto de convergencia más probable.  

Epílogo.   La búsqueda por excelencia, the search, es la búsqueda de la inmortalidad. Buscando "inmortalidad" en la Web, Battelle da con el Poema de Gilgamesh. Si el poema inscribió a su héroe para la eternidad, es posible que Google nos inscriba a todos, y a nuestra huella personal en la red, en un tipo de inmortalidad, la que nos den sus archivos, conservados preciosamente como información utilizable. Es el equivalente moderno de grabar nuestro nombre en piedra para el futuro...  

John Battelle lleva también un Searchblog, donde se puede leer por ejemplo este post relacionado con la conclusión del libro.

¿Debo aclarar que he encontrado el libro muy interesante y recomendable?

0 comentarios