Artículo publicado en The Conversation (08/09/2022)
Cuando inicié mis cursos del programa de doctorado, uno de nuestros profesores, de una universidad griega, habló sobre la interesante investigación que habían realizado dos estudiantes de la Universidad de Standford. Esos estudiantes, Larry Page y Sergei Brin, acababan de sentar las bases para fundar el motor de búsqueda que es hoy el emperador absoluto del reino de Internet.
En ese momento había desarrollos mucho mejores en la literatura científica para crear algoritmos de buscadores de contenido online, diversas propuestas para ordenar y poder encontrar la aguja en el pajar de la recién nacida World Wide Web, pero solo uno, Google, ha acabado dominando el mundo.
Poner orden a la Web
En 1999, Larry y Sergei, en colaboración con otros dos investigadores, publicaron un artículo que forma parte de la historia de la tecnología:The PageRank Citation Ranking: Bringing Order to the Web. En ese artículo describían PageRank, un método para calificar páginas web de manera objetiva y mecánica, atendiendo con eficacia el interés humano y la atención que dedica.
Su propuesta era una forma novedosa de ordenar la información. Esencialmente, esa es la base del trabajo de un buscador: recorrer todas las páginas web para recopilar la información existente; modelarla y, finalmente, mostrarnos los enlaces a las páginas que más se acercan a nuestra consulta. Pero PageRank incluyó un elemento clave, diferente del resto de motores de búsqueda en desarrollo, y que le situó primero en la carrera.
La clave: las fuentes de enlace de las páginas
La novedad de PageRank es el modo en que ordena, cómo elige lo primero que ofrece. El algoritmo pondera en la puntuación la importancia de las fuentes que enlazan cada página. Esto fue entonces, en la primera década del siglo, un ¡Eureka!, una idea clave que prendió el motor de la máquina Google.
Por ejemplo, si la página contiene información sobre universidades, será más importante si otra universidad, como puede ser www.deusto.es, la enlaza desde su web que si la enlaza un taller de mecánica. Pero si la información es sobre mecánica, mejor si la enlazan los talleres (y cuantos más mejor).
Hasta entonces, la labor de ordenar y priorizar tanta información requería una gran cantidad de tiempo y recursos informáticos. Google abarató tanto estos costes y consiguió tanta eficacia en el proceso, que las empresas lo acogieron con alfombra roja.
El empuje de Google a las grandes empresas tecnológicas
En su libro Gracias por llegar tarde…, el periodista Thomas L. Friedman destaca dos artículos científicos que analizan cómo el desarrollo logrado por Google fue la base que permitió el despegue de varias de las empresas tecnológicas punteras que hoy dirigen los más ricos del mundo.
Los científicos destacaban que Google permitía procesar grandes cantidades de datos en varios ordenadores de forma simultánea(MapReduce: Simplified Data Processing on Large Clusters y que los ficheros, pese a estar dispersos en muchos servidores distintos, se podían ver como si estuvieran en un único ordenador. ¿Qué significa esto? Significa hipereficacia y ahorro, un cambio transformador en la forma de trabajar con grandes volúmenes de información.
La revolución que supuso Google: ordenar la información del mundo
En la era pre-Google, la tendencia era procesar la información en grandes servidores, que alcanzaban su límite rápidamente. Por muy grande que fuera un procesador, en un momento dado se colmaba. Google, en cambio, es virtualmente infinito. Permite ordenar y almacenar información en ordenadores corrientes conectados a la red, que funciona como un único ordenador. Este fue un ¡Eureka! más, el que conquistó a las empresas nativas de internet y las catapultó con un ambicioso objetivo: “organizar la información del mundo y hacerla accesible y útil para todos los usuarios”.
Paso a paso, empresa a empresa, usuario a usuario, todos fueron eligiendo Google.
Y llegó el dinero a raudales
El negocio despegó definitivamente cuando Google encontró una forma de monetizar toda la información almacenada a través de los anuncios. Pese a que no era su idea inicial, dado el crecimiento que estaban viviendo y la necesidad de financiación, en el año 2000 crearon Google Adwords, ahora Google Ads.
Esta plataforma permite, a través de un sistema de subastas en tiempo real, mostrar publicidad personalizada a cada usuario en función de la información que se tiene sobre él. El sistema, entre otras acciones, ha hecho que si Google fuera un estado tendría más dinero que cuarenta países africanos juntos.
La cara oscura de tanto poder
Pero la máquina presenta problemas. Para ser lo más efectiva posible, el seguimiento de las acciones que realiza el usuario tiene que ser muy alto, y esto mina un derecho fundamental, la privacidad (aunque Google argumenta que los datos no salen de la empresa).
Google, además, es juez y parte en toda la cadena. Tiene en sus manos el sistema operativo móvil más utilizado del mundo (Android), el navegador web más usado, una gran red de anunciantes y la llave de la puerta de entrada a internet: el buscador.
Hoy el debate no se centra solo en lo que Google supone como algoritmo, en cuanto a optimización del rendimiento y eficacia. También en la ética y los derechos fundamentales.
Si no está en Google, no existe
El buscador ofrece a priori los resultados que encajan mejor con las expectativas de los usuarios, pero no tienen que ser objetivamente mejores que las que no aparecen en Google. Así, la única información que cuenta es la que el buscador ha elegido. El resto, no existe.
Google está en el centro de la explosión del proceso de captura de información, atrae a los mejores profesionales de distintos ámbitos, no sólo tecnológicos. El usuario se ha acostumbrado a los resultados que da Google y no busca más. Si algo no está en Google, definitivamente no existe, o no importa si existe.
Como decía mi profesor de doctorado, había propuestas mucho mejores en la literatura científica para crear algoritmos de buscadores. Sin embargo, Google ha ganado con distancia la carrera del siglo.
Deja una respuesta