Hoy he salido algo tarde de comer e iba por la calle hasta llegar a casa para ver el partido. La final de la copa de la FIFA, disputada este año entre Croacia y Francia, será retransmitida por diferentes cadenas de televisión para todo el globo. Se estima que más de mil millones de personas prestarán atención al acontecimiento en todo el mundo.
Algo así de enorme requiere de una infraestructura para su sistema de gestión de datos robusta y segura. La cantidad de información que mueve no solamente la FIFA, sino todas las demás empresas de televisión y noticias / canales de deportes que hablan del mundial generan más de un petabyte de datos. Empresas de todo el mundo que manejan información de los eventos, textos, retransmisiones, comentarios, artículos... tecnología punta de la información en estado puro.

Hoy vengo a hablar de esto. De cómo es capaz google de generar la infraestructura necesaria para que me llegue la información en tiempo real desde el partido de fútbol hasta una notificación push en mi teléfono móvil que me avisa del segundo gol de Griezmann de penalti.
Empezamos en la fuente de los datos
En cuanto se mete un gol, los diferentes apuntadores de los diversos medios de comunicación anotan el gol en sus sistemas de retransmisión directo que llegan a tu teléfono móvil. Ellos tienen a gente especializada, siguiendo la retransmisión del partido, realizando comentarios y anotando todas las cosas que ocurren en directo.

Seguramente habrás visto esto más de una vez para retransmitir los partidos de la liga. Es un estándar bastante imitado en todo el mundo y que se sigue muy a menudo por muchas webs.

Pueden haber muchos diseños originales que gusten mas o menos pero el formato suele ser el mismo. Una que me gusta mucho del diario británico "The guardian" que te informa del resultado y luego los comentarios.

Lo que vengo a decir es que la cantidad de información que se genera en internet es enorme. Pero Google no funciona como las noticias tradicionales, con gente que mete la información a mano y cuidan la apariencia de la información. Google funciona con una capa por encima de esto, por lo que debe seleccionar correctamente la información que genera internet y poder organizarla en función de lo confiable que sea el medio en el que se publica.
RECOLECCIÓN DE DATOS
Con tanta información, Google debe de ser capaz de filtrar toda la información y mantenerla organizada por fuentes de noticias, y cada una de esas fuentes de noticias o generadores de contenido debe de tener algún tipo de perfil implementado para darle un mayor peso o una mayor importancia.
Al final del dia debe de producir un resultado como este cuando buscas "Croacia vs Francia". Organiza la información que ha obtenido de la empresa y pone también información relevante que proceda de la wikipedia (un proyecto al que google apoya constantemente y le da un montón de visibilidad por la creencia que tiene la empresa en un proyecto de información y conocimiento libre.).

De esta información hay un pequeño detalle, y es de donde ha sacado la información. Si mirais abajo, os dice que la información la ha sacado de telecinco.es. (Por cierto he entrado y la cantida de banners y popups que me han salido ha sido aberrante incluso con el ad blocker

Que pocos elementos invasivos que tiene para el usuario, y que pocas veces tengo que hacer click para acceder a la información (cuya primera plana es un Banner publicitario irrelevante a lo que estoy viendo, bravo Mediaset! Bravo!). Lo dejo como ejemplo de una mala interfaz de usuario.
El tema es, ¿cómo puede ser que Google con tanta información que hay haya elegido Mediaset España para obtener su información del partido de fútbol? Bueno Mediaset no solamente es una de las mayores empresas de comunicación de Europa - lo cual la posiciona como una autoridad en el mundo de las comunicaciones - sino que también han generado suficiente contenido con suficiente tracción para que Google los tome como la empresa mas fiable para obtener sus datos y mostrarlos en España con referencia al mundial de futbol.
Aqui Google lo que hace es analizar en tiempo real toda la información y crear un stream de datos con referencia al partido. Esta información es obtenida de los diversos medios de comunicación y entre ellas se validan.
Por ejemplo, en una web aleatoria sin mucha popularidad se marca un tercer gol. Google recibe esta notificación pero como no confía en la fuente , no la marca en su resultado en directo. Luego esta información se actualiza en su medio de confianza y conforme va haciéndose eco de la noticia por otros medios, se confirma que efectivamente ha ocurrido. Si las diez fuentes más importantes te indican que ha habido gol, es una garantía de que ha habido un gol.
Google además recibe toda la información referente al gol de los diferentes medios de noticias y la alimenta a su sistema. Al final del dia, google necesita extraer de todos los datos una serie de campos de información que sean lo más válidos posibles para proporcionarte un stream de datos como este.

Esto no lo introduce Google a mano (creo que a estas alturas ya ha quedado claro) Esto lo selecciona google de un montón de noticias. Y la forma en la que lo hacen es poco conocida, pues se basa entorno a sus infraestructuras y es así como hacen negocio.
Conforme internet se llena de datos, google los va catalogando y a medida que se repiten, se van verificando en el sistema para que toda la información que te llega llegue correcta, bien dispuesta y con la mínima intervención humana.
Análisis de datos de los usuarios
Por supuesto, Google también recopila información sobre tus búsquedas y como utilizas tu móvil. De esta forma puede tratar de crear una especie de "perfil" sobre tu persona para detectar cuales son tus intereses, y hacerte un feed de esos intereses. Google sabía perfectamente que me interesaba el mundial porque he realizado muchas búsquedas, su sistema lo detecta y incluye en mi perfil .Ahora yo recibo ese feed de noticias, que ha sido procesado por su big data y presentado de una forma organizada en mi teléfono móvil.
Google tiene acceso a nosotros desde nuestro bolsillo. La información que le proporcionamos la utiliza para alimentar su big data y sacar toda la información que pueda de nosotros y ofrecerla a sus partners y consumidores de noticias. A cambio de esto, nosotros recibimos un sistema de noticias (que de momento es fiable , aunque plantea la pregunta de quien controle Google controla la información que recibe la sociedad, esperemos que Google no se politice de forma negativa nunca).
Este tipo de tecnologías y big data son las que hacen que yo me entere del mundial. Primero porque google ha creado una estructura de datos de fuentes de noticias y generadores de contenido, y por otro lado ha creado una base de datos de usuarios con "posibles" aficiones intereses y gustos. Ahora, google entre medio sirve a cada usuario la información que el desea, lo cual ofrece un mercado enorme para que las empresas puedan acceder a los usuarios, publicando contenido más atractivo y presentando la información de una manera más interesante para los usuarios

Además, todo el mundo tiene acceso a ser los nuevos agentes en estos canales. Hoy le tocó a Telecinco, mañana será Antena 3, y pasado será otra empresa (en general, la que mejor trabajo haga para promocionarse y posicionarse en internet).
Y esa es la auténtica magia de Google. Google ha creado un mercado de usuarios con una oferta de publicidad y ofrecimiento de contenidos y servicios tan amplia , bien estructurada y grande, que todas las empresas que generan contenidos consideran tan interesante usarla, que invierten miles de millones de euros al año en estudiar y en posicionarse con sus contenidos en este nuevo mercado.
El cambio desde la televisión hasta ahora lo podéis imaginar. Antes una empresa pagaría grandes sumas de dinero para poner un anuncio en la televisión que llegase solamente a una pequeña proporción de gente (según el canal de televisión) y solo si estaban mirando los anuncios , y solo si no se iban a hacer otra cosa o cambiaban el canal.
Ahora estas empresas por mucho menos dinero tienen la posibilidad de enviar sus anuncios y su publicidad directamente al bolsillo del usuario, a su móvil, para que puedan acceder a ellos de forma poco invasiva. El coste es mucho menor y se llega no solamente a todos los usuarios, sino que además se permite segmentar los usuarios que reciben esta información (por ejemplo, el resultado del mundial de futbol

Además, dado que Google tiene acceso a toda base de datos global de usuarios, distribuida en varios datacenters en todo el mundo, conectados entre si por largos cables de fibra óptica que corren por debajo del mar. Son capaces de analizar trends y aficiones, y ofrecen poderosas herramientas a las empresas sobre su base de datos de usuarios. En definitiva, no solamente están vendiendo a los usuarios, sino también sus preferencias de consumo de datos a lo largo del tiempo.
Invertir en big data para google es ahora clave y fundamental. Ya empiezan a dar sus pequeños pasos con el último ejemplo del google assistant, que incluso llama por teléfono a un restaurante y reproduce sonidos humanos para darle un toque más real a la conversación. Los usuarios tienen ahora un pequeño asistente que les hace las cosas por ellos. En el futuro, se espera que tu asistente te de sugerencias cada vez lo más humanas posibles.
LA INFORMACIÓN EN MI TELÉFONO
El sistema de Google sabe cada vez que un tema que puede interesar al usuario se actualiza y le envía al usuario una notificación push al móvil. Muchas empresas empiezan a hacer esto (como Youtube) para sugerirte videos que puedan gustarte. Y google hace también lo mismo con sus demás servicios para ofrecerte la información del partido de futbol que quieres ver. Esta notificación push llega a tu teléfono móvil , que está sincronizado con tu perfil de Google.
Con esta reflexión, también se abre el debate de la cantidad de cosas que puede hacer Google con esa información, y lo peligroso o éticamente moral de lo que podría hacer Google con tus datos. Pero eso lo dejaremos para otro dia. Entre tanto, me acaba de avisar Google que Francia ha ganado 4 a 2.