Facebooktwitterlinkedin

Alrededor de las redes sociales hay muchos mitos y teorías, especialmente sobre cómo muestran contenido por el que nos hemos interesado recientemente o que generalmente nos es afín. Facebook, para disipar la bruma sobre este tema, ha revelado un poco más sobre IA predictiva.

En el pasado la red social ya había compartido detalles sobre su algoritmo que ayudaba a entender su funcionamiento, y ver que realmente no se trata de leer la mente o espiarnos, sino de las interacciones que generamos en ella. Sin embargo, el sistema de clasificación de aprendizaje automático, ML por sus siglas en inglés, que impulsa este algoritmo es muy complejo y posee varias capas.

En qué consiste este proceso de selección

El principal factor que tiene en cuenta este trabajo de clasificación algo increíble y trabajoso, es el volumen de usuarios. Facebook cuenta con más de 2.000 millones de usuarios alrededor del mundo, y cuando uno de ellos entra en su perfil, este algoritmo entra en acción. Para cada usuario existen más de mil publicaciones que pueden quedar en su inicio, pero no todas son realmente pertinentes. Por lo tanto, entran en escena miles de señales que el sistema debe evaluar para determinar qué sería lo más relevante para cada usuario. Y sucede en segundo plano, en los segundos que tarda en cargar el inicio de tu perfil.

Ya que hemos visto cómo funciona a grandes rasgos este proceso, vamos a ahondar un poco en ello paso por paso.

Inventario

Como hemos comentado en esta primera fase se recaban todas las publicaciones que podría llegar al perfil del usuario, de las cuales hay miles para cada uno de los 2.000 millones de usuarios. Facebook ejemplifica este proceso a través de un usuario llamado Juan.

«Este inventario apto incluye cualquier publicación compartida con Juan por un amigo, grupo o página a la que esté conectado que se haya realizado desde su último inicio de sesión y no se haya eliminado. Pero, ¿cómo debemos manejar las publicaciones creadas antes del último inicio de sesión de Juan que aún no ha visto?

Para asegurarnos de que las publicaciones no vistas se reconsideren, las publicaciones nuevas que se clasificaron como elegibles para Juan (pero que él no vio) en sus sesiones anteriores se agregan al inventario elegible para esta sesión. También aplicamos una lógica para que todas las publicaciones que Juan ya haya visto y que hayan desencadenado una conversación interesante entre sus amigos también se agreguen al inventario elegible».

A continuación, el sistema debe puntuar cada publicación según una variedad de factores, como el tipo de publicación, la similitud con otros elementos y cuánto coincide la publicación con lo que el usuario tiende a interactuar. Para calcular esto para más de 1.000 publicaciones, para cada uno de los miles de millones de usuarios, todo en tiempo real, Facebook ejecuta estos modelos para todas las historias de candidatos en paralelo en varias máquinas, llamadas predictores.

Proceso de integridad

Al concertar todas estas publicaciones comienza el proceso de filtración: aquí se determinan qué publicaciones cumplen con las políticas de Facebook, eliminando todas las que no cumplan con estas condiciones. Dentro de estas publicaciones quedarían aquellas que difundan información falsa, que presenten contenido sensible y los llamados clickbaits.

Llegados a este punto ya tenemos un número más reducido de publicaciones, alrededor de 500. Sin embargo, aún queda trabajo por hacer, ya que si bien todos pueden ser afines al gusto del usuario no todos son igual de relevantes. Por eso, antes de llegar al paso contextual, que vendría a ser el resultado que ve el usuario, contamos con el siguiente punto.

Scoring pass

El siguiente es el scoring pass donde ocurre la mayor parte de la personalización. Aquí, una puntuación para cada historia se calcula de forma independiente, y luego las 500 publicaciones se ordenan por puntuación. Para algunos, la puntuación puede ser más alta para los me gusta que para los comentarios, ya que a algunas personas les gusta expresarse más a través de los me gusta que de los comentarios. Cualquier acción en la que una persona rara vez se involucra (por ejemplo, una predicción de hacer «me gusta» que está muy cerca de cero) obtiene automáticamente un papel mínimo en la clasificación, ya que el valor predicho es muy bajo.

Para este punto tenemos que discernir entre qué publicaciones son más relevantes que otras. Para ello tenemos que enfocarnos por un momento en el usuario. Tomemos el ejemplo dado por la red social en su comunicado.

Desde el inicio de sesión de Juan ayer, su amigo Wei publicó una foto de su cocker spaniel. Otra amiga, Saanvi, publicó un video de su carrera matutina. Su página favorita publicó un artículo interesante sobre la mejor manera de ver la Vía Láctea por la noche, mientras que su grupo de cocina favorito publicó cuatro nuevas recetas de masa madre.

En este caso el usuario, Juan, tiene 4 publicaciones que podrían estar en primer lugar. Lo que determinará cuál de estas dos tendrá una mejor calificación será el nivel de interacción que él mantenga con las publicaciones del usuario y el tipo de publicación.

«Podemos usar las características de una publicación, como quién está etiquetado en una foto y cuándo se publicó, para predecir si a Juan le podría gustar. Por ejemplo, si Juan tiende a interactuar con las publicaciones de Saanvi (por ejemplo, compartiendo o comentando) con frecuencia y su video en ejecución es muy reciente, existe una alta probabilidad de que a Juan le guste su publicación. Si Juan se ha involucrado con más contenido de video que fotos en el pasado, la predicción para la foto de Wei de su cocker spaniel podría ser bastante baja. En este caso, nuestro algoritmo de clasificación clasificaría el video en ejecución de Saanvi más alto que la foto del perro de Wei porque predice una mayor probabilidad de que a Juan le guste».

También es necesario evaluar el impacto a largo plazo que las publicaciones puedan tener: esto Facebook lo consigue por medio de encuestas realizadas a sus usuarios, de las que sacan un valor estimado con el que discernir este impacto para todos sus usuarios.

Contextual Pass

Finalmente llegados a la fase contextual, en donde se aplican algunas reglas, como la de diversificación del contenido para asegurarse de  que el mismo sea más ameno y no cuente con el mismo tipo de publicación continuamente. 

Todos estos pasos suceden en cuestión de pocos segundos, el tiempo que se tarda en abrir la app de Facebook.

Imagen: Depositphotos

Escribir comentario