#Artículos

Deep Learning: los engranajes de la recomendación musical

Ahora que el contenido agnóstico ha demostrado su debilidad en cuanto a la curación musical automatizada, el deep learning y su modelo neuronal quiere suplir las carencias y recomendar como si fuera humano. Una forma de inteligencia artificial que todavía no soluciona la estandarización musical.

02.09.16
Aleix Mateu

La actitud catastrofista sobre Internet y el futuro de la música parece estar acabando y dejando sitio a un diálogo para tratar de comprender los nuevos modelos de pago a los artistas y sellos, de distribución y de recomendación musical, en un entorno digital en constante movimiento y evolución.

El diálogo nace de la necesidad de comprender y tratar de «supervisar» la actividad de las plataformas, y se articula sobre las nuevas reglas y transformaciones que estas grandes empresas tecnológicas están imponiendo al mercado y a las formas de consumo que éstos generan.

Con Apple en cabeza y su voluntad por crear un potencial monopolio, pero también con Spotify e incluso Amazon en el juego, la cruzada por monetizar la música en el entorno digital parece haber terminado. A pesar de ello, como decía Frankie Pizá en Bloques, criptografía y un nuevo porvenir para la música, «cualquiera se encuentra de frente con las incontables grietas y desequilibrios de un método arcaico y que no fomenta una actitud generativa«.

Más allá del hambre empresarial de Apple Music, queriendo engullir el Tidal de Jay-Z o acudiendo a los artistas directamente y obviando las major labels, la expansión en 360 grados de estos servicios denotan una voluntad de redibujar la forma en que entendemos la música, recatalogando la música en moods o, directamente, siendo nuestros únicos dealers musicales.

Con 5 billones de canciones reproducidas a través de las Discover Weekly Playlists de Spotify hasta el mes de mayo (ahora ya son casi 7 billones, según una responsable del servicio), la plataforma se sorprende a si misma por el éxito que ha tenido la propuesta.

Esta función de Spotify que se instauró en junio de 2015 se basa en una lista personalizada de 30 canciones para cada usuario que se crea de forma automatizada cada lunes a partir de los hábitos de consumo del oyente, datos que se cruzan con el contenido de otras playlists similares.

Según transmite un artículo de AdWeek, el senior product owner de Spotify, Matt Ogle, explica que con más de 100 millones de usuarios usando el servicio de curación personalizada por algoritmos, el Discover Weekly se ha convertido en una nueva rutina para sus oyentes a la hora de consumir música, no solo un servicio puntual más.

Comentarios en la red como «nadie me conoce mejor que Spotify Weekly Discover playlist» quizá den una pista sobre el por qué de la carga adictiva del servicio y de por qué la gente prefiere usar estas playlist personalizadas.

Como se sabe, estas recomendaciones nacen de complejos algoritmos que usan nuestra información para proponernos opciones adaptadas, y como tantos usuarios ratifican, no suelen tener demasiado margen de error, así que ofrecen una comodidad inmensa para el consumidor.

Pero el servicio no solo colma de forma satisfactoria nuestro ansia de descubrir música. Si nuestros hábitos musicales se construyen exclusivamente sobre las recomendaciones del servicio, parece que los datos que generemos como consumidores se irán homogeneizando, con lo que también la música propuesta, por muy profundo que sea el conocimiento de la máquina.

Este hecho puede provocar que la curación autómata se vaya olvidando de aquellas propuestas periféricas que menos usuarios consumen y se limite a mantenernos en la mencionada zona de comfort. A pesar de que, tal como se congratula Ogle, el ejecutivo de la plataforma, digan que Spotify consigue llevar a los usuarios muchos artistas emergentes.

De hecho, en el experimento que realizó The Guardian (contenido pagado por Spotify) las conclusiones apuntaban (amablemente) hacia esta dirección. En algo parecido a una batalla de curación musical, la DJ Eclair Fifi se batía con el servicio Weekly Discover para crear una playlist personalizada al filmmaker Akinola Davis.

El resultado: canciones más rebuscadas, específicas y que abrazan un abanico más amplio de estilos en la selección humana; canciones más conocidas, relevantes y homogéneas en la selección algorítmica.

Las recomendaciones de Discover Weekly se basan principalmente en el comportamiento de consumo que un usuario ha mostrado a Spotify, y buscando sus similitudes con otros usuarios de todo el mundo, las propuestas se van cruzando.

Conscientes de las limitaciones que esto genera, y para optimizar su servicio, Spotify esta en continua investigación y desarrollo de formas para tratar la música y obtener información. Buscan pequeñas start ups especializadas que puedan aportar nuevas formas de proceder en su tecnología, y están totalmente abiertos a internships para que investigadores puedan desarrollar sus ideas en su espacio.

¿Cómo funciona la recomendación de Spotify?

Spotify usa muchos algoritmos distintos para construir sus recomendaciones. Aplicados como filtros, éstos suelen crearse de forma colectiva: los filtros colaborativos son esos que se determinan por los datos de preferencias que un usuario ha ido creando históricamente.

Es decir, se basan en la idea de que si dos usuarios escuchan el mismo set de canciones, es posible que sus gustos sean similares. Así mismo, si hay dos canciones que tienen el mismo tipo de audiencia, probablemente suenen similar.

Este tipo de información colaborativa que se extrae de los patrones de consumo y no de los objetos que se están recomendando en sí mismos es el conocido como content-agnostic, y sirve tanto para recomendar música como libros o películas.

En este sentido, Sander Dieleman, investigador afiliado a Spotify que estuvo trabajando en el desarrollo de nuevas vías para mejorar la recomendación, reconoce en su artículo académico (el mismo que uso para hablar de los filtros) que este sistema siempre premiará aquellos ítems más populares.

Es el llamado «cold-start problem«: aquellas canciones nuevas y poco conocidas todavía no han generado datos útiles para analizar.

Una forma para tratar de paliar este problema fue la incorporación de nuevas fuentes de información que se conseguirían por otras vías: los créditos y tags (artista, título, sello, letras, información relacionada en internet como entrevistas y reseñas, etc.) y, sobre todo, el análisis de la señal de audio.

A partir de distintos filtros que se aplican, de la pista de audio se analiza y extrae el género, los instrumentos usados (segmentados en muchos elementos y filtros), el mood o el período de tiempo en el que se creó la canción.

Con estos elementos se pueden trazar las principales representaciones de una canción, a pesar de no disponer de la información colaborativa que mencionábamos, y así crear vínculos entre piezas musicales usando aquellos elementos latentes que las relacionan.

Esta forma de obtención de información se llama deep learning, y es un tipo de machine learning o aprendizaje automático: cómo una máquina puede procesar e interiorizar información de manera automática, es decir, esto es uno de los elementos básicos de la Inteligencia Artificial.

El concepto es mucho más extenso, pero simplificando, podríamos decir que el deep learning es «la aproximación a la percepción humana» del aprendizaje automático de una máquina. Se asemeja a la lógica del sistema neuronal humano (se usa el concepto deep neuronal network), donde cada «neurona» digital se encarga de percibir una característica concreta del objeto examinado.

Así en las canciones podemos encontrar muchos filtros encargándose de recoger, por ejemplo, contenido armónico. Como dice Dieleman, «vibrato singing, ringing ambiance, vocal thirds, bass drum sounds, etc». Pero habrá otros que se encarguen del ruido, el pitch, los drones o las distorsiones, por citar más ejemplos.

Como relata el investigador en su artículo, analizando algunos de los filtros encontró que había uno que podía identificar el Rap en español y otro la lengua china. Otros filtros detectaban géneros como «lounge, reggae, darkwave» y más, incluso había uno que era exclusivamente para la música de Armin van Buuren.

Visualizar el ADN de tu música

La mayoría de esta tecnología la consiguieron gracias a The Echo Nest, una compañía dedicada a la inteligencia musical que el gigante sueco compró en 2014. Ahora, de forma relativamente reveladora y con un lavado de cara comercial, el servicio te permite jugar con estos filtros para descubrir a qué suena tu música.

Esto es la «danzabilidad», «energía» o «popularidad», entre otros. Son algunos de los filtros (o grupos de ellos) que usa el servicio y que, bajo estos nombres accesibles, te permiten ver una recreación de tu colección de música. Tal como muestra la página, éstos son:

Beats Per Minute (BPM) – The tempo of the song.
Energy – The energy of a song – the higher the value, the more energtic. song
Danceability – The higher the value, the easier it is to dance to this song.
Loudness – The higher the value, the louder the song.
Valence – The higher the value, the more positive mood for the song.
Length – The duration of the song.
Acoustic – The higher the value the more acoustic the song is.
Popularity – The higher the value the more popular the song is.

En un artículo que escribe el estudiante y desarrollador griego Dimitris Spathis, nos muestra su colección de música bajo el foco de The Echo Nest, y mientras examina el resultado de las representaciones, deja translucir algunas conclusiones sobre el significado de los filtros: las canciones más enérgicas son positivas y electrónicas, por ejemplo.

Cuando compara el resultado de su colección con la lista del Top Hits de ese día, observamos que las estadísticas son bastante similares.

Así, cuando realiza el gráfico que hay encima de este subtítulo, siendo la parte naranja sus gustos, explica que siempre que Spotify quiera proponer algún tipo de estilo nuevo, intentará que este en la «zona de comfort» de sus gustos habituales.

Con el tiempo, veremos si Spotify consigue ser realmente un servicio útil para descubrir música a aquellos usuarios realmente interesados en ello, o si sigue siendo un buen servicio de streaming más para escuchar cómodamente canciones similares a las conocidas sin tener que esforzarnos en dar un paso más.