Sabe aquele novo artista que você acabou de adicionar como favorito, e aquele novo gênero que você descobriu? Ou aquela nova música que apareceu e você salvou para ouvir depois? Isso pode ser resultado da descoberta musical por algoritmos. Embora sejamos perfeitamente capazes de criar, editar e atualizar as nossas próprias listas de reprodução, às vezes simplesmente não temos tempo (nem vontade) de navegar entre centenas de milhares de músicas para pesquisar e encontrar novas opções. Seu aplicativo de streaming de música pode se tornar seu melhor amigo, aliviando a vibe de um dia ruim, ou transformando um trajeto chato em uma oportunidade de curtir um show, e tudo com o apertar de um botão. Bem-vindo à curadoria automatizada de música, um produto de big data, machine learning e inteligência artificial. Sim, é assim que seu aplicativo de streaming de música o conhece tão bem! Que tal conhecer como os modelos de recomendação funcionam?
De modo geral, existem três tipos de modelos de recomendação musical, que usam três tipos diferentes de análise. O primeiro é a colaboração de modelos de filtragem, que analisa o comportamento de um usuário no aplicativo de streaming, bem como o comportamento de outras pessoas. O segundo é o processamento de linguagem natural (modelos de NPL), que analisa textos, e o terceiro são os modelos de áudio que analisam as faixas de áudio RAW. Na maioria dos casos, os aplicativos de streaming de música usam uma combinação dos três tipos de análise, pois isso fornece um mecanismo de descoberta poderoso e único.
O exemplo mais comum de filtragem colaborativa são as classificações de filmes com base nas curtidas que você dá no Netflix. Ele fornece uma compreensão básica de quais filmes você pode gostar com base em suas classificações anteriores, dando à Netflix a capacidade de recomendar filmes, seriados e documentários com base no que usuários semelhantes desfrutaram. Para aplicativos de música, a filtragem colaborativa é baseada em dados de feedback implícitos. A transmissão ao vivo daquele hit tocando no seu aplicativo entra nessa conta e também, quantidade de músicas transmitidas, músicas salvas em listas de reprodução ou um usuário visitando a página de um determinado artista depois de ouvir uma de suas músicas. Embora realmente pareça legal, como realmente flui isso?
Um usuário tem um conjunto de preferências de músicas, como P, R, Q e T, enquanto outro usuário pode ter um conjunto de preferências denotadas como R, F, P e Q. Os dados colaborativos mostram que ambos os usuários gostam de Q , R e P e, portanto, vocês provavelmente são muito semelhantes no que gostam. Isto é, provavelmente, vocês irão gostar do que os outros ouvem e, portanto, sobra verificar a única faixa atualmente não mencionada na lista de preferências. Portanto, neste caso, para o primeiro usuário é F e, para o segundo, é a faixa T. Agora a questão é: como um aplicativo de streaming de música faz isso para milhões de preferências? Usando matriz matemática. Essencialmente, no final da equação, você obtém dois tipos de vetores, onde X é o usuário e Y é a música. Ao comparar esses vetores, você descobre quais usuários têm gostos musicais semelhantes e quais são semelhantes à música atual que você já está escutando.
O segundo tipo de recomendações musicais vem do processamento de linguagem natural (modelos NLP), que é obtido a partir de dados de texto. Isso vai desde artigos de notícias, texto da Internet e até metadados. O que ocorre aqui é que seus aplicativos de streaming de música rastreiam a web, procurando constantemente textos escritos sobre música, como em blogs, e descobrem o que as pessoas estão dizendo sobre essas músicas ou artistas. Ainda, como o processamento de linguagem natural permite que um computador entenda a fala humana, ele é capaz de ver quais adjetivos estão sendo usados ??com frequência em referência às canções e artistas em questão. Esses dados são então processados ??em vetores culturais e termos principais e recebem um peso associado que tem uma importância correspondente. Basicamente, a probabilidade de alguém usar esse termo específico para descrever uma música, banda, gênero ou artista. Se a probabilidade for alta, essa peça musical provavelmente será categorizada como semelhante.
O terceiro tipo de recomendação vem da análise de faixas de áudio RAW. Embora possa não parecer que precise disso se tiver os dois primeiros recursos, o que esse modelo específico faz é melhorar a precisão das recomendações levando em consideração as músicas antigas e novas. Um exemplo disso seria uma música nova chegando ao aplicativo e obtendo apenas 50-100 ouvintes, mas como há tão poucos filtros contra ela, esse tipo de música pode acabar em uma lista de reprodução de descoberta ao lado de músicas populares. Isso ocorre porque os modelos de áudio bruto não discriminam músicas novas e populares, especialmente se o processamento de linguagem natural não detectar a faixa por meio do texto online.
E como as faixas de áudio RAW são analisadas? Por meio de redes neurais convolucionais que formam espectrogramas, ou seja, criando camadas convolucionais ou barras “grossas e finas” que mostram representações de frequência de tempo de quadros de áudio e entradas. Depois de passar por cada camada, você pode ver quais estatísticas de computação são aprendidas ao longo da música ou, em termos leigos, os recursos das músicas. Isso pode incluir fórmula de compasso, modo, andamento, volume e tom da música. Seu aplicativo de streaming de música pode então entender as semelhanças fundamentais entre as músicas e recomendá-las com base em seus recursos de audição.
No final das contas, seu aplicativo de streaming de música conhece você por causa da enorme quantidade de dados que ele armazena e analisa. No entanto, para funcionar corretamente, arquivos de áudio, matrizes, matemática e texto devem ser analisados em tempo real, aplicados e atualizados por meio de processos de machine learning. É isso aí, uma forma de inteligência artificial que fornece aquela lista de reprodução recomendada e “perfeita” que você pode acessar diariamente.
Quer serviços de desenvolvimento de aplicativos de música personalizados?Vamos conversar!