in

MusicLM: conheça o recurso de IA do Google que cria músicas a partir de textos

Apesar de não ter sido lançado, MusicLM aponta para o desenvolvimento da inteligência artificial, questões de direitos autorais e o elo, cada vez mais intrínseco, entre tecnologia e música

MusicLM- conheça o recurso de AI do Google que cria músicas a partir de textos
MusicLM- conheça o recurso de AI do Google que cria músicas a partir de textos. Foto: Google/Divulgação

O ano de 2023 mal começou e já podemos afirmar que um dos principais assuntos dos próximos meses está, definitivamente, entre nós: inteligência artificial (IA). Apesar do termo em si não ser uma grande novidade, o principal aspecto a ser notado é o avanço da tecnologia a ponto dos recursos estarem disponíveis de forma cada vez mais simples, ao alcance das mãos.

Nos últimos dias, as redes sociais foram inundadas por versões inéditas de artistas cantando músicas que, até então, nunca foram gravadas de forma convencional. Provando que o tema está em alta, o Google deu um passo mais ousado e criou o MusicLM. Porém, diante das polêmicas envolvendo os Direitos Autorais, o recurso não foi lançado e nem há previsão, segundo informações do TechCrunch.

Leia Mais:

O MusicLM é um modelo que gera música de alta fidelidade a partir de descrições de texto como, por exemplo, “uma melodia calmante de violino apoiada por um riff de guitarra distorcido”. O MusicLM lança o processo de geração condicional de música, a partir de uma tarefa de modelagem hierárquica de sequência a sequência e gera música a 24 kHz que permanece consistente por vários minutos.

“Nossos experimentos mostram que o MusicLM supera os sistemas anteriores tanto em qualidade de áudio quanto em aderência à descrição do texto. Além disso, demonstramos que o MusicLM pode ser condicionado tanto a um texto quanto a uma melodia, na medida em que pode transformar melodias assobiadas e sussurradas, de acordo com o estilo descrito, em uma legenda de texto. Para dar suporte às pesquisas futuras, lançamos publicamente o MusicCaps, um conjunto de dados composto por 5,5 mil pares de música e texto, com descrições em rich text fornecidas por especialistas humanos”, diz um artigo acadêmico do Google Research.

Detalhado em um artigo acadêmico do Google Research, o MusicLM foi treinado em um conjunto de dados de 280.000 horas de música para aprender a gerar canções coerentes para descrições de – como dizem os criadores – “complexidade significativa”. Por exemplo, “canção de jazz encantadora com um solo de saxofone memorável e um cantor solo” ou “techno berlinense dos anos 90 com baixo fraco e chute forte”.

De acordo com TechCrunch, é difícil mensurar o quão bom os samples soam, já que não há músicos ou instrumentistas no loop. Mesmo quando alimentado com descrições um tanto longas e sinuosas, o MusicLM consegue capturar nuances como riffs instrumentais, melodias e humores.

possessed-photography-U3sOwViXhkY-unsplash
Inteligência Artificial é um dos principais temas comentados em 2023, quais os desdobramentos possíveis para música?Foto: Unsplash

Os recursos de inteligência artificial do MusicLM vão além da geração de clipes curtos de músicas. Os pesquisadores do Google mostram que o sistema pode se basear em melodias existentes, sejam elas cantaroladas, cantadas, assobiadas ou tocadas em um instrumento. Além disso, o MusicLM pode pegar várias descrições escritas em sequência. Por exemplo, “hora de meditar”, “hora de acordar”, “hora de correr”, “hora de dar 100%”, e criar uma espécie de “história” melódica ou narrativa variando até vários minutos de duração – perfeitamente adequado para a trilha sonora de um filme.

O MusicLM também pode ser instruído por meio de uma combinação de imagem e legenda ou gerar áudio que é “tocado” por um tipo específico de instrumento em um determinado gênero, segundo a análise do TechCrunch. Até mesmo o nível de experiência do “músico” da Inteligência Artificial pode ser definido e o sistema pode criar músicas inspiradas em lugares, épocas ou requisitos, como por exemplo, música motivacional para exercícios.

MusicLM: desafios éticos na era da inteligência artificial

A análise do TechCrunch aponta que o MusicLM não é perfeito. Algumas das amostras têm uma qualidade distorcida, um efeito colateral inevitável do processo de treinamento. E embora o MusicLM possa tecnicamente gerar vocais, incluindo harmonias de coral, “eles deixam muito a desejar”, segundo o site especializado. A maior parte das “letras” cantadas por vozes sintetizadas acabam soando como amálgamas de vários artistas.

Ainda assim, os pesquisadores do Google observam os muitos desafios éticos impostos por um sistema como o MusicLM, incluindo a tendência de incorporar material protegido por direitos autorais de dados de treinamento nas músicas geradas. Durante um experimento, eles descobriram que cerca de 1% da música gerada pelo sistema era replicada diretamente das músicas nas quais ele treinava – um limite aparentemente alto o suficiente para desencorajá-los de lançar o MusicLM em seu estado atual.

“Reconhecemos o risco de potencial apropriação indébita de conteúdo criativo associado ao caso de uso”, escreveram os coautores do artigo. “Enfatizamos fortemente a necessidade de mais trabalho futuro para lidar com esses riscos associados à geração de música.”

Supondo que o MusicLM ou um sistema como ele seja disponibilizado um dia, parece inevitável que grandes questões legais venham à tona – mesmo que os sistemas sejam posicionados como ferramentas para ajudar os artistas, em vez de substituí-los. Eles já o fizeram, embora em torno de sistemas de Inteligência Artificial mais simples, aponta o TechCrunch.

Em 2020, a gravadora de Jay-Z apresentou disputas de direitos autorais contra um canal do YouTube, Vocal Synthesis, por usar IA para criar covers de Jay-Z de músicas como “We Didn’t Start the Fire” de Billy Joel. Depois de inicialmente remover os vídeos, o YouTube os restabeleceu, descobrindo que os pedidos de remoção estavam “incompletos”. Mas a música deepfaked ainda está disponível em terreno digital obscuro.

Um white paper de autoria de Eric Sunray, estagiário jurídico da Music Publishers Association, argumenta que geradores de música de Inteligência Artificial como o MusicLM violam os direitos autorais da música ao criar “tapeçarias de áudio coerente a partir das obras que ingerem no treinamento, infringindo assim a reprodução da Lei de Direitos Autorais dos Estados Unidos direita.”

Após o lançamento do Jukebox, os críticos também questionaram se o treinamento de modelos de Inteligência Artificial em material musical protegido por direitos autorais constitui uso justo. Preocupações semelhantes foram levantadas em relação aos dados de treinamento usados em sistemas de Inteligência Artificial geradores de imagem, código e texto, que geralmente são extraídos da Web sem o conhecimento dos criadores.

Do ponto de vista do usuário, Andy Baio, da Waxy, especula para o TechCrunch que a música gerada por um sistema de Inteligência Artificial seria considerada um trabalho derivado, caso em que apenas os elementos originais seriam protegidos por direitos autorais. Claro, não está claro o que pode ser considerado “original” em tal música; usar essa música comercialmente é entrar em águas desconhecidas. É uma questão mais simples se a música gerada for usada para fins protegidos pelo uso justo, como paródia e comentário, mas Baio espera que os tribunais tenham que fazer julgamentos caso a caso.

Pode não demorar muito para que haja alguma clareza sobre o assunto. Vários processos que tramitam nos tribunais provavelmente terão relação com a Inteligência Artificial para geração de música, incluindo um referente aos direitos de artistas cujo trabalho é usado para treinar sistemas de inteligência artificial sem seu conhecimento ou consentimento. Mas, sem dúvidas, novos desdobramentos acontecerão em 2023 sobre esse tema.