Press "Enter" to skip to content

Tem 300 TB? Tenha (quase) TODO o Spotify!

Compartilhe

Parece que o Natal chegou mais cedo para os fãs de música.

O Spotify domina o consumo de música via streaming. Por mais que outras plataformas possam ser melhores ou entregar um volume maior de conteúdo (eu mesmo gosto muito do YouTube Music), é indiscutível que o app do ícone verde é a grande referência para quem quer passar algum tempo ouvindo a trilha sonora da vida.

O que poucos poderiam imaginar e que iriam distribuir por torrent nada menos que 300 terabytes de dados, com o conteúdo armazenado nos servidores do Spotify, para que qualquer pessoa possa, literalmente, ter um arsenal de músicas para ouvir quando quiser, pelo resto da vida.

Então… você tem 300 TB livres na sua casa e não sabe o que fazer com ele?

Continue a ler este artigo.  No mínimo, vale pela história a ser contada.

 

O que aconteceu?

O (até então desconhecido) Anna’s Archive chocou o mundo digital ao anunciar um vazamento massivo de 300 terabytes de dados extraídos diretamente dos servidores do Spotify.

A ação expôs não apenas metadados detalhados, mas também os arquivos de áudio de milhões de músicas protegidas por direitos autorais.

A essa altura do campeonato, ninguém poderia imaginar que isso poderia acontecer agora. Por outro lado, considerando o histórico, era algo até esperado por aqueles que observavam com atenção os movimentos de alguns grupos que adoram explorar as brechas das plataformas.

O grupo hacktivista justifica a invasão como um esforço necessário de preservação histórica para salvar a cultura musical do desaparecimento digital.

E essa turma até que tem um ponto.

É só olhar para a galera gaming, que briga com Nintendo e Microsoft pela preservação dos jogos do passado e, como resposta, recebem processo quando usam emuladores ou tentam desbloquear consoles para rodar títulos antigos.

Em contrapartida, a indústria fonográfica e especialistas classificam a distribuição desses arquivos como o maior ato de pirataria da década…

…ignorando completamente o controle absoluto que o Spotify possui nesse acervo, tirando (em muitos casos) a liberdade de escolha e o direito de propriedade do usuário.

Mas “o grande problema” é a pirataria.

As autoridades e o próprio Spotify já iniciaram investigações rigorosas para determinar a extensão exata da brecha de segurança explorada pelos invasores.

E o incidente deixa muito claro como a plataforma é frágil, a ponto de permitir que um catálogo enorme de músicas esteja no torrent, com distribuição descentralizada e acesso praticamente infinito para quem quiser ter essas músicas.

Vale o registro: o Spotify não é a única plataforma de streaming que está sujeita a esse tipo de ação. Ainda mais considerando a era da inteligência artificial, com dados em uso no treinamento de plataformas com essa finalidade específica de invasão de serviços online.

 

A dimensão do vazamento

O volume de dados subtraídos do Spotify alcança a marca histórica de 300 terabytes, tornando-se um dos maiores vazamentos de mídia de todos os tempos.

Dá para dizer que é música em estado (quase) infinito. Qualquer pessoa estaria mais do que satisfeita com esse acervo.

O pacote inclui metadados técnicos precisos de 256 milhões de faixas, oferecendo um mapa completo do acervo da plataforma.

Além das informações de catálogo, o grupo conseguiu extrair e disponibilizar os arquivos de áudio de 86 milhões de músicas.

A abrangência do ataque cobre aproximadamente 99,6% de todo o conteúdo que é ativamente consumido pelos usuários do serviço.

Ou seja, temos que considerar aqui que aquelas músicas que nunca são reproduzidas por ninguém, faixas independentes e outros arquivos temporários (que não são públicos) não entraram nesse vazamento.

A distribuição desse material está sendo realizada através de redes descentralizadas de torrent para garantir sua perenidade e acesso global.

E uma vez que caiu no torrent, duas consequências diretas são estimadas.

A primeira é que será muito difícil localizar a origem dos arquivos, uma vez que essa distribuição está em modo descentralizado.

A segunda é que, muito provavelmente, os arquivos ficarão PARA SEMPRE na internet, pois semeadores oferecendo esse acervo não vão faltar.

A escolha técnica (do Anna’s Archive em disponibilizar o catálogo do Spotify em torrent) dificulta as tentativas de remoção do conteúdo por parte das autoridades e detentores de direitos.

E toda a indústria fonográfica está com cara de trouxa neste momento, pois pouco pode ser feito para evitar os piores efeitos colaterais do vazamento.

Um resumo do estrago:

  • 256 milhões de faixas devidamente catalogadas usando metadados.
  • 186 milhões de códigos ISRC únicos, o identificador padrão para gravações musicais.
  • 86 milhões de arquivos de áudio já arquivados.
  • Aproximadamente 300 TB de dados, distribuídos em torrents (download gratuito) agrupados por nível de popularidade.
  • Cobertura estimada de 99,6% de todas as audições feitas no Spotify.

 

Critérios de compressão e qualidade

Os responsáveis pelo vazamento aplicaram um sistema inteligente de compressão, baseado na popularidade de cada faixa musical na plataforma.

Isso foi estabelecido para garantir não apenas a melhor qualidade para cada faixa, mas também um pacote de dados otimizado para o download dos arquivos.

As músicas que figuram no topo das paradas foram mantidas em seu formato original de alta qualidade para satisfazer a maioria dos ouvintes.

Para as faixas menos conhecidas, o grupo optou por recodificar os arquivos utilizando o codec OGG Opus com taxas de bits reduzidas.

Essa decisão permitiu armazenar a gigantesca “cauda longa” da música mundial sem inviabilizar o tamanho total do download.

Para aqueles usuários que desejam uma maior qualidade de áudio nessas faixas menos populares, basta usar um bom programa de conversão, ou até mesmo as soluções online que realizam o processo em questão de minutos.

Ou simplesmente não faz nada, pois você está recebendo música de graça, o que já pode ser considerado um verdadeiro milagre nos tempos modernos.

O objetivo dessa engenharia foi equilibrar a fidelidade sonora com a viabilidade de armazenamento e distribuição em massa do arquivo.

A prioridade foi garantir que a música exista e seja acessível, mesmo que com uma leve perda de qualidade técnica nos arquivos mais obscuros.

Em termos práticos, ninguém saiu no prejuízo aqui.

Exceto é claro as gravadoras.

 

A narrativa da preservação musical

O Anna’s Archive defende que a ação não é pirataria comum, mas sim um ato de arquivamento necessário para a humanidade.

Ou melhor… neste caso em específico, a “missão” de arquivamento foi dividida e compartilhada com o restante da humanidade, que certamente vai preservar esses registros musicais para até o fim dos nossos dias neste planeta.

Afinal de contas, é uma missão “pesada demais” para que uma corporação com servidores tão frágeis como o Spotify cuide de tudo.

E, tal e como o próprio episódio mostra, o Spotify não parece ser a plataforma mais competente do mundo para essa preservação.

O próprio Anna’s Archive sustenta que as plataformas comerciais são arquivos instáveis e que a cultura não deve depender de licenças corporativas temporárias.

O manifesto do grupo aponta que serviços de streaming podem remover conteúdos a qualquer momento por disputas contratuais ou censura regional.

De novo: os gamers e os fãs de cinema e séries de TV sabem muito bem o que é isso, pois estão perdendo anos importantes de memória digital pela falta de sensibilidade ou compromisso com a memória afetiva dos usuários.

A criação de um backup descentralizado seria a única forma de garantir que essas obras sobrevivam a um colapso digital futuro. E o grupo hackativista não está errado nessa perspectiva.

A postura ideológica atrai o apoio de defensores da liberdade de informação e arquivistas digitais ao redor do mundo, e dos fãs de música de um modo geral.

É claro que muitas pessoas (na verdade, a maioria) vai se aproveitar do fato de ter um acervo musical que foi distribuído na internet de graça e, neste momento, não vai pensar de forma mais edificante nas consequências futuras do ato.

Por outro lado, expandir essa reflexão para os riscos reais da todos nós perdermos registros importantes da história da indústria fonográfica ajuda ao coletivo a despertar um pensamento mais crítico sobre o assunto.

O problema é que as nobres intenções do Anna’s Archive colidem frontalmente com as leis de propriedade intelectual que sustentam a economia da indústria criativa atual.

E como as gravadoras adoram dinheiro, está mais do que explicado por que a indústria fonográfica ficou extremamente irritada com o episódio.

 

A resposta oficial da indústria

O Spotify emitiu comunicados confirmando que seus sistemas de proteção DRM foram alvo de táticas ilícitas de contorno por terceiros. E diante dos números robustos, nem podia dizer o contrário.

A empresa sueca reconheceu a gravidade da situação e mobilizou suas equipes de segurança para fechar as brechas exploradas.

Palavras do Spotify (ou de seus representantes)

“Uma investigação sobre acesso não autorizado determinou que um terceiro coletou metadados públicos e usou táticas ilícitas para burlar sistemas DRM e acessar alguns arquivos de áudio da plataforma. Estamos investigando o incidente atualmente.”

Apesar da confirmação, a plataforma contesta os números divulgados pelos hackers e afirma que apenas uma parte do acervo foi comprometida. E tal narrativa pode sim ser verdade, de alguma forma.

Não podemos nos esquecer que o Anna’s Archive capturou apenas as faixas mais populares entre os usuários. O que não é conhecido por ninguém ficou de fora.

Já os executivos da indústria musical já preparam uma ofensiva jurídica global para tentar conter a disseminação dos arquivos na internet.

E eu tenho pena desses advogados, pois vai ficar difícil descobrir a quem processar, ou quantas pessoas serão envolvidas nesse litígio.

Organizações de direitos autorais estão pressionando provedores de internet para bloquear o acesso aos domínios relacionados ao Anna’s Archive. E essa seria uma das poucas medidas eficientes para combater a disseminação dos arquivos.

Porém, poderia ser o mesmo que enxugar gelo: certamente o arquivo torrent de origem para o acervo de músicas já possui milhões de backups ao redor do mundo, e qualquer pessoa poderia redistribuir esse arquivo para seguir com o compartilhamento.

A batalha legal promete ser longa e complexa devido à natureza descentralizada e internacional do vazamento. E eu tenho pena dos advogados que serão envolvidos nessa disputa.

Ou talvez não.

 

A inteligência artificial como “grande ameaça”

A liberação de um banco de dados musical tão vasto e bem catalogado se torna automaticamente um recurso inestimável para o desenvolvimento de IA.

Para qualquer plataforma de inteligência artificial funcionar direito, dados são necessários. Quanto mais dados, melhor.

E aqui, estamos falando de nada menos que 300 terabytes de dados, envolvendo as músicas e os metadados dos arquivos musicais.

Pesquisadores e empresas agora têm acesso a um conjunto de treinamento perfeito para modelos de geração de áudio.

Mais do que isso: a porta está mais do que escancarada para o aperfeiçoamento de plataformas que estão clonando a voz, o estilo e a estruturação de arranjos de artistas humanos para a criação de novas versões de músicas totalmente produzidas por softwares de inteligência artificial.

O uso desse material “limpo” e organizado pode acelerar drasticamente a capacidade das IAs de compor e produzir música realista. E, acredite se quiser, essa é uma ameaça ainda maior e mais temida do que a própria pirataria.

O grande medo da indústria fonográfica é que a tecnologia, treinada com o trabalho dos artistas, possa eventualmente substituí-los no mercado.

O que não seria algo absurdo de se pensar, mas não tão distante de uma realidade prática. É um plot de “Black Mirror” que está mais próximo de nossa realidade do que se pode imaginar.

É só você pensar nos influenciadores digitais que já estão substituindo os humanos nas redes sociais.

Por mais que música seja uma arte iminentemente humana, os limites não estão mais tão estabelecidos como todos pensavam.

A situação expõe a falta de regulamentação clara sobre o uso de dados protegidos por direitos autorais no treinamento de máquinas, e essa é uma discussão que já passou do ponto do atraso.

O incidente deve forçar legisladores a criar novas regras para proteger o trabalho humano na era da inteligência artificial generativa.

E tornar as punições para quem usa esse conteúdo protegido por direitos autorais para treinamento de IA de forma não autorizada mais rígidas.

Mas para você, que vai aproveitar para ouvir a trilha sonora de sua vida, não há muito com o que se preocupar…

…por enquanto.

 


Compartilhe
@oEduardoMoreira