Você se lembra do ‘mannequin challenge’, o viral que ficou popular no final de 2016, onde um grupo de pessoas ficavam imóveis enquanto eram filmadas por uma câmera em movimento? Pois bem, se você participou desse viral, saiba que contribuiu com a ciência de alguma forma.

Um grupo de cientistas do Google AI utilizou milhares de vídeos com esse viral para treinar uma rede neuronal em uma habilidade que está inata no ser humano: a compreensão de cenas tridimensionais.

 

 

Você contribuiu para a ciência e nem sabe

 

A habilidade que permite que o ser humano calcule distâncias entre os elementos também é útil para uma inteligência artificial, pois é um modo de melhorar a visão por computador, ajudando deslocamento de robôs em ambientes desconhecidos. E não só para robôs, como para qualquer tipo de veículo autônomo.

O uso do mannequin challenge aconteceu porque esse viral oferece a visão dos elementos estáticos das pessoas a partir de todos os ângulos, transformando esse material em uma fonte de dados para compreender a interpretar a profundidade de uma imagem em 2D.

Desse modo, os pesquisadores converteram 2.000 vídeos em imagens 2D com dados de profundidade de alta resolução, usando todo esse material para treinar uma rede neuronal. Isso permitiu que essa rede conseguisse prever a profundidade dos objetos em um vídeo com uma precisão maior que qualquer técnica anterior.

Na hora de realizar o trabalho de inferência, o método pega como referência pontos estáticos para calcular o paralelo e prever a profundidade de cada elemento. Os dados foram publicados pelos cientistas do Google AI para oferecer livre acesso ao dataset, facilitando novas pesquisas nesse sentido. Logo, uma imagem sua de 2016 com esse viral pode estar se difundindo pela internet em benefício de avanços científicos importantes.

Isso é algo relativamente comum: muitos dos datasets mais relevantes utilizados na pesquisa da IA foram compilados a partir de fontes abertas de dados, como Wikipedia, Twitter e Flickr, as únicas capazes de aportar grandes quantidades de informações necessárias para treinar sistemas de deep learning.

 

 

 

Via MIT Technology Review