Google usou vídeos do youtube do desafio manequim para treinar seu ai

Índice:

O que você precisa saber
Obtenha mais Pixel 3a
Google Pixel 3a

O que você precisa saber

O Google está treinando sua IA para criar mapas de profundidade que isolam sujeitos humanos na cena usando apenas uma câmera.
Como ponto de partida, o Google usou 2000 vídeos do YouTube do Mannequin Challenge para treinar a IA.
Os resultados levarão à capacidade de adicionar efeitos aos vídeos, como o modo retrato, e serem usados para Realidade Aumentada.

Em uma postagem recente no blog, o Google detalhou como tem trabalhado na percepção de profundidade em vídeos em que a câmera e o assunto estão se movendo. Como ponto de partida, o estudo precisava acessar uma grande quantidade de dados para treinar a IA, e o primeiro passo lógico foi treiná-lo para detectar pessoas em uma cena em que a câmera estava se movendo, mas as pessoas eram estáticas.

Como se vê, o Google tinha o recurso perfeito para esses dados na forma de vídeos do YouTube que foram filmados para o Mannequin Challenge. Nesse desafio, uma pessoa ou grupo de pessoas ficava completamente parado quando uma câmera se movia em torno de sua posição. O Google usou 2000 vídeos do desafio para ajudar a treinar sua IA para detectar figuras humanas em uma variedade de cenas diferentes.

Algo que torna este estudo ainda mais interessante é o fato de o Google estar ensinando sua IA a criar mapas de profundidade usando imagens que foram filmadas usando apenas uma câmera. Na maioria das vezes, várias câmeras devem ser usadas para detectar informações de profundidade em uma cena.

O Google já utiliza algo semelhante para imagens estáticas para criar seu efeito no modo retrato nos telefones Pixel. No entanto, isso pertence apenas a imagens estáticas. O novo método que o Google está desenvolvendo é treinar sua IA para criar um mapa de profundidade em que a câmera e o assunto estão se movendo dentro de uma cena.

Ao se ramificar em vídeos, ele abrirá recursos no futuro para criar bokeh em cenas de vídeo semelhantes ao modo retrato no seu telefone. Outro benefício resultante deste estudo serão os resultados aprimorados para a realidade aumentada, como os Playmojis do Google Playground.

Outra possibilidade será a geração de imagens 3D a partir de cenas 2D. Embora o hardware da câmera sempre tenha sido essencial para fotografia e videografia, o que o Google fez ao longo dos anos com o software mostra que, no futuro, os algoritmos serão igualmente importantes e ajudarão a fornecer novas experiências.