A Google Clips foi anunciada em outubro de 2017 e trata-se, basicamente, de uma pequena câmera alimentada por IA (inteligência artificial) projetada para capturar as memórias do dia a dia sem muita intervenção humana. A câmera ainda não está à venda no Brasil, mas alguns detalhes sobre ela chamam atenção, como o fato de a câmera ter sido treinada com a ajuda de verdadeiros fotógrafos profissionais.
A câmera
Diferentemente das câmeras tradicionais, a Google Clips não possui visor e o uso do botão do obturador é totalmente opcional, uma vez que o dispositivo tira fotos automaticamente além de poder fazer vídeos curtos. Usando o aprendizado da máquina para reconhecer e aprender rostos e procurar momentos interessantes para gravar, a Clips reconhece expressões das pessoas, movimentos, iluminação e enquadramento sem necessidade de intervenção do usuário.
Os clipes podem capturar um campo de visão de 130 graus a 15 quadros por segundo. Cada momento de foto de movimento capturado pela Clips dura vários segundos e é chamado de “clipe”. Nenhum áudio fica gravado e cada clipe pode ser salvo como vídeo ou você pode selecionar um único frame para salvar como uma foto de alta resolução auto-aprimorada.
Focando nos pequenos momentos do dia a dia perdidos pela impossibilidade de sacar uma câmera (mesmo que do celular) no momento exato, o Google tenta atingir principalmente pais com filhos pequenos, já que este é o momento onde tudo acontece pela primeira vez em frações de tempo muito curtas.
Durante momentos que podem se sentir preciosos e fugazes, os usuários são atraídos para suas câmeras de smartphone na esperança de capturar e preservar memórias para o futuro deles. Como resultado, muitas vezes acabam visualizando o mundo através de uma pequena tela em vez de interagir usando todos os seus sentidos.
Pensado apenas 60,5 gramas e com uma bateria que pode fazer até 3 horas de capturas, a Clips oferece conexão por WiFi e Bluetooth mas não precisa estar conectada para tirar fotos. Tem 15 FPS e 16 GB de capacidade de armazenamento. Para o Google, é o dispositivo ideal para os usuários aproveitarem mais os momentos de descontração e se preocuparem menos em tirar fotos, já que a câmera inteligente faz isso automaticamente.
Inteligência
O Google adotou a estratégia de “aprendizagem centrada no ser humano” para treinar a Clips. A empresa contratou um fotógrafo documentarista, um fotojornalista e um fotógrafo de artes finas, e então o grupo começou a reunir filmagens dos membros da equipe da Clips tentando responder a pergunta “o que faz um momento memorável?”.
“Nós tínhamos conversas romantismo sobre profundidade de campo, regra de terços, iluminação dramática, cortes, narração de histórias… mas o que eu aprendi é que nunca devemos subestimar a capacidade humana profunda de usar o senso comum”, escreve Josh Lovejoy, designer de Experiência do Usuário da Clips. “Basicamente, estamos tentando ensinar inglês a uma criança de dois anos de idade, lendo Shakespeare em vez de Go, Dog. Go!.”<
A fim de estabelecer e melhorar uma linha de base de qualidade para as fotos, o Google treinou sua IA a encontrar fotos ruins como objetos bloqueando o alvo, imagens embaçadas, fotos de bolsos internos e bolsas, etc. Em seguida, treinaram em coisas como a composição (por exemplo, estabilidade, nitidez e enquadramento), reconhecendo as normas sociais (detecção de deixas e pessoas que consentem em aparecer nas fotos), edição (escolha de fotos especiais em vez de mundanas) e muito mais.
“O sucesso com a Clips não é apenas sobre guardar, eliminar, clicar ou editar (embora sejam importantes), trata-se de autoria, co-aprendizagem e adaptação ao longo do tempo”, diz o Google. “Realmente esperamos que os usuários saiam e usem-na”.
Segurança
Para quem ficou receoso, vale frisar que os clipes que a câmera leva também são armazenados na própria câmera. Eles não tentam sincronizar no seu telefone, a menos que você os solicite, e também são criptografados na câmera, caso você a perca. A Clips também tem uma luz indicadora na frente da câmera que permite que as pessoas saibam quando estão sendo gravadas.
Tudo na Clips acontece localmente, nada é sincronizado com a nuvem do Google exceto as fotos que você salva no Google Fotos. Todo o reconhecimento facial ocorre no dispositivo usando seu próprio poder de processamento. Nada disso é emparelhado com qualquer reconhecimento facial que você possa ter configurado no Google Fotos. Ela não combina rostos com nomes, apenas reconhece os rostos que vê em grupo ao longo do tempo. Ele também tenta ignorar rostos que não reconhece. Então, se você estiver em um parque com seus filhos, a Clips se esforçará para tirar apenas fotos de seus filhos.
Uma das razões pelas quais investimos na Clips foi por causa de quão importante era demonstrar a importância da máquina de preservação de dispositivos e de preservação da informação ao mundo. Uma câmera é um objeto muito pessoal, e nós trabalhamos duro para garantir isso – o hardware, a inteligência e o conteúdo – pertence a você e somente a você. É por isso que tudo – e quero dizer tudo – permanece na câmera até que o usuário diga o contrário.