O Google está desenvolvendo uma inteligência artificial (IA) capaz de entender o contexto de registros salvos no Google Fotos. Batizado como "Project Ellman", o modelo seria capaz de compreender o conteúdo de uma imagem com base nos rostos e nas pessoas contidas nas capturas.
O modelo seria capaz de puxar o contexto usando biografias, registros mais antigos ou mais novos, para entender o que se passa em cada uma das fotos e descrever o cenário. Na prática, o Projeto Ellman teria a capacidade de determinar se uma imagem representa uma reunião de ex-colegas de faculdade, um encontro romântico, a faixa etária dos participantes, e até mesmo inferir as narrativas por trás da captura. Mesmo capturas de tela poderiam ser analisadas pela inteligência artificial, que buscaria compreender a razão por trás do registro.
Conforme relatado pela fonte do CNBC, o Google teria reconhecido que modelos multimodais são particularmente adequados para uma ferramenta desse tipo. A empresa apresentaria essa inovação como um chatbot que possui conhecimento abrangente sobre a vida do usuário, atuando como um assistente virtual pessoal.
Em um dos slides apresentados, o chatbot conseguiu identificar as preferências alimentares, viagens planejadas e interesses do usuário com base nas mídias armazenadas no celular. Além disso, o chatbot teria a capacidade de reconhecer sites, aplicativos e redes sociais preferidos através de capturas de tela.
• Pix Automático: Revolucionando Pagamentos Recorrentes com Praticidade e Segurança

Project Ellman está em testes no Google
Por enquanto, o Project Ellman estaria passando por testes internos pelo time do Google Fotos.
"O Google Fotos sempre usou IA para ajudar as pessoas a pesquisar suas fotos e vídeos, e estamos entusiasmados com o potencial dos LLMs para desbloquear experiências ainda mais úteis. Esta foi uma exploração interna inicial e, como sempre, se decidirmos lançar novos recursos, dedicaremos o tempo necessário para garantir que sejam úteis para as pessoas e projetados para proteger a privacidade e a segurança dos usuários como nossa principal prioridade", disse um porta-voz ao site.
Considerando que o Google adota um ritmo mais lento para o lançamento de ferramentas com IA, é possível que o desenvolvimento do "Project Ellman" ainda demore para ser concluído. De qualquer forma, a revelação mostra um potencial interessantíssimo para modelos multimodais.
• Google lança Gemini, plataforma de IA generativa para competir com GPT
Possíveis usos do Project Ellman
O Project Ellman tem o potencial de revolucionar a forma como interagimos com nossas fotos e vídeos. Com essa tecnologia, poderíamos criar ferramentas que nos ajudem a lembrar de momentos importantes, a organizar nossas mídias e até mesmo a encontrar novas formas de expressão criativa.
Aqui estão alguns possíveis usos do Project Ellman:
· Relembrando momentos importantes: O Project Ellman poderia ser usado para criar ferramentas que nos ajudem a lembrar de momentos importantes de nossas vidas. Por exemplo, uma ferramenta poderia nos lembrar do aniversário de um amigo ou de uma viagem que fizemos.
· Organizando mídias: O Project Ellman também poderia ser usado para organizar nossas mídias. Por exemplo, uma ferramenta poderia nos ajudar a criar álbuns de fotos por tema ou por ano.
· Encontrando novas formas de expressão criativa: O Project Ellman poderia nos ajudar a encontrar novas formas de expressão criativa. Por exemplo, uma ferramenta poderia nos sugerir ideias para novas fotos ou vídeos.
Naturalmente, é importante considerar os potenciais riscos de uma tecnologia como o Project Ellman. Por exemplo, a tecnologia poderia ser usada para coletar dados pessoais dos usuários ou para criar deepfakes. É importante que o Google tome medidas para proteger a privacidade e a segurança dos usuários ao desenvolver essa tecnologia.
Apesar dos riscos, o Project Ellman tem o potencial de ser uma ferramenta poderosa e transformadora.