O ChatGPT’s Advanced Voice Mode may soon feature a new ‘Live Camera’ function.

As avançadas capacidades de previsão visual do ChatGPT podem estar próximas de se tornarem realidade em breve, de acordo com algumas observações perspicazes.

A Autoridade Android identificou certas instruções de programação no Modo de Voz Avançada da versão beta mais recente do ChatGPT v1.2024.317, indicando a presença de uma funcionalidade denominada “Câmera viva”. Essas instruções alertam os usuários a não utilizar a câmera ao vivo para atividades que possam impactar sua saúde ou segurança.

Outra parte do código parece indicar como utilizar os recursos de visão, mencionando que é necessário tocar no ícone da câmera para permitir que o ChatGPT identifique e discuta sobre o que está ao seu redor.

A evolução do ChatGPT em termos de capacidades: Visão, voz e mais além.

O destaque do evento OpenAI em maio passado foi a capacidade do ChatGPT de processar informações visuais, apresentando o lançamento do GPT-4o. Durante as demonstrações do evento, foi mostrado como o GPT-4o pode utilizar uma câmera móvel ou de computador para reconhecer objetos e recordar detalhes visuais. Uma demonstração especial incluiu o GPT-4o identificando um cachorro brincando com uma bola de tênis e lembrando que o nome dele é “Bowser”.

Após a divulgação do Evento de IA Aberta e da disponibilização antecipada para alguns testadores alfa, houve poucas informações sobre o GPT-4 com visão. Enquanto isso, em setembro, a OpenAI lançou o Modo de Voz Avançada para usuários do ChatGPT Plus e da equipe.

Se a visão do ChatGPT está prestes a se tornar realidade, conforme indicado no código, os usuários em breve poderão experimentar os dois componentes do novo GPT-4 que foram anunciados na primavera passada.

O OpenAI tem estado ativo recentemente, apesar de alguns relatos de redução nos resultados obtidos com modelos futuros. Recentemente, introduziu o ChatGPT Search, que permite que o modelo de IA acesse informações em tempo real na web. Há também rumores de que a empresa esteja desenvolvendo um agente capaz de realizar tarefas complexas em nome do usuário, como programar e navegar na internet, possivelmente para ser lançado em janeiro.

ARTIGO:  Elon Musk está processando o Twitch, que pertence à Amazon, por causa da falta de anúncios na plataforma.

Empresa OpenAI