As avançadas capacidades de previsão visual do ChatGPT podem estar próximas de se tornarem realidade em breve, de acordo com algumas observações perspicazes.
A Autoridade Android identificou certas instruções de programação no Modo de Voz Avançada da versão beta mais recente do ChatGPT v1.2024.317, indicando a presença de uma funcionalidade denominada “Câmera viva”. Essas instruções alertam os usuários a não utilizar a câmera ao vivo para atividades que possam impactar sua saúde ou segurança.
Outra parte do código parece indicar como utilizar os recursos de visão, mencionando que é necessário tocar no ícone da câmera para permitir que o ChatGPT identifique e discuta sobre o que está ao seu redor.
A evolução do ChatGPT em termos de capacidades: Visão, voz e mais além.
O destaque do evento OpenAI em maio passado foi a capacidade do ChatGPT de processar informações visuais, apresentando o lançamento do GPT-4o. Durante as demonstrações do evento, foi mostrado como o GPT-4o pode utilizar uma câmera móvel ou de computador para reconhecer objetos e recordar detalhes visuais. Uma demonstração especial incluiu o GPT-4o identificando um cachorro brincando com uma bola de tênis e lembrando que o nome dele é “Bowser”.
Após a divulgação do Evento de IA Aberta e da disponibilização antecipada para alguns testadores alfa, houve poucas informações sobre o GPT-4 com visão. Enquanto isso, em setembro, a OpenAI lançou o Modo de Voz Avançada para usuários do ChatGPT Plus e da equipe.
Se a visão do ChatGPT está prestes a se tornar realidade, conforme indicado no código, os usuários em breve poderão experimentar os dois componentes do novo GPT-4 que foram anunciados na primavera passada.
O OpenAI tem estado ativo recentemente, apesar de alguns relatos de redução nos resultados obtidos com modelos futuros. Recentemente, introduziu o ChatGPT Search, que permite que o modelo de IA acesse informações em tempo real na web. Há também rumores de que a empresa esteja desenvolvendo um agente capaz de realizar tarefas complexas em nome do usuário, como programar e navegar na internet, possivelmente para ser lançado em janeiro.
Empresa OpenAI
Deixe uma resposta