Olá, pessoal! Tudo bem?
Vi recentemente algumas soluções incríveis aqui na comunidade mostrando como responder automaticamente a mensagens de voz do Instagram usando o ManyChat integrado ao ChatGPT.
Estou tentando montar uma lógica parecida, mas para o WhatsApp.
O desafio que encontrei é que, diferente do Instagram, o WhatsApp não preenche a variável “Última Entrada de Texto” com a URL do áudio quando o usuário envia uma mensagem de voz. Por isso, estou com dificuldades para detectar quando o conteúdo recebido é um áudio, e assim acionar o webhook para transcrever e gerar a resposta via IA.
Já tentei capturar dados com o webhook no n8n, mas o ManyChat não parece enviar nenhuma referência à mídia de áudio nos dados recebidos do WhatsApp.
Alguém da comunidade já conseguiu contornar esse comportamento no WhatsApp? Ou teria alguma sugestão de fluxo alternativo para detectar e tratar esses áudios automaticamente?
Agradeço muito qualquer insight!