// pesquisa em andamento · ICMC/USP · 2026

ghostprod.io

Agent-Readiness Score · PDPs · E-commerce BR

v0.1 BETA MIT BRASIL ICMC/USP

Visível para humanos.
Invisível para agentes.

A nova fronteira do e-commerce não é o SEO tradicional. É a otimização para Inteligência Artificial.

A descoberta de produtos mudou. Motores de busca estão dando lugar a agentes generativos que leem, interpretam e decidem o que recomendar. O Ghostprod audita a invisibilidade semântica do seu catálogo para garantir que ele seja a primeira escolha dos LLMs.

em breve
Visitar Repositório GitHub

A inteligência de dados aplicada a negócios exige mais do que atrair tráfego; exige garantir o posicionamento nos novos ecossistemas de IA. Hoje, agentes como ChatGPT e Gemini decidem quais produtos comparar baseados puramente na densidade de dados estruturados e na performance técnica da sua página. Performance técnica ruim, Schema.org ausente e descrições sem atributos verificáveis tornam uma PDP semanticamente invisível. O produto existe no seu servidor, mas para o modelo de linguagem que vai recomendar a compra, ele simplesmente não existe.

6,1M visitas de referência do ChatGPT aos 10 maiores e-commerces BR Cadastra + Similarweb · nov. 2025
302% crescimento de tráfego de IA para e-commerce em 2025 Alhena.ai · 2025
Brasil é o 3º maior mercado de IA generativa do mundo Cadastra + Similarweb · nov. 2025
99% market share do ChatGPT entre ferramentas generativas no Brasil Cadastra + Similarweb · nov. 2025

Análise rodada ao vivo em 27/03/2026 · Pipeline Python + Playwright + CrUX API + spaCy · @naturaoficial — dados públicos, PDPs abertas

→ https://www.natura.com.br/p/serum-intensivo-multiclareador-chronos-derma-30-ml/NATBRA-169222

53 ⚠ Em risco
CrUX Field 0/100

Threshold não atingido

PageSpeed Lab 43/100

4 métricas Lighthouse

Schema.org 84/100

10/16 campos presentes

Conteúdo NLP 97/100

60 atributos técnicos

Diagnóstico: a Natura tem conteúdo rico e Schema presente — mas a URL específica da PDP não atinge o threshold mínimo de tráfego para gerar dados na CrUX API do Google. Esse é um achado metodológico real: a cobertura da CrUX em PDPs individuais é uma variável relevante para o modelo.

A invisibilidade não se resolve com achismos, mas com orquestração de dados. O motor do Ghostprod executa um pipeline determinístico que cruza dados de campo reais (CrUX) com testes sintéticos em tempo real, validação de JSON-LD e processamento de linguagem natural (NLP). É a engenharia traduzindo o caos do código em inteligência acionável.

AGENTE 01

CrUX Field Data

Dados de campo reais via Chrome UX Report API. Percentil p75 de LCP, INP, CLS e TTFB.

CrUX API Python p75

AGENTE 02

PageSpeed Lab

4 scores do Lighthouse (Performance, Accessibility, Best Practices, SEO) via PageSpeed Insights API.

PageSpeed API Lighthouse Lab Data

AGENTE 03

Schema.org

Playwright renderiza a PDP com Chromium headless — resolve CSR e VTEX IO. Extrai e avalia completude do JSON-LD.

Playwright BeautifulSoup JSON-LD

AGENTE 04

Conteúdo NLP

Mede densidade de atributos técnicos verificáveis vs. marketing gloss. Modelo em português.

spaCy pt NLP regex

AGENTE 05

Gap Analysis

Simula o raciocínio de um agente real. Responde: com esses dados, esse produto seria recomendado para "sérum para pele oleosa"?

Claude API FastAPI Python

COMO É CALCULADO?

O Agent-Readiness Score combina três variáveis técnicas em um número de 0 a 100.
Os pesos são o que a pesquisa está descobrindo.
Isso é a tese.

quer saber mais? fala comigo →

Tese · ICMC/USP

MBA em Ciência de Dados. Hipótese: as três variáveis têm pesos diferentes na predição de invisibilidade semântica para agentes de Level 1. O ghostprod é o instrumento de coleta de dados. Modelo: regressão logística + SHAP values.

Série Substack

Agentic Commerce — artigos com dados originais sobre como agentes de IA leem o e-commerce brasileiro. Dois artigos publicados. Cada publicação tem dado verificável, hipótese testável ou experimento replicável.

Dado de campo

CrUX API confirma: a maioria das PDPs individuais não atinge o threshold mínimo de tráfego Chrome para gerar dados de campo. Isso é uma limitação metodológica real — e um ponto cego de todos os concorrentes que usam CrUX.

Eva De Paula

// Senior Lead PM · Orquestradora · Curiosa

7+ anos liderando produtos digitais e dados na América Latina. Com uma base técnica sólida (MBA em Eng. de Software e especialização em Data Intelligence), possui experiência profunda trabalhando com a plataforma VTEX e grandes operações de varejo. Construiu pipelines complexos de dados — cruzando CrUX API, BigQuery e Looker Studio — para monitorar a performance de PDPs em múltiplos países simultaneamente. Identificou a migração do tráfego de busca para agentes de IA muito antes de virar tendência e, hoje, transforma essa visão em pesquisa de fronteira na USP e em produto real.

FEITO COM CARINHO POR

💜 Eva Bettina 🧠 Senior PM · Orquestradora · Curiosa
🤍 Claude (Anthropic) — Arquitetura · Código · Documentação
💙 Gemini (Google) — Gap Analysis · UI Prototyping
🩵 AI Studio (Google) — Frontend vaporwave
💜 Opal (Google Labs) — Prototipagem visual

"A melhor stack é a que resolve o problema — com ou sem framework."