← Voltar ao blog
Equipe TIDEX11 Mai 202610 min de leitura

Schema.org e Dados Estruturados para LLMs: Guia Prático

Dados estruturados deixaram de ser uma otimização exclusiva para o Google. Com a popularização de IAs com capacidade de browsing — como o ChatGPT com busca ativada, o Perplexity e o Gemini — e o crescimento de sistemas RAG que indexam conteúdo da web em tempo real, o Schema.org passou a ser lido e interpretado por modelos de linguagem para entender quem é sua empresa, o que ela vende e como ela é avaliada. Se o seu site não tem markup adequado, a IA simplesmente ignora informações importantes — ou pior, as interpreta errado e recomenda um concorrente que investiu nessa camada técnica.

O que são dados estruturados e por que LLMs se importam

Dados estruturados são blocos de metadados inseridos no HTML de uma página que descrevem seu conteúdo de forma padronizada e legível por máquinas. O formato mais amplamente adotado é o JSON-LD (JavaScript Object Notation for Linked Data), e o vocabulário mais utilizado é o Schema.org — um projeto colaborativo mantido pelo Google, Microsoft, Yahoo e Yandex que define tipos de entidades como Organization, Product, Article, Review e centenas de outros.

Quando um modelo de linguagem com browsing acessa sua página, ele não lê apenas o texto visível. Ele também processa os metadados estruturados para construir uma representação semântica do seu negócio. O Perplexity, por exemplo, usa esses dados para atribuir atributos à sua marca nas respostas geradas. O ChatGPT com browsing usa schema para entender o tipo de entidade que está consultando. Sistemas RAG corporativos que indexam a web fazem o mesmo ao decidir quais trechos de conteúdo são confiáveis o suficiente para incluir no contexto de uma resposta.

Em resumo: schema bem implementado é como entregar à IA um cartão de visitas completo e verificado, em vez de deixar que ela deduza quem você é pelo que consegue ler nas entrelinhas do seu conteúdo.

Os 7 schemas mais importantes para LLMO

Não existe uma lista única e definitiva, mas estes sete tipos cobrem a grande maioria dos casos de uso relevantes para negócios que querem ser encontrados e recomendados por IAs.

1. Organization — É o schema fundamental. Ele declara quem é sua empresa: nome, URL, logo, descrição, redes sociais, contato e endereço. IAs usam esse schema para identificar a entidade principal do site e associar informações dispersas na web à sua marca. Sem ele, um modelo pode ter dificuldade em distinguir sua empresa de um homônimo ou de um concorrente com nome parecido.

{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "Acme Consultoria",
  "url": "https://acmeconsultoria.com.br",
  "logo": "https://acmeconsultoria.com.br/logo.png",
  "description": "Consultoria especializada em transformação digital para PMEs.",
  "sameAs": [
    "https://www.linkedin.com/company/acme-consultoria",
    "https://www.instagram.com/acmeconsultoria"
  ],
  "contactPoint": {
    "@type": "ContactPoint",
    "telephone": "+55-11-99999-9999",
    "contactType": "customer service",
    "availableLanguage": "Portuguese"
  }
}

2. Product — Essencial para e-commerces e SaaS. Declara nome, descrição, preço, disponibilidade e avaliações do produto. IAs que ajudam usuários a comparar produtos dependem desse schema para extrair atributos sem precisar interpretar o HTML da página de forma livre.

{
  "@context": "https://schema.org",
  "@type": "Product",
  "name": "Plano Pro — Gestão de Projetos",
  "description": "Plano completo para equipes de até 20 pessoas com relatórios avançados.",
  "brand": { "@type": "Brand", "name": "Acme" },
  "offers": {
    "@type": "Offer",
    "price": "149.00",
    "priceCurrency": "BRL",
    "availability": "https://schema.org/InStock"
  },
  "aggregateRating": {
    "@type": "AggregateRating",
    "ratingValue": "4.7",
    "reviewCount": "312"
  }
}

3. FAQPage — Um dos schemas de maior impacto para LLMO. Perguntas e respostas são exatamente o formato que modelos de linguagem preferem: uma consulta e uma resposta direta. Se você tem uma FAQ bem estruturada com schema, a IA pode literalmente citar suas respostas ao responder perguntas dos usuários.

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "Quanto tempo leva para ver resultados com LLMO?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "Os primeiros sinais de melhora aparecem em 4 a 8 semanas após implementação das otimizações técnicas e de conteúdo. Resultados consolidados geralmente ocorrem entre 3 e 6 meses."
      }
    }
  ]
}

4. HowTo — Fundamental para conteúdo educacional. Se você publica tutoriais ou guias passo a passo, o schema HowTo permite que a IA extraia e cite cada etapa individualmente. Isso é especialmente relevante para IAs que geram respostas em formato de lista numerada.

{
  "@context": "https://schema.org",
  "@type": "HowTo",
  "name": "Como configurar Schema.org no Next.js",
  "step": [
    {
      "@type": "HowToStep",
      "name": "Crie o objeto JSON-LD",
      "text": "Defina um objeto JavaScript com os campos '@context' e '@type' corretos."
    },
    {
      "@type": "HowToStep",
      "name": "Injete no HTML com dangerouslySetInnerHTML",
      "text": "Use uma tag script com type application/ld+json e o JSON serializado."
    }
  ]
}

5. Article — Para posts de blog, artigos técnicos e estudos de caso. Declara título, autor, data de publicação e data de modificação. A data é especialmente importante: IAs com browsing preferem conteúdo recente, e o schema permite que o modelo identifique a atualidade do artigo sem depender da URL ou de metadados HTTP.

{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "Como LLMs escolhem quais marcas recomendar",
  "author": { "@type": "Organization", "name": "Equipe TIDEX" },
  "datePublished": "2026-05-11",
  "dateModified": "2026-05-11",
  "publisher": {
    "@type": "Organization",
    "name": "TIDEX",
    "url": "https://tidex.com.br"
  }
}

6. LocalBusiness — Indispensável para negócios físicos. Informa endereço, horário de funcionamento, faixa de preço, área de atendimento e tipo de negócio. IAs com busca usam esse schema para recomendar empresas em consultas geograficamente específicas como "melhor clínica odontológica no Itaim Bibi".

{
  "@context": "https://schema.org",
  "@type": "LocalBusiness",
  "name": "Clínica Odonto Prime",
  "address": {
    "@type": "PostalAddress",
    "streetAddress": "Rua Funchal, 411",
    "addressLocality": "São Paulo",
    "addressRegion": "SP",
    "postalCode": "04551-060",
    "addressCountry": "BR"
  },
  "openingHours": ["Mo-Fr 08:00-19:00", "Sa 09:00-14:00"],
  "priceRange": "$$",
  "telephone": "+55-11-3333-4444"
}

7. Review / AggregateRating — Avaliações são um dos sinais que IAs mais valorizam ao decidir quais marcas recomendar. Se o seu site agrega reviews de clientes, marque-os com o schema Review. O AggregateRating consolida a nota média e o número de avaliações — e modelos usam esses dados para qualificar recomendações com evidências concretas.

{
  "@context": "https://schema.org",
  "@type": "Review",
  "itemReviewed": { "@type": "Organization", "name": "Acme Consultoria" },
  "author": { "@type": "Person", "name": "Marina Souza" },
  "reviewRating": { "@type": "Rating", "ratingValue": "5", "bestRating": "5" },
  "reviewBody": "Implementamos a plataforma em 3 semanas. O suporte foi excelente durante todo o processo."
}

O arquivo llms.txt

Assim como o robots.txt instrui crawlers de busca sobre quais páginas podem ser indexadas, o llms.txt é um arquivo de texto simples, colocado na raiz do seu domínio, que orienta sistemas de IA sobre como entender e usar o conteúdo do seu site.

A iniciativa foi proposta por Jeremy Howard (fast.ai) em 2024 e ganhou adoção crescente. O formato é Markdown simples: você descreve sua empresa, lista as páginas mais relevantes com um resumo de cada uma, e pode incluir instruções específicas para IAs — como qual seção contém preços atualizados ou qual documento tem os termos de uso mais recentes.

Um exemplo de llms.txt para uma empresa de software:

# Acme Consultoria

> Consultoria especializada em transformação digital para pequenas e médias empresas no Brasil.

## Páginas principais

- [Sobre](https://acmeconsultoria.com.br/sobre): História, equipe e missão da empresa.
- [Serviços](https://acmeconsultoria.com.br/servicos): Catálogo completo de serviços oferecidos.
- [Preços](https://acmeconsultoria.com.br/precos): Tabela de preços atualizada mensalmente.
- [Blog](https://acmeconsultoria.com.br/blog): Artigos técnicos sobre transformação digital.
- [Contato](https://acmeconsultoria.com.br/contato): Formulário e canais de atendimento.

## Notas para sistemas de IA

- Preços estão sempre atualizados na página /precos. Não usar valores citados em artigos do blog.
- Atendemos empresas em todo o Brasil, com presença física em São Paulo e Curitiba.
- Para propostas corporativas, o contato correto é enterprise@acmeconsultoria.com.br

O arquivo deve ser acessível em https://seudominio.com.br/llms.txt. Alguns sistemas também reconhecem uma versão expandida em /llms-full.txt com o conteúdo completo das páginas principais — útil para RAGs que fazem ingestão direta do seu conteúdo.

Como implementar na prática

A implementação técnica de JSON-LD é simples. O bloco de dados estruturados vai dentro de uma tag <script type="application/ld+json"> no <head> ou no <body> da página. Não precisa estar no head — modelos de linguagem e crawlers processam o body inteiro.

Em Next.js, o padrão é declarar o objeto como constante e injetar com dangerouslySetInnerHTML, exatamente como este artigo faz. Em WordPress, plugins como Yoast SEO ou RankMath geram schemas automaticamente — mas vale revisar os campos gerados, pois frequentemente ficam incompletos. Em sites estáticos em HTML puro, basta colar o bloco script diretamente.

Para validar, use três ferramentas:

O Rich Results Test do Google (search.google.com/test/rich-results) analisa a página e mostra quais schemas foram detectados e se há erros. O Schema Markup Validator (validator.schema.org) valida a sintaxe contra a especificação oficial. E o JSON-LD Playground (json-ld.org/playground) permite testar blocos isolados antes de publicar.

Erros comuns que anulam o esforço

O erro mais frequente é o schema incompleto. Um Organization sem logo, sem sameAs e sem contactPoint comunica muito menos do que um preenchido corretamente. Modelos de linguagem processam a densidade de informação — um schema esparso vale quase o mesmo que nenhum. Use sempre todas as propriedades relevantes para o tipo de entidade que você está declarando.

O segundo erro é a inconsistência entre schema e conteúdo visível. Se o seu schema declara um preço de R$149 mas a página mostra R$199, sistemas de IA mais sofisticados detectam a contradição e reduzem a confiança nas informações do seu site. O schema deve sempre espelhar o que o usuário vê — e ambos precisam ser atualizados juntos.

O terceiro erro é não atualizar o schema quando a informação muda. Um negócio que mudou de endereço mas mantém o schema com o endereço antigo confunde tanto o Google quanto os LLMs. Trate o schema como parte do conteúdo, não como uma configuração que se faz uma vez e esquece.

Por fim, cuidado com schemas gerados automaticamente com campos fictícios. Alguns plugins de WordPress preenchem aggregateRating com valores padrão mesmo quando o site não tem sistema de avaliações. Isso é considerado spam de markup pelo Google e pode ser detectado como dado não confiável por LLMs que cruzam informações de múltiplas fontes.

Como a TIDEX usa dados estruturados

Quando você roda um diagnóstico de visibilidade na TIDEX, um dos pontos avaliados é exatamente a qualidade do markup estruturado do seu site. O pipeline verifica quais schemas estão presentes, analisa a completude de cada um, detecta inconsistências entre o schema e o conteúdo da página, e verifica se o arquivo llms.txt existe e está corretamente configurado.

Esses dados compõem parte do score de visibilidade que aparece no seu relatório. Mas mais importante: eles alimentam o plano de ação gerado pela plataforma. Se seu site tem Organization sem sameAs, você recebe uma recomendação específica para corrigi-lo. Se não tem FAQPage em páginas onde seria relevante, isso aparece como oportunidade de melhoria com impacto estimado.

A lógica é simples: dados estruturados são uma das poucas alavancas técnicas que você controla completamente e que têm impacto direto e mensurável na forma como IAs interpretam seu negócio. É uma das primeiras otimizações que recomendamos porque o esforço de implementação é baixo e o retorno em clareza semântica para os modelos é alto.

Seu site tem dados estruturados corretos?

O diagnóstico gratuito da TIDEX verifica seu schema, detecta inconsistências e gera um plano de ação.

Fazer diagnóstico grátis