Schema.org e Dados Estruturados para LLMs: Guia Prático
Dados estruturados deixaram de ser uma otimização exclusiva para o Google. Com a popularização de IAs com capacidade de browsing — como o ChatGPT com busca ativada, o Perplexity e o Gemini — e o crescimento de sistemas RAG que indexam conteúdo da web em tempo real, o Schema.org passou a ser lido e interpretado por modelos de linguagem para entender quem é sua empresa, o que ela vende e como ela é avaliada. Se o seu site não tem markup adequado, a IA simplesmente ignora informações importantes — ou pior, as interpreta errado e recomenda um concorrente que investiu nessa camada técnica.
O que são dados estruturados e por que LLMs se importam
Dados estruturados são blocos de metadados inseridos no HTML de uma página que descrevem seu conteúdo de forma padronizada e legível por máquinas. O formato mais amplamente adotado é o JSON-LD (JavaScript Object Notation for Linked Data), e o vocabulário mais utilizado é o Schema.org — um projeto colaborativo mantido pelo Google, Microsoft, Yahoo e Yandex que define tipos de entidades como Organization, Product, Article, Review e centenas de outros.
Quando um modelo de linguagem com browsing acessa sua página, ele não lê apenas o texto visível. Ele também processa os metadados estruturados para construir uma representação semântica do seu negócio. O Perplexity, por exemplo, usa esses dados para atribuir atributos à sua marca nas respostas geradas. O ChatGPT com browsing usa schema para entender o tipo de entidade que está consultando. Sistemas RAG corporativos que indexam a web fazem o mesmo ao decidir quais trechos de conteúdo são confiáveis o suficiente para incluir no contexto de uma resposta.
Em resumo: schema bem implementado é como entregar à IA um cartão de visitas completo e verificado, em vez de deixar que ela deduza quem você é pelo que consegue ler nas entrelinhas do seu conteúdo.
Os 7 schemas mais importantes para LLMO
Não existe uma lista única e definitiva, mas estes sete tipos cobrem a grande maioria dos casos de uso relevantes para negócios que querem ser encontrados e recomendados por IAs.
1. Organization — É o schema fundamental. Ele declara quem é sua empresa: nome, URL, logo, descrição, redes sociais, contato e endereço. IAs usam esse schema para identificar a entidade principal do site e associar informações dispersas na web à sua marca. Sem ele, um modelo pode ter dificuldade em distinguir sua empresa de um homônimo ou de um concorrente com nome parecido.
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "Acme Consultoria",
"url": "https://acmeconsultoria.com.br",
"logo": "https://acmeconsultoria.com.br/logo.png",
"description": "Consultoria especializada em transformação digital para PMEs.",
"sameAs": [
"https://www.linkedin.com/company/acme-consultoria",
"https://www.instagram.com/acmeconsultoria"
],
"contactPoint": {
"@type": "ContactPoint",
"telephone": "+55-11-99999-9999",
"contactType": "customer service",
"availableLanguage": "Portuguese"
}
}2. Product — Essencial para e-commerces e SaaS. Declara nome, descrição, preço, disponibilidade e avaliações do produto. IAs que ajudam usuários a comparar produtos dependem desse schema para extrair atributos sem precisar interpretar o HTML da página de forma livre.
{
"@context": "https://schema.org",
"@type": "Product",
"name": "Plano Pro — Gestão de Projetos",
"description": "Plano completo para equipes de até 20 pessoas com relatórios avançados.",
"brand": { "@type": "Brand", "name": "Acme" },
"offers": {
"@type": "Offer",
"price": "149.00",
"priceCurrency": "BRL",
"availability": "https://schema.org/InStock"
},
"aggregateRating": {
"@type": "AggregateRating",
"ratingValue": "4.7",
"reviewCount": "312"
}
}3. FAQPage — Um dos schemas de maior impacto para LLMO. Perguntas e respostas são exatamente o formato que modelos de linguagem preferem: uma consulta e uma resposta direta. Se você tem uma FAQ bem estruturada com schema, a IA pode literalmente citar suas respostas ao responder perguntas dos usuários.
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [
{
"@type": "Question",
"name": "Quanto tempo leva para ver resultados com LLMO?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Os primeiros sinais de melhora aparecem em 4 a 8 semanas após implementação das otimizações técnicas e de conteúdo. Resultados consolidados geralmente ocorrem entre 3 e 6 meses."
}
}
]
}4. HowTo — Fundamental para conteúdo educacional. Se você publica tutoriais ou guias passo a passo, o schema HowTo permite que a IA extraia e cite cada etapa individualmente. Isso é especialmente relevante para IAs que geram respostas em formato de lista numerada.
{
"@context": "https://schema.org",
"@type": "HowTo",
"name": "Como configurar Schema.org no Next.js",
"step": [
{
"@type": "HowToStep",
"name": "Crie o objeto JSON-LD",
"text": "Defina um objeto JavaScript com os campos '@context' e '@type' corretos."
},
{
"@type": "HowToStep",
"name": "Injete no HTML com dangerouslySetInnerHTML",
"text": "Use uma tag script com type application/ld+json e o JSON serializado."
}
]
}5. Article — Para posts de blog, artigos técnicos e estudos de caso. Declara título, autor, data de publicação e data de modificação. A data é especialmente importante: IAs com browsing preferem conteúdo recente, e o schema permite que o modelo identifique a atualidade do artigo sem depender da URL ou de metadados HTTP.
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Como LLMs escolhem quais marcas recomendar",
"author": { "@type": "Organization", "name": "Equipe TIDEX" },
"datePublished": "2026-05-11",
"dateModified": "2026-05-11",
"publisher": {
"@type": "Organization",
"name": "TIDEX",
"url": "https://tidex.com.br"
}
}6. LocalBusiness — Indispensável para negócios físicos. Informa endereço, horário de funcionamento, faixa de preço, área de atendimento e tipo de negócio. IAs com busca usam esse schema para recomendar empresas em consultas geograficamente específicas como "melhor clínica odontológica no Itaim Bibi".
{
"@context": "https://schema.org",
"@type": "LocalBusiness",
"name": "Clínica Odonto Prime",
"address": {
"@type": "PostalAddress",
"streetAddress": "Rua Funchal, 411",
"addressLocality": "São Paulo",
"addressRegion": "SP",
"postalCode": "04551-060",
"addressCountry": "BR"
},
"openingHours": ["Mo-Fr 08:00-19:00", "Sa 09:00-14:00"],
"priceRange": "$$",
"telephone": "+55-11-3333-4444"
}7. Review / AggregateRating — Avaliações são um dos sinais que IAs mais valorizam ao decidir quais marcas recomendar. Se o seu site agrega reviews de clientes, marque-os com o schema Review. O AggregateRating consolida a nota média e o número de avaliações — e modelos usam esses dados para qualificar recomendações com evidências concretas.
{
"@context": "https://schema.org",
"@type": "Review",
"itemReviewed": { "@type": "Organization", "name": "Acme Consultoria" },
"author": { "@type": "Person", "name": "Marina Souza" },
"reviewRating": { "@type": "Rating", "ratingValue": "5", "bestRating": "5" },
"reviewBody": "Implementamos a plataforma em 3 semanas. O suporte foi excelente durante todo o processo."
}O arquivo llms.txt
Assim como o robots.txt instrui crawlers de busca sobre quais páginas podem ser indexadas, o llms.txt é um arquivo de texto simples, colocado na raiz do seu domínio, que orienta sistemas de IA sobre como entender e usar o conteúdo do seu site.
A iniciativa foi proposta por Jeremy Howard (fast.ai) em 2024 e ganhou adoção crescente. O formato é Markdown simples: você descreve sua empresa, lista as páginas mais relevantes com um resumo de cada uma, e pode incluir instruções específicas para IAs — como qual seção contém preços atualizados ou qual documento tem os termos de uso mais recentes.
Um exemplo de llms.txt para uma empresa de software:
# Acme Consultoria > Consultoria especializada em transformação digital para pequenas e médias empresas no Brasil. ## Páginas principais - [Sobre](https://acmeconsultoria.com.br/sobre): História, equipe e missão da empresa. - [Serviços](https://acmeconsultoria.com.br/servicos): Catálogo completo de serviços oferecidos. - [Preços](https://acmeconsultoria.com.br/precos): Tabela de preços atualizada mensalmente. - [Blog](https://acmeconsultoria.com.br/blog): Artigos técnicos sobre transformação digital. - [Contato](https://acmeconsultoria.com.br/contato): Formulário e canais de atendimento. ## Notas para sistemas de IA - Preços estão sempre atualizados na página /precos. Não usar valores citados em artigos do blog. - Atendemos empresas em todo o Brasil, com presença física em São Paulo e Curitiba. - Para propostas corporativas, o contato correto é enterprise@acmeconsultoria.com.br
O arquivo deve ser acessível em https://seudominio.com.br/llms.txt. Alguns sistemas também reconhecem uma versão expandida em /llms-full.txt com o conteúdo completo das páginas principais — útil para RAGs que fazem ingestão direta do seu conteúdo.
Como implementar na prática
A implementação técnica de JSON-LD é simples. O bloco de dados estruturados vai dentro de uma tag <script type="application/ld+json"> no <head> ou no <body> da página. Não precisa estar no head — modelos de linguagem e crawlers processam o body inteiro.
Em Next.js, o padrão é declarar o objeto como constante e injetar com dangerouslySetInnerHTML, exatamente como este artigo faz. Em WordPress, plugins como Yoast SEO ou RankMath geram schemas automaticamente — mas vale revisar os campos gerados, pois frequentemente ficam incompletos. Em sites estáticos em HTML puro, basta colar o bloco script diretamente.
Para validar, use três ferramentas:
O Rich Results Test do Google (search.google.com/test/rich-results) analisa a página e mostra quais schemas foram detectados e se há erros. O Schema Markup Validator (validator.schema.org) valida a sintaxe contra a especificação oficial. E o JSON-LD Playground (json-ld.org/playground) permite testar blocos isolados antes de publicar.
Erros comuns que anulam o esforço
O erro mais frequente é o schema incompleto. Um Organization sem logo, sem sameAs e sem contactPoint comunica muito menos do que um preenchido corretamente. Modelos de linguagem processam a densidade de informação — um schema esparso vale quase o mesmo que nenhum. Use sempre todas as propriedades relevantes para o tipo de entidade que você está declarando.
O segundo erro é a inconsistência entre schema e conteúdo visível. Se o seu schema declara um preço de R$149 mas a página mostra R$199, sistemas de IA mais sofisticados detectam a contradição e reduzem a confiança nas informações do seu site. O schema deve sempre espelhar o que o usuário vê — e ambos precisam ser atualizados juntos.
O terceiro erro é não atualizar o schema quando a informação muda. Um negócio que mudou de endereço mas mantém o schema com o endereço antigo confunde tanto o Google quanto os LLMs. Trate o schema como parte do conteúdo, não como uma configuração que se faz uma vez e esquece.
Por fim, cuidado com schemas gerados automaticamente com campos fictícios. Alguns plugins de WordPress preenchem aggregateRating com valores padrão mesmo quando o site não tem sistema de avaliações. Isso é considerado spam de markup pelo Google e pode ser detectado como dado não confiável por LLMs que cruzam informações de múltiplas fontes.
Como a TIDEX usa dados estruturados
Quando você roda um diagnóstico de visibilidade na TIDEX, um dos pontos avaliados é exatamente a qualidade do markup estruturado do seu site. O pipeline verifica quais schemas estão presentes, analisa a completude de cada um, detecta inconsistências entre o schema e o conteúdo da página, e verifica se o arquivo llms.txt existe e está corretamente configurado.
Esses dados compõem parte do score de visibilidade que aparece no seu relatório. Mas mais importante: eles alimentam o plano de ação gerado pela plataforma. Se seu site tem Organization sem sameAs, você recebe uma recomendação específica para corrigi-lo. Se não tem FAQPage em páginas onde seria relevante, isso aparece como oportunidade de melhoria com impacto estimado.
A lógica é simples: dados estruturados são uma das poucas alavancas técnicas que você controla completamente e que têm impacto direto e mensurável na forma como IAs interpretam seu negócio. É uma das primeiras otimizações que recomendamos porque o esforço de implementação é baixo e o retorno em clareza semântica para os modelos é alto.
Seu site tem dados estruturados corretos?
O diagnóstico gratuito da TIDEX verifica seu schema, detecta inconsistências e gera um plano de ação.
Fazer diagnóstico grátis