Usando IA para Desembaraçar 10.000 Títulos de Propriedade Brasileiros: Um Estudo de Caso Técnico

Contexto do Projeto e Problema
Uma empresa brasileira de imóveis herdou aproximadamente 10.000 títulos de propriedade em mais de 10 municípios, com décadas de gestão deficiente. Os dados incluem centenas de "contratos de gaveta" não registrados (vendas informais nunca protocoladas), vendas duplicadas das mesmas propriedades, contratos fraudulentos, procurações falsificadas, ocupações irregulares e aproximadamente 500 processos ativos, incluindo ações de usucapião, adjudicação compulsória, despejos, disputas por vendas duplicadas e 2 ações coletivas. O arquivo físico de documentos está parcialmente sob custódia da polícia como parte de uma investigação antiga.
Abordagem Técnica
A equipe (6 advogados + 3 operadores) decidiu não construir infraestrutura antecipadamente, optando por uma abordagem de descoberta inicial com assistência de IA. O plano envolve cinco etapas:
- Etapa 1 - Digitalização física: Documentos organizados por município, digitalizados em lotes com convenção de nomenclatura: [município]_[tipo-documento]_[sequência] usando um scanner de documentos com ADF (alimentador automático de documentos).
- Etapa 2 - OCR: Considerando Google Document AI, Mistral OCR 3, AWS Textract ou outras ferramentas. A equipe está pedindo feedback sobre ferramentas especificamente testadas em documentos de cartório latino-americanos degradados.
- Etapa 3 - Descoberta: Alimentando a saída do OCR diretamente em ferramentas de IA com grandes janelas de contexto para análise aberta antes da configuração do banco de dados. Usando Gemini 3.1 Pro (no NotebookLM ou outra interface) para análise ampla em lote com prompts como "quais lotes parecem vinculados a mais de um comprador?", "sinalize contratos com datas incoerentes", "identifique agrupamentos de nomes ou atividades suspeitas" e "ajude-nos a ver problemas e soluções para o que não estamos enxergando". Executando Claude Projects em paralelo para análise semelhante.
- Etapa 4 - Limpeza e padronização de dados: Normalizando dados brutos extraídos antes da inserção no banco de dados. Tratando nomes de municípios escritos de múltiplas formas ("B. Vista", "Bela Vista de GO", "Bela V. Goiás") para forma canônica, padronizando CPFs (números de identificação pessoal brasileiros) com e sem pontuação, corrigindo descrições inconsistentes de status de lotes para categorias enumeradas e correspondência aproximada de nomes de compradores com variações ortográficas. Ferramentas: Python + rapidfuzz para correspondência aproximada, API Claude para normalizar campos de texto livre em categorias. A equipe está perguntando se correspondência aproximada + normalização por LLM é suficiente para 10.000 registros com décadas de inconsistência ou se precisam de resolução de entidades mais rigorosa (ex: Dedupe.io).
- Etapa 5 - Banco de dados: Stack escolhida: Supabase (PostgreSQL + pgvector) com NocoDB em cima. Três opções foram avaliadas: Airtable (mais fácil para começar, mas limitado em escala), PostgreSQL direto (mais controle, mas iteração mais lenta) e Supabase + NocoDB (escolhido como meio-termo).
O objetivo é obter uma imagem consolidada real em 30-60 dias, evitando as tentativas anteriores fracassadas de organização.
📖 Read the full source: r/ClaudeAI
👀 See Also

A abordagem de questionamento crítico do Claude para revisão de currículo em comparação com ChatGPT e Gemini
Um desenvolvedor testou Claude, ChatGPT e Gemini para otimização de currículo e descobriu que Claude questionou exclusivamente lacunas na experiência e resultados de projetos, tratando o currículo como um argumento a ser examinado em vez de apenas polir fatos.

Configuração de Orquestração Multi-IA Usando Claude Code com GPT e Gemini
Um desenvolvedor compartilha sua configuração onde o Claude Code orquestra o GPT-5.4 e o Gemini 3.1 Pro no mesmo IDE, usando arquivos markdown para contexto persistente e comandos CLI para comunicação entre modelos.

Desenvolvedor de Homelab Testa 19 LLMs Locais com 45 Testes Práticos no AMD Strix Halo
Um desenvolvedor criou uma suíte de benchmark de 45 testes para LLMs locais baseada em casos de uso reais de homelab, como classificação de e-mails, automação do Home Assistant e planejamento de refeições. Testando 19 modelos em um AMD Strix Halo com 128GB de RAM e 96GB de VRAM, o Gemma 4 26B-A4B teve o melhor desempenho após correções de bugs.

Claude como Mentor de Codificação: Do Zero ao SaaS Full-Stack Lançado em Um Mês
Um desenvolvedor usou o Claude para aprender SvelteKit 2, assinaturas Stripe, MongoDB e criptografia AES-256, lançando um pastebin criptografado de conhecimento zero chamado CloakBin em um mês.