Models.dev: Banco de Dados Open-Source de Especificações, Preços e Capacidades de Modelos de IA

Models.dev é um banco de dados open-source de especificações, preços e capacidades de modelos de IA, mantido como um projeto comunitário. Os dados são armazenados no repositório como arquivos TOML, organizados por provedor e modelo, com logotipos em SVG. Ele também alimenta uma API e é usado internamente no opencode.
Acesso à API
Você pode obter todos os dados dos modelos por meio de um único endpoint da API:
curl https://models.dev/api.jsonO campo ID do Modelo (ex.: openai/gpt-5) corresponde ao identificador usado pelo AI SDK. Logotipos dos provedores estão disponíveis como arquivos SVG:
curl https://models.dev/logos/{provider}.svgSubstitua {provider} pelo ID do Provedor (ex.: anthropic, openai, google).
Contribuindo
Para adicionar um novo modelo, primeiro verifique se o provedor já existe no diretório providers/. Se não, crie uma pasta do provedor com um arquivo provider.toml:
name = "Nome do Provedor"
npm = "@ai-sdk/provider" # Nome do pacote AI SDK
env = ["PROVIDER_API_KEY"] # Chaves de variáveis de ambiente usadas para autenticação
doc = "https://example.com/docs/models" # Link para a documentação do provedorSe o provedor expõe um endpoint compatível com OpenAI, defina npm = "@ai-sdk/openai-compatible" e inclua a URL base: api = "https://api.example.com/v1".
Opcionalmente, adicione um logo.svg ao diretório do provedor usando currentColor para preenchimentos/traçados. Em seguida, crie um arquivo TOML de definição do modelo em providers/{provider}/models/. Exemplo de definição de modelo:
name = "Nome de Exibição do Modelo"
attachment = true # suporta anexos de arquivos
reasoning = false # suporta cadeia de pensamento
tool_call = true # suporta chamada de ferramentas
structured_output = true # suporta saída estruturada
temperature = true # suporta controle de temperatura
knowledge = "2024-04" # data de corte do conhecimento
release_date = "2025-02-19"
last_updated = "2025-02-19"
open_weights = true # pesos disponíveis publicamente
[cost]
input = 3.00 # por milhão de tokens de entrada (USD)
output = 15.00 # por milhão de tokens de saída
reasoning = 15.00 # por milhão de tokens de raciocínio
cache_read = 0.30 # por milhão de tokens de cache lidos
cache_write = 3.75 # por milhão de tokens de cache escritos
input_audio = 1.00 # por milhão de tokens de áudio de entrada
output_audio = 10.00 # por milhão de tokens de áudio de saída
[limit]
context = 400_000 # janela de contexto máxima (tokens)
input = 272_000 # tokens máximos de entrada
output = 8_192 # tokens máximos de saída
[modalities]
input = ["text", "image"]
output = ["text"]
[interleaved]
field = "reasoning_content"
Para provedores wrapper que espelham modelos existentes, use extends (não detalhado no trecho).
Models.dev é um banco de dados open-source e orientado pela comunidade. O código-fonte está no GitHub, e contribuições são bem-vindas para manter os dados atualizados.
📖 Leia a fonte completa: HN LLM Tools
👀 See Also

Claude Code v2.1.126: Seletor de Modelo, Limpeza de Projeto, Correções no OAuth e Melhorias de Segurança
Claude Code v2.1.126 adiciona um seletor /model para gateways compatíveis com Anthropic, um novo comando claude project purge, corrige o login OAuth em WSL2/SSH/containers e corrige problemas de segurança com configurações gerenciadas e exposição da área de transferência no Windows.

Guarda de Raciocínio: Detecção de Loop em Nível de Proxy para Inferência Local de LLM
Uma camada de proteção no proxy que detecta e recupera de loops de raciocínio de LLMs usando verificações determinísticas no stream — limites de tokens, repetição de n-gramas e impressão digital de frases — sem modificações no modelo.

O benchmark MemAware mostra que a memória do agente baseado em RAG falha na recuperação de contexto implícito.
O benchmark MemAware testa se os agentes de IA conseguem trazer à tona contextos passados relevantes quando os usuários não os solicitam explicitamente, revelando que os sistemas de memória atuais têm apenas 2,8% de precisão em consultas implícitas difíceis, contra 0,8% sem memória.

MOOSE-Star: Um Modelo de 7B e um Conjunto de Dados de 108K Artigos para Descoberta de Hipóteses Científicas – ICML 2026
MiroMind lança MOOSE-Star no Hugging Face: um modelo de 7B (fine-tune do DeepSeek-R1-Distill-Qwen-7B) para descoberta de hipóteses científicas, junto com o conjunto de dados TOMATO-Star de 108 mil artigos. Benchmarks mostram que o MS-7B alcança 54,34% de precisão na recuperação de inspirações, superando o GPT-5.4 e se aproximando do Gemini-3 Pro.