Kallavy — Broker de Inteligência Artificial do Brasil
Começar
Broker de IA do Brasil

Todos os modelos de IA. Uma só chamada.

Dezenas de modelos dos principais provedores de IA do mundo em um único endpoint — 100% compatível com a API da OpenAI. A Kallavy intermedia cada requisição, contabiliza o uso por cliente e consolida tudo em uma fatura única em reais via PIX com NF-e automática.

Sem cartão internacional
NF-e automática
LGPD compliant
cliente.py
# Troque apenas base_url — zero refactor
from openai import OpenAI

client = OpenAI(
  api_key="sk-br-abc123",
  base_url="https://api.kallavy.com/v1"
)

resp = client.chat.completions.create(
  model="gemini-flash",
  messages=[{"role":"user",
               "content":"Resuma..."}]
)
POST /v1/chat/completions
200 OK ·gemini-flash ·1.214 tokens ·238 ms
Latência
~10 ms
Uptime
99.9%

Por que empresas brasileiras escolhem a Kallavy

7+

Modelos de IA

4

Provedores globais

~10ms

Latência média no BR

100%

Infra hospedada no BR

Vantagens

O que torna a Kallavy diferente

Feito por brasileiros, para empresas brasileiras. Removemos todas as fricções entre você e a IA global.

3
barreiras
eliminadas

PIX & NF-e automática

Recarregue sua conta via PIX em segundos. Nota Fiscal emitida automaticamente pelo parceiro Focus NFe. Nunca mais segure uma iniciativa de IA por falta de cartão corporativo.

1

100% compatível com OpenAI

Já usa a biblioteca openai? Troque apenas base_url e continue. Sem SDK novo, sem refactor, sem lock-in.

2

Suporte em português

Time técnico brasileiro no horário de Brasília. WhatsApp, email e chat em PT-BR. Dúvida sobre prompt, erro 429 ou escolha de modelo? Falamos sua língua.

3
Como funciona

Três passos. Cinco minutos.

Do cadastro à primeira chamada da API, sem burocracia.

1

Crie sua conta

CNPJ ou CPF, e-mail e senha. Sua API Key é gerada na hora e aparece apenas uma vez — guarde bem.

2 minutos
2

Recarregue via PIX

QR Code instantâneo assim que a proposta é acertada. O crédito aparece na sua conta em segundos e a NF-e é emitida na sequência, sem intervenção manual.

1 minuto
3

Comece a usar

Aponte seu SDK favorito para api.kallavy.com/v1. Se já usava OpenAI, o código nem muda. A Kallavy intermedia cada requisição: autentica, conta tokens por cliente, repassa pro provedor e devolve a resposta — tudo pronto pra fatura única em reais.

Imediato
Infraestrutura

A única IA com rota direta até o seu usuário

Estamos conectados direto ao PTT.br de São Paulo — o maior ponto de troca de tráfego da América Latina. Peering nativo com as operadoras brasileiras significa que seus dados cruzam menos saltos, chegam mais rápido e com menos pontos de falha.

Kallavy
Kallavy
São Paulo
PTT.br
IX.br SP
Peering direto
Operadoras BR
Vivo · Claro · TIM · Oi · Algar
Seu usuário
Brasil todo

Seu tráfego não atravessa o Atlântico. Sem transit internacional, sem câmbio em cada requisição, sem surpresas no RTT.

~10 ms
Latência média
para SP e RJ
99.9%
SLA de
disponibilidade
10 Gbps
Backbone dedicado.
Zero overselling
PTT.br
Peering direto com
top ISPs brasileiros

Velocidade real

Tráfego nacional não sai do Brasil. Cada request poupa o RTT transatlântico — o que seu chatbot sente é a IA respondendo como se estivesse na sala ao lado.

Resiliência

Roteamento BGP multi-path e fallback automático entre provedores de IA. Se um upstream cair, roteamos para o próximo sem você nem perceber.

Soberania de dados

Servidores em território nacional. Logs, metadados e cadastros ficam no Brasil, aderentes à LGPD. Auditorias e DPA sob demanda.

Conectado aos principais provedores de IA do mundo

OpenAI Anthropic Google DeepSeek Mistral Meta Llama Qwen Moonshot MiniMax Cohere Groq Perplexity Nvidia
Modelos disponíveis

Os melhores modelos globais, em um único endpoint

Do GPT-4o premium ao Gemini Flash econômico — escolha o que cabe no seu caso de uso e no seu bolso. Fallback automático se um provedor cair.

OpenAI premium

GPT-4o

Multimodal topo de linha. Visão, texto e raciocínio.

128k contexto
OpenAI econômico

GPT-4o Mini

Rápido e leve para grande volume.

128k contexto
Anthropic premium

Claude Sonnet

Raciocínio profundo e escrita de alta qualidade.

200k contexto
Google premium

Gemini 1.5 Pro

Contexto gigante para análise de documentos.

2M contexto
Google + popular

Gemini Flash

Ultrarrápido. Perfeito para chatbots de atendimento.

1M contexto
DeepSeek alta eficiência

DeepSeek Chat

Altíssimo custo-benefício para uso geral.

64k contexto
DeepSeek reasoning

DeepSeek R1

Raciocínio passo-a-passo estilo o1.

64k contexto
Kallavy em breve

Roteamento automático

Você escolhe qualidade ou custo. A gente roteia.

Multi-provider

Lista de modelos em constante evolução. Fale com a gente para ver valores, SLAs e casos de uso específicos.

Dúvidas frequentes

Perguntas que fazem sentido

Se a sua não estiver aqui, chama a gente no WhatsApp.

A Kallavy é o seu intermediador brasileiro entre sua aplicação e as grandes IAs globais. Quando sua aplicação manda um prompt, a gente autentica a requisição, contabiliza os tokens de entrada e saída por cliente, repassa pro provedor real (OpenAI, Anthropic, Google ou DeepSeek) e devolve a resposta. No fechamento do período, você recebe uma única fatura em reais com NF-e cobrindo todo o uso da equipe. Pense em operadora telefônica: você não fala com cada torre, só com uma empresa que cuida de tudo.

Não. A Kallavy não mantém estoque de tokens. Sua aplicação faz requisições pela nossa API, a gente contabiliza em tempo real e repassa pros provedores reais (OpenAI, Anthropic, Google, DeepSeek). Eles nos cobram pelo uso agregado em dólar, a gente cobra de você em reais esse custo convertido mais uma taxa de intermediação que varia por modelo e volume. A taxa cobre a operação brasileira: NF-e, suporte PT-BR, risco cambial, infra nacional, SLA e contabilização por cliente.

Sim, NF-e de serviço (NFS-e) é emitida automaticamente a cada recarga confirmada via PIX, usando a integração com Focus NFe. Disponível no seu painel em PDF e XML, e também enviada por e-mail.

Não. A API da Kallavy é 100% compatível com a da OpenAI. Basta trocar base_url para https://api.kallavy.com/v1 e usar sua API Key Kallavy. Funciona com a lib oficial openai em Python, Node, Go etc.

Não armazenamos o conteúdo dos prompts nem das respostas — por princípio de LGPD e política interna. Guardamos apenas metadados: modelo usado, quantidade de tokens, horário e custo. Auditorias financeiras e técnicas são baseadas nesses metadados.

Você é cobrado pelo que efetivamente consumir: tokens de entrada e saída por modelo, contabilizados em tempo real. Sobre o custo do provedor em dólar, a Kallavy aplica a conversão em reais e adiciona uma taxa de intermediação que varia por modelo e volume — a taxa cobre NF-e, suporte PT-BR, infra no Brasil, risco cambial e contabilização. Trabalhamos com créditos pré-pagos (PIX) ou faturamento mensal pra contas B2B. Fale com a gente para uma proposta sob medida.

Fallback automático. Se a OpenAI der 5xx, a Kallavy roteia para um modelo equivalente (ex: Claude Sonnet) sem você fazer nada. Você configura a cadeia de fallback no painel.

Novo · App para desktop

Leve a Kallavy pro seu PC

O broker num app nativo: converse com OpenAI, Claude, Gemini e DeepSeek direto da sua área de trabalho, com atalho global e resposta rápida. Mesma conta, mesmo saldo.

Baixar para Windows
Windows 10/11 · 64-bit · instalador .exe
macOS — em breve Linux — em breve
API no ar agora mesmo

Pronto para chamar a IA?

Crie sua conta, recarregue via PIX e faça sua primeira requisição em menos de 5 minutos. Sem cartão internacional, sem burocracia.

Créditos pré-pagos
Sem fidelidade
NF-e automática