Dialoq
Gateway de API unificado para mais de 200 modelos de IA
Simplifique o acesso a mais de 100 LLMs com o LiteLLM da Berri AI. Monitore o uso, gerencie custos, aplique limites de taxas e forneça suporte de fallback — tudo por meio de um único gateway compatível com OpenAI.
A Berri AI oferece um gateway simplificado — o LiteLLM — que oferece aos desenvolvedores e equipes de plataforma acesso centralizado a mais de 100 modelos de linguagem de grande porte (LLMs). Ao oferecer compatibilidade com o formato da API OpenAI, elimina a necessidade de integrações personalizadas e reduz o tempo de adoção de novos modelos entre provedores.
O LiteLLM conta com a confiança de equipes de empresas como Netflix, RocketMoney e Lemonade. Ele permite o gerenciamento de nível empresarial das operações de LLM, oferecendo suporte a tudo, desde o rastreamento de uso até o controle de acesso detalhado, tudo em um pacote corporativo ou de código aberto pronto para produção.
O LiteLLM oferece conectividade perfeita com modelos dos principais provedores, incluindo OpenAI, Azure, Bedrock e GCP. Os desenvolvedores podem alternar entre provedores ou integrar novos modelos sem reescrever sua base de código, usando uma API consistente.
Com o LiteLLM, as equipes podem monitorar com precisão os custos de uso por usuário, equipe ou organização. Ele suporta atribuição de custos baseada em tags e integra-se a armazenamentos em nuvem como S3 e GCS para registro, permitindo melhor supervisão financeira e orçamento.
As equipes da plataforma podem definir limites de taxa personalizados (RPM/TPM) e impor orçamentos de uso por equipe ou chave. Esses controles garantem a eficiência operacional e, ao mesmo tempo, protegem a infraestrutura contra uso indevido ou excesso de uso.
O LiteLLM inclui suporte integrado para fallbacks de modelos, permitindo serviço ininterrupto caso um provedor falhe ou limite o acesso. Os guardrails aumentam ainda mais a confiabilidade, oferecendo regras para manuseio seguro de prompts e uso de APIs.
A versão de código aberto do LiteLLM é gratuita e inclui suporte para mais de 100 integrações LLM, balanceamento de carga e registro de telemetria. Os desenvolvedores podem estender a funcionalidade com contribuições da comunidade ou por meio de SDKs compatíveis.
O LiteLLM integra-se com Prometheus, OpenTelemetry, Langfuse e outras ferramentas de observabilidade. As equipes podem monitorar as métricas de uso do LLM, acompanhar o desempenho das solicitações e analisar padrões para otimização ou depuração.
O LiteLLM reduz significativamente o tempo de integração de novos LLMs. As equipes podem fornecer acesso a modelos recém-lançados em poucas horas, em vez de dias, graças a uma interface unificada e uma camada de compatibilidade.
O plano empresarial inclui recursos como SSO, autenticação JWT, registro de auditoria e SLAs personalizados. As organizações podem implantar o LiteLLM na nuvem ou no local, dependendo de suas necessidades de infraestrutura e requisitos de conformidade.