Gemini Balance 以 Python + FastAPI 为核心,整合多 Key 轮询、负载均衡、权限过滤与 健康 监控,并向下兼容 OpenAI 接口格式。最新版在性能、文档与安全性上全面升级,引入 countTokens 端点、自动 思考 配置优化、本地与云端双向代理指南,以及 ARM/AMD Docker 镜像,帮助 开发 者快速构建高可用的 Gemini 服务栈。
Gemini Balance 是一个开源 Gemini API 代理与负载均衡器,支持在同一实例中 管理 多组 Gemini API Key,并通过轮询 算法 分摊流量,显著降低单 Key 触发速率限制的 风险 。相比上游版本,当前 Fork 进一步修复配置缺陷、强化安全策略,并补全繁体中文与 英文 文档,方便跨地区 团队 协作。
自动按顺序轮询多个 Gemini API Key,均衡请求负载并提升并发能力
可配置最大重试次数与失败自动禁用策略,定时检测恢复失效 Key
提供认证访问的 /keys_status 页面,实时展示各 Key 的使用情况与健康指标
详细日志记录帮助快速排查错误与性能瓶颈
同时兼容 Gemini 和 OpenAI 格式的 CHAT、画图及 embeddings 接口
支持 IMAGE_MODELS、SEARCH_MODELS 等配置,分别用于图文对话、联网搜索和修图功能
可过滤不常用模型,自动从 API 获取最新模型列表
countTokens API 支持:在发送前预估 token 数量
智能 thinkingConfig 处理:当 thinkingBudget 为 0 时自动省略该配置
反向代理与本地开发指南:包含 nginx、SSL 证书、hosts 配置等
管理脚本:支持一键切换代理、更新端口与完整移除
两种协议均支持图文对话、联网搜索与自定义模型过滤。
借助 Gemini Balance,你可以在最短 时间 内获得稳定、易扩展且对开发者友好的 Gemini 代理服务,为应用接入最新多模态模型扫清障碍。
官网地址:https://gb-docs.snaily.top/
GitHub:https://github.com/yulin0629/gemini-balance
盘天下 | 免费网盘资源分享(pantx.cn),Gemini Balance 是一个开源 Gemini API 代理与负载均衡器,支持在同一实例中管理多组 Gemini API Key,并通过轮询算法分摊流量,显著降低单 Key 触发速率限制的风险。相比上游版本,当前 Fork 进一步修复配置缺陷、强化安全策略,并补全繁体中文与英文文档,方便跨地区团队协作。
评论列表
发表评论