更新动态

API Gateway 的模型发布与平台更新 — 最新能力,第一时间用上

05-29
模型发布

Claude Opus 4.8 上线 NEW Anthropic

Anthropic 最新一代旗舰 Opus —— 复杂推理、长上下文写作与代码能力再上一层。即刻可用,无需申请白名单。
100 万 token 上下文(标准价,不额外加价)
视觉理解:图片 + 文本混合输入
工具调用 / 函数调用(tool use)
流式输出(SSE,OpenAI / Anthropic 双协议)
提示缓存:5 分钟 & 1 小时两档
全新 tokenizer(4.7 起,性能更优)
输入 / 1M
$5
输出 / 1M
$25
缓存读取 / 1M
$0.50
对比上代 4.1
省 3×
直接用模型名 claude-opus-4-8 调用 /v1/messages/v1/chat/completions 即可。
💡 小贴士:Opus 4.7 / 4.8 上游已弃用 temperaturetop_p 采样参数。网关会自动为你剥离,老客户端代码无需任何改动也不会再报 400。
05-28
平台升级

网关引擎升级至 v7.1.28 Platform

路由引擎从 7.1.22 升级到 7.1.28,零停机平滑切换,对调用方完全无感。
usage 统计增强:服务等级(service tier)追踪
缓存 token 计入总量,账单更精准
Claude ↔ OpenAI 推理签名翻译修复
流式工具调用增量修复
05-29
稳定性

计费与兼容性加固 Fix

一轮深度计费 / 使用排查后的修复合集。
Embeddings 已接入统一向量端点,并兼容 OpenAI SDK 字符串 / 数组 input
缓存监控页冷查询 3.6s → 16ms(7 天范围,约 230×)
操练场报错正确展示真实信息(不再显示 [object Object])
落地页“在线模型”计数与模型广场对齐
05-24
模型扩充

模型矩阵持续扩充 Models

一个 OpenAI 兼容接口,一个 key,覆盖对话 / 代码 / 多模态 / 向量模型。
对话:GPT-5.5 / Claude / Gemini / Grok 等模型
多模态:按模型 profile 清单开放图像理解与代码模型
向量:openai-embedding-large / small / ada,并提供 text-embedding-* 别名
想要某个还没上线的模型?联系 Gateway Admin 提需求。