更新动态 · API Gateway

05-29

模型发布

Claude Opus 4.8 上线 NEW Anthropic

Anthropic 最新一代旗舰 Opus —— 复杂推理、长上下文写作与代码能力再上一层。即刻可用，无需申请白名单。

100 万 token 上下文（标准价，不额外加价）

视觉理解：图片 + 文本混合输入

工具调用 / 函数调用（tool use）

流式输出（SSE，OpenAI / Anthropic 双协议）

提示缓存：5 分钟 & 1 小时两档

全新 tokenizer（4.7 起，性能更优）

输入 / 1M

$5

输出 / 1M

$25

缓存读取 / 1M

$0.50

对比上代 4.1

省 3×

直接用模型名 claude-opus-4-8 调用 /v1/messages 或 /v1/chat/completions 即可。

💡 小贴士：Opus 4.7 / 4.8 上游已弃用 temperature 与 top_p 采样参数。网关会自动为你剥离，老客户端代码无需任何改动也不会再报 400。

05-28

平台升级

路由引擎从 7.1.22 升级到 7.1.28，零停机平滑切换，对调用方完全无感。

usage 统计增强：服务等级（service tier）追踪

缓存 token 计入总量，账单更精准

Claude ↔ OpenAI 推理签名翻译修复

流式工具调用增量修复

05-29

稳定性

一轮深度计费 / 使用排查后的修复合集。

Embeddings 已接入统一向量端点，并兼容 OpenAI SDK 字符串 / 数组 input

缓存监控页冷查询 3.6s → 16ms（7 天范围，约 230×）

操练场报错正确展示真实信息（不再显示 [object Object]）

落地页“在线模型”计数与模型广场对齐

05-24

模型扩充

一个 OpenAI 兼容接口，一个 key，覆盖对话 / 代码 / 多模态 / 向量模型。

对话：GPT-5.5 / Claude / Gemini / Grok 等模型

多模态：按模型 profile 清单开放图像理解与代码模型

向量：openai-embedding-large / small / ada，并提供 text-embedding-* 别名