MiMo AI API Proxy

以弦光入场
让灵感有声

基于 Cloudflare Workers 构建的轻量级高性能 API 代理。支持子密钥管理、配额控制,兼容 OpenAI 和 Anthropic 接口格式。

9 可用模型
<50ms 平均延迟
99.9% 可用率

为什么选择 ChaoPhone API?

🔐

子密钥管理

管理员可为用户创建独立子密钥,无需暴露主密钥即可安全共享 API 访问权限。

📈

配额控制

为每个密钥设置请求次数上限和 Token 用量上限,实时追踪使用统计。

全球边缘网络

部署在 Cloudflare Workers 全球 300+ 数据中心,请求延迟极低。

🔄

OpenAI 兼容

可直接替换 OpenAI SDK,只需修改 Base URL 和 API Key 即可使用 MiMo 模型。

🚀

流式响应

完整支持 SSE 流式传输,兼容所有主流客户端库,实时获取生成内容。

💰

免费额度充足

Cloudflare Workers 免费版支持每日 10 万次请求,满足个人和小团队使用。

快速开始

仅需三步即可开始使用

1

获取密钥

联系管理员获取您的专属 API 密钥,格式为 mk-xxxx...

2

选择客户端

使用任意 OpenAI 兼容的 SDK 或直接发送 HTTP 请求。

3

开始调用

替换 Base URL 和 API Key 即可,无需修改其他代码。

curl https://api.chaophone.top/v1/chat/completions \
  -H "Authorization: Bearer mk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mimo-v2.5-pro",
    "messages": [
      {"role": "user", "content": "你好!"}
    ],
    "stream": true
  }'
from openai import OpenAI

client = OpenAI(
    api_key="mk-your-api-key",
    base_url="https://api.chaophone.top/v1"
)

response = client.chat.completions.create(
    model="mimo-v2.5-pro",
    messages=[{"role": "user", "content": "你好!"}],
    stream=True
)

for chunk in response:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "mk-your-api-key",
  baseURL: "https://api.chaophone.top/v1",
});

const stream = await client.chat.completions.create({
  model: "mimo-v2.5-pro",
  messages: [{ role: "user", content: "你好!" }],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

接口文档

Base URL

所有 API 请求发送至以下地址:

https://api.chaophone.top

OpenAI 兼容接口

GET /v1/models

获取所有可用的 MiMo 模型列表。无需请求体。

curl https://api.chaophone.top/v1/models \
  -H "Authorization: Bearer mk-your-key"
POST /v1/chat/completions

创建对话补全请求。

参数说明:model(必填)模型 ID;messages(必填)消息数组;temperature 采样温度 0-2;max_tokens 最大生成 Token 数;stream 是否启用流式。

curl -X POST https://api.chaophone.top/v1/chat/completions \
  -H "Authorization: Bearer mk-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mimo-v2.5-pro",
    "messages": [
      {"role": "system", "content": "你是一个有帮助的助手。"},
      {"role": "user", "content": "解释一下量子计算。"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048,
    "stream": true
  }'

响应示例(非流式):

{
  "id": "chatcmpl-xxx",
  "model": "mimo-v2.5-pro",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "量子计算是利用量子力学原理..."
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 128,
    "total_tokens": 153
  }
}

Anthropic 兼容接口

POST /anthropic/v1/messages

使用 Anthropic 格式创建消息请求。

参数说明:model(必填)模型 ID;messages(必填)消息数组;max_tokens(必填)最大生成 Token 数;system 系统提示词。

curl -X POST https://api.chaophone.top/anthropic/v1/messages \
  -H "Authorization: Bearer mk-your-key" \
  -H "Content-Type: application/json" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "mimo-v2.5-pro",
    "max_tokens": 1024,
    "system": "你是一个有帮助的助手。",
    "messages": [
      {"role": "user", "content": "你好!"}
    ]
  }'

响应示例:

{
  "id": "msg-xxx",
  "type": "message",
  "role": "assistant",
  "model": "mimo-v2.5-pro",
  "stop_reason": "end_turn",
  "content": [{
    "type": "text",
    "text": "你好!有什么可以帮助你的吗?"
  }],
  "usage": {
    "input_tokens": 15,
    "output_tokens": 20
  }
}
SDK Anthropic Python SDK

使用官方 Anthropic SDK 调用。

from anthropic import Anthropic

client = Anthropic(
    api_key="mk-your-key",
    base_url="https://api.chaophone.top/anthropic"
)

message = client.messages.create(
    model="mimo-v2.5-pro",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "你好!"}
    ]
)
print(message.content[0].text)

认证方式

通过以下任一方式传递 API 密钥:

  • Authorization: Bearer mk-your-key
  • api-key: mk-your-key

密钥由管理员在后台创建并分配,格式为 mk- 开头的字符串。

错误码说明

状态码含义处理建议
401缺少或无效的 API 密钥检查 Authorization 请求头
403密钥已过期或已禁用联系管理员重新分配密钥
429配额已用尽(请求次数或 Token 用量)联系管理员提升配额或重置用量
502上游 API 错误稍后重试,或联系管理员检查服务状态

可用模型

所有模型均支持 OpenAI 和 Anthropic 两种调用格式

文本生成模型

Pro 旗舰

mimo-v2.5-pro

旗舰级 Pro 模型。支持深度思考(reasoning)、函数调用(function call)、联网搜索。适合复杂推理和专业任务。

Pro

mimo-v2-pro

Pro 模型。支持深度思考和函数调用,兼顾性能与成本。

Omni 全模态

mimo-v2.5

全模态理解模型。支持文本、图像、音频等多种输入,深度思考、函数调用和联网搜索。

Omni 全模态

mimo-v2-omni

全模态理解模型,支持 256K 超长上下文窗口,适合处理长文档和多轮对话。

Flash 快速

mimo-v2-flash

快速推理模型,256K 上下文。响应速度更快,适合对延迟敏感的场景。

语音合成模型(TTS)

TTS

mimo-v2.5-tts

高质量语音合成模型,支持多种音色和情感表达。

TTS

mimo-v2.5-tts-voiceclone

支持声音克隆的语音合成模型,可基于少量音频样本复制特定音色。

TTS

mimo-v2.5-tts-voicedesign

支持自定义音色设计的语音合成模型,可精细调节语速、音调、情感等参数。

TTS

mimo-v2-tts

语音合成模型 V2 版本,基础 TTS 功能。