Token 日调用量破 140 万亿、Seedance 2.0 碾压 Sora、Cursor 套壳 Kimi 曝光——3月24日 AI 热点速递
3月24日 AI 圈重磅不断:中国大模型日均 Token 调用量突破 140 万亿,MiniMax M2.5 连续五周霸榜;字节 Seedance 2.0 视频生成超越 Sora 登顶榜首;Cursor Composer 2 被曝底层使用 Kimi 2.5;阿里千问上线 AI 打车;MiniMax MaxClaw 接入微信;OpenAI 计划扩招至 8000 人。本文深度解读每条热点,并教你如何通过 168API 一个接口玩转所有大模型。
Token 日调用量破 140 万亿、Seedance 2.0 碾压 Sora、Cursor 套壳 Kimi 曝光——3月24日 AI 热点速递
AI 行业每天都在刷新认知。作为开发者,如何在模型百花齐放的时代快速接入、灵活切换?168API 让你一个 API Key 调用 GPT、Claude、Qwen、DeepSeek、Kimi、MiniMax 等 20+ 主流大模型,切换模型只需改一个参数。
一、中国大模型日均 Token 调用量突破 140 万亿
3月24日,国家数据局局长刘烈宏在国新办发布会上公布了一组令人震撼的数据:截至2026年3月,我国日均词元(Token)调用量已超过 140 万亿。
这一数字对比2024年初的 1000 亿增长了1000 多倍,相比2025年底的 100 万亿,仅三个月时间又增长了 40% 以上。
与此同时,MiniMax M2.5 连续五周霸榜全球大模型调用量冠军,港股 AI 应用产业链大幅拉升,MINIMAX-W 单日涨超 12%。卡内基梅隆大学教授在独立测评后公开表示,M2.5 是他能确认的第一个综合能力超过 Claude Sonnet 的开源模型。
开发者如何快速接入 MiniMax M2.5?
通过 168API,你无需单独注册 MiniMax 账号,直接使用 OpenAI 兼容接口即可调用:
from openai import OpenAI
client = OpenAI(
api_key="your-168api-key",
base_url="https://fast.168api.top/v1"
)
response = client.chat.completions.create(
model="minimax-m2.5", # 切换模型只需改这一行
messages=[{"role": "user", "content": "分析中国AI产业的最新发展趋势"}]
)
print(response.choices[0].message.content)
二、字节 Seedance 2.0 全球上线,视频生成超越 Sora
字节跳动旗下 Seedance 2.0 视频生成模型正式发布,在 Artificial Analysis 权威排行榜上以 Elo 1269 分超越 OpenAI Sora 和 Google Veo3,登顶第一。
该模型支持文本、图像、音频多模态输入,可生成最高 1080p 分辨率视频。这标志着中国在视频生成领域已经跻身全球第一梯队。
对于需要多模态内容生成的开发者而言,168API 同样支持多种视频和图像生成模型的调用,一个接口搞定所有需求。
三、Cursor Composer 2 被曝底层使用国产 Kimi 2.5
3月19日,AI 编程神器 Cursor 发布了第二代自研编程模型 Composer 2,核心评测得分紧追 GPT-5.4,使用成本降低 90%。
然而戏剧性的一幕出现了——社区很快发现 Composer 2 的底层实际使用了月之暗面(Moonshot)的 Kimi 2.5 作为基座模型。Cursor 官方随后确认了这一合作关系,Kimi 方面也表示合规授权。
这一事件再次证明:国产大模型的技术实力已获国际顶级产品认可。通过 168API,你可以直接调用 Kimi 原版模型:
response = client.chat.completions.create(
model="kimi-k2.5", # 直接用 Kimi 原版
messages=[{"role": "user", "content": "帮我重构这段代码,提升可读性和性能"}],
temperature=0.7
)
四、阿里千问上线「AI 打车」,Agent 时代加速到来
3月23日,阿里千问正式上线 「AI 打车」 功能,用户只需用自然语言描述需求,千问就能自动完成:
- 智能打车和路线规划
- 外卖下单
- 导航和地图服务
- 多服务一站式协同
这是 AI Agent 深度融入日常生活的标志性事件。阿里将其定义为「AI 原生服务」的创新尝试。
与此同时,千问 Qwen3.5-Max-Preview 在 LMArena 盲测中以 1464 分超越 GPT-5.4、Claude 4.5、Grok 4.1,展现出强劲的综合实力。
五、MiniMax MaxClaw 接入微信,AI Agent 无处不在
MiniMax 旗下 AI Agent 产品 MaxClaw 正式接入个人微信,目前已覆盖:
- 微信
- 飞书
- 钉钉
- Telegram
用户可以直接在微信对话中完成文档总结、思维导图生成、数据分析等复杂任务。同日,MiniMax 还发布了 Token Plan 全模态订阅,将视频、语音、音乐、图像生成整合至单一订阅。
六、OpenAI 计划扩招至 8000 人,从实验室转型企业软件公司
OpenAI 宣布计划在2026年底前将员工数量扩大至约 8000 人(几乎翻倍),招聘覆盖产品、工程、研究、销售和技术推广等多个方向。
这一举措标志着 OpenAI 正在从一家 AI 研究实验室向全面的企业软件公司转型。同时,OpenAI 年化营收已突破 250 亿美元,Anthropic 紧随其后接近 190 亿美元。
七、白宫发布 AI 综合框架 & 英国监管机构调查 Grok
3月20日,白宫发布了全面的 AI 发展框架,涵盖透明度、问责制和包容性等关键原则,旨在引导 AI 技术的安全部署。
同时,英国信息专员办公室(ICO)和 Ofcom 向马斯克的 xAI 发出正式信息需求,要求提供 Grok 模型的相关信息,AI 监管力度持续加强。
八、Amazon 推出健康 AI Agent,提供 24/7 医疗咨询
Amazon 在其网站和 App 上线了 Health AI Agent,为 Prime 会员提供免费的 24/7 健康咨询服务,包括:
- 回答健康问题
- 解读实验室检测结果
- 管理处方续药
- 预约就医
AI Agent 的应用场景正从办公效率向医疗、健康、生活服务全面扩展。
模型实力对比:2026年3月主流大模型一览
| 模型 | 厂商 | 参数量 | 上下文窗口 | 亮点 | |------|------|--------|-----------|------| | GPT-5.4 | OpenAI | 未公开 | 1M tokens | 自主操控电脑,OSWorld-V 超越人类 | | Claude Opus 4.6 | Anthropic | 未公开 | 1M tokens | 破解数学难题,多智能体协作 | | Qwen3.5-Max | 阿里巴巴 | 万亿级 | 256K tokens | LMArena 盲测超越 GPT-5.4 | | MiniMax M2.5 | MiniMax | 未公开 | 256K tokens | 全球调用量五周霸榜 | | Kimi K2.5 | 月之暗面 | 未公开 | 256K tokens | Cursor Composer 2 底座模型 | | DeepSeek V4 | 深度求索 | 未公开 | 128K tokens | 原生多模态,即将发布 | | Mistral Small 4 | Mistral AI | 119B (6B激活) | 256K tokens | MoE架构,全能旗舰 | | GLM-5 | 智谱AI | 未公开 | 128K tokens | 开源代码能力获赞 | | Seedance 2.0 | 字节跳动 | 未公开 | - | 视频生成超越 Sora |
为什么开发者选择 168API?
面对如此多的优质模型,开发者最大的痛点是:每个平台都要单独注册、单独充值、单独维护 API Key。
168API 完美解决了这个问题:
- 统一接口:完全兼容 OpenAI SDK,零改造成本
- 一个 Key 通吃:GPT、Claude、Qwen、DeepSeek、Kimi、MiniMax 等 20+ 模型
- 灵活切换:想试新模型?改一个
model参数即可 - 按量计费:用多少付多少,无月费绑定
// Node.js 示例:轻松切换不同模型
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: 'your-168api-key',
baseURL: 'https://fast.168api.top/v1'
});
// 用 GPT-5.4 做复杂推理
const gptResponse = await client.chat.completions.create({
model: 'gpt-5.4',
messages: [{ role: 'user', content: '分析这段代码的时间复杂度' }]
});
// 用 Qwen3.5 做中文任务
const qwenResponse = await client.chat.completions.create({
model: 'qwen-3.5-max',
messages: [{ role: 'user', content: '用中文总结这篇论文的核心贡献' }]
});
// 用 DeepSeek 做数学推理
const dsResponse = await client.chat.completions.create({
model: 'deepseek-v4',
messages: [{ role: 'user', content: '证明:任意偶数大于2都可以表示为两个素数之和' }]
});
立即访问 https://fast.168api.top 注册,开启你的多模型开发之旅!
本文由 168API 技术团队整理发布,数据来源:国新办发布会、Artificial Analysis、LMArena、各厂商官方公告。

