腾讯推出自研深度思考模型混元T1正式版

AI资讯 2025-03-24 53

3月21日深夜，腾讯宣布推出自研深度思考模型混元T1正式版，并同步在腾讯云官网上线。

据腾讯介绍，混元T1正式版通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，推理能力得到进一步提升。与此前已上线腾讯元宝的混元T1-preview模型相比，综合效果也有了明显提升。

在一些常见的基准测试上，比如大语言模型评估增强数据集MMLU-PRO中，混元T1的评分仅次于OpenAI-o1，优于DeepSeek-R1。在评估逻辑推理能力的DROPF1测试中，混元T1的评分也优于DeepSeek-R1和OpenAI-o1。不过在数学和代码能力测试中，混元T1的评分都低于DeepSeek-R1。在中文语言理解能力方面，混元T1与DeepSeek-R1的评分齐平。整体来看，混元T1正式版的成绩已经达到了业界领先推理模型的水平。

不过，腾讯官方此次并未披露混元T1的参数量级，所以并不清楚其是用多少训练数据实现这一性能。

另外值得一提的是，混元T1是以腾讯快思考模型混元TurboS为基座打造。混元TurboS于今年2月底发布，腾讯混元团队当时就表示，TurboS将作为旗舰模型，成为腾讯混元系列衍生模型的核心基座，为推理、长文、代码等衍生模型提供基础能力。

与DeepSeekR1等慢思考模型不同，混元TurboS更强调“秒回、吐字快”，并且更善于超长文本处理。这是因为混元TurboS在架构方面创新性地采用了Hybrid-Mamba-Transformer融合模式。通过这种融合，混元TurboS一方面可以发挥Mamba高效处理长序列的能力，另一方面也能保留Transformer擅于捕捉复杂上下文的优势。因此，该架构有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache的内存占用，从而显著降低了训练和推理成本，让混元T1吐字速度达到最快80tokens/s。

据了解，混元TurboS是工业界首次成功将Mamba架构无损地应用在超大型MoE模型上，而混元T1则是工业界首次将混合Mamba架构无损应用于超大型推理模型上。

价格方面，混元T1的输入价格为每百万tokens1元，输出价格为每百万tokens4元。这与DeepSeek-R1目前夜间时段（00：30-08：30）的价格相同，但在标准时段，混元T1的价格则是DeepSeek-R1的四分之一。

2 海报