Tinygrad称GLM5.2可在双机互联Blackwell配置下跑出120tok/s，售价15万美元

发布时间：2026-06-21

缘辉旺盾网消息，6 月 21 日，GPU 销售商 Tinygrad 发文称，据可靠消息 GLM 5.2 模型在两台联网 Blackwell 架构 tinybox 上可实现每秒 120 个 token 的推理速度。该配置售价 15 万美元，可选双台标准 tinybox 或单台 tinybox Pro，均可达到上述性能表现。Tinygrad 以此为卖点，主打「一次购买、永不付云费」的私有化部署路线，直接对标按需计费的云端推理服务。目前该消息尚未经 GLM 官方证实，Tinygrad 亦未披露更多技术细节。---------------------------------点击下方原文链接，加入动察 Beating · 飞书 AI 新闻渠道，724 小时不间断监测全球 AI 热点与新闻。----------缘辉旺盾网量化工具温馨提示：数字货币投资有风险，入市需谨慎；本文章不作为投资依据，仅供参考----------交流群：https://t.me/dunwangyuanhuiwang

缘辉旺盾网消息，6 月 21 日，GPU 销售商 Tinygrad 发文称，据可靠消息 GLM 5.2 模型在两台联网 Blackwell 架构 tinybox 上可实现每秒 120 个 token 的推理速度。

该配置售价 15 万美元，可选双台标准 tinybox 或单台 tinybox Pro，均可达到上述性能表现。Tinygrad 以此为卖点，主打「一次购买、永不付云费」的私有化部署路线，直接对标按需计费的云端推理服务。

目前该消息尚未经 GLM 官方证实，Tinygrad 亦未披露更多技术细节。

---------------------------------
点击下方原文链接，加入动察 Beating · 飞书 AI 新闻渠道，7×24 小时不间断监测全球 AI 热点与新闻。

----------缘辉旺盾网量化工具温馨提示：数字货币投资有风险，入市需谨慎；本文章不作为投资依据，仅供参考 ----------交流群：https://t.me/dunwangyuanhuiwang

上一篇： Palantir CEO：AI将重创民主党核心选民群体经济地位，政治冲击不可忽视

下一篇：SpaceX上市前曾被MSCI打最低ESG评级

友情链接 :