不到15万元！清华90后团队发布“褐蚁”一体机，已支持阿里最新Qwen3模型

行云集成电路创始人、CEO 季宇

4 月 30 日消息，钛媒体 AGI 获悉，清华 90 后创立的北京行云集成电路有限公司（简称 " 行云集成电路 "）宣布，推出全新的一体机产品 " 褐蚁 "，仅需最高 15 万元就可以跑满血版 DeepSeek R1/V3 大模型，并且对话速度达到了 20token/s。

今天下午，行云集成电路创始人、CEO 季宇对钛媒体 AGI 表示，目前 " 褐蚁 " 一体机已经支持阿里最新发布的 Qwen3 系列开源大模型，包括顶配版 Qwen3-235B-A22B。

具体来说，" 褐蚁 " 一体机有三款不同的配置：最高性价比的 " 超大杯 " 褐蚁 HY90，搭载双路 AMD EPYC 9355 服务器、24 条 48G 6400M 频率内存和 NV 5090D 计算卡，支持 FP8、INT4 两种数据精度，在 FP8 精度下跑满血版 DS 能达到 21token/s 的对话速度，在 INT4 精度下则能达到 28token/s，最高支持 128K 的上下文，售价 14.9 万元；此外，行云集成电路还将推出 " 大杯 " 褐蚁 HY70、" 中杯 " 褐蚁 HY50 两个配置版本。

季宇团队表示，行云通过对推理引擎的独家优化提升了推理效率，是国内首个在 10 万价位提供满血 FP8 精度模型 20+tps 速率的一体机产品，并且可配置各类调用大模型 API 的应用。

据悉，行云集成电路成立于 2023 年 8 月，其核心团队主要来自清华大学及全球顶尖芯片公司，致力于研发下一代针对大模型推理场景的高效能 GPU 芯片，创始人包括季宇，以及公司 CTO 余洪敏。

其中，31 岁的季宇是清华大学物理本科、计算机体系结构方向博士，也是 " 华为天才少年 " 之一，主攻体系结构、AI 芯片方向。而在华为期间，季宇曾是海思昇腾芯片编译器专家，负责多个昇腾编译器项目，同时作为研究科学家，展开 AI 编译器领域和处理器微架构域诸多挑战性问题攻关；类脑计算机体系结构《自然》论文共同一作，中国计算机学会 CCF 优博奖获得者。

2024 年 11 月，行云集成电路宣布完成总额数亿元的天使轮及天使 + 轮融资，投资方包括智谱 AI、仁爱集团、中科创星、奇绩创坛、水木清华校友基金、嘉御资本、春华资本、同创伟业、峰瑞资本等机构。

季宇早前表示，当机器的门槛低到消费级可以接受的成本，边际成本承担的商业模型也会发生变化，带来进一步的产业繁荣。如果计算机体系能支撑消费级可以接受的价格享受极致的 AI 体验，大模型产业会进一步进入一个类似软件行业零边际成本的超高速爆发期。

事实上，目前多家芯片、服务器、云计算、运营商、AI Infra 等领域的公司都发布了 DeepSeek 一体机产品，堪称 " 百机大战 "，但其中可以运行满血版 DeepSeek-V3/R1 模型的企业并不多，目前国产 GPU 芯片层面主要有壁仞科技、摩尔线程等。

据第一财经引述券商数据，预计到 2027 年，国内一体机的市场规模将超过 5000 亿元，超过 30 家企业已向市场推出了一体机产品。

一位行业人士早前对钛媒体 AGI 表示，一体机核心解决的是部署易用性问题。相比复杂的云计算解决方案，项目落地周期更快、私有化安全性更高、价格更有性价比，但 DeepSeek 一体机比较大的问题在于持续维护、升级以及大规模数据调度等，以及一体机综合使用成本没有办法复用。

" 从当年数据库年代，一体机就兴起，这个大家非常喜欢，但不同的一体机，里面的东西差别是非常大的。DeepSeek 出来以后，DeepSeek 一体机爆火，我跟一些领导也聊过，数据中心算力这块卖得特别好，但都是短期租赁，因为本身硬件固定资产的年限也就 4 到 5 年。所以，我们可以看到一体机比较大的问题是以后持续性的维护、升级以及大规模数据调度等，比如 DeepSeek 一体机是很新鲜，但是大模型演进非常快，现在 DeepSeek 已经不是最领先的了，其他公司也能升上去，而客户本身可能根本没有这方面的技术能力。" 上述人士表示，推理一体机只是过渡态产品，最终大模型还是要和云计算进行结合，当整个技术成熟以后，跟多云整合，最后会变成云平台的一部分。

对此，在季宇看来，现在一体机依然能够跑得动超大杯的 MoE 模型和 30b 当量的 dense 模型，后续模型迭代其实还好。据悉，相比其他一体机产品，行云集成电路的 " 褐蚁 " 在显存、KTransformers 等层面有更多的技术研发能力。

据钛媒体 AGI 了解，下一步，行云集成电路将自研 GPU 卡，持续带来更低价格，更高 tps 体验，并且还将实施由 30 台褐蚁一体机组成的 " 蚁群 " 方案，进一步发挥分布式系统优化能力，或将支持 500-1000 的有效并发数，而价格有望降至 300 万 -400 万元——低于英伟达 HGX H200 集群的整体硬件成本。

钛媒体 AGI 分析认为，从整个商业市场的视角来看，当前国内有很多人都投身于一体机、AI Infra，以及 GPU 服务器等类似算力 " 卖水人 " 工作。随着推理模型技术迅猛发展，大规模算力投入被质疑，所以国内 AI 算力行业是否将如同 AGI 基座模型市场一般，经历大浪淘沙后最终仅剩下大厂及头部的几家企业，还是说依然会有更多人 " 卷 " 性价比，这一点仍有待进一步观察。

根据规划，季宇的最终目标是：为 AI 构建 x86，目标是让 AI PC 与互联网底座重回组装机模式（PC 及服务器），将组装机打造成 AI 基座，低成本搭建高端大模型，激活 AI 服务器组装机体系，让大家能组装出支撑高端 AI 应用的设备，带动体系运转。

（本文首发于钛媒体 App，作者｜林志佳）