首页 > 综合

远见丨走进AI“中度时代”，后浪来袭（一）：大语言模型的“未来猜想”

本期话题：今年政府工作报告指出，持续推进“人工智能 ”行动，支持大模型广泛应用。年初，中国大语言模型DeepSeek引起全球科技界高度关注。AI“中度时代”，大语言模型在工作生活中，有哪些实质效率？DeepSeek们“后浪压巨头”，是错觉吗？“全网寻找梁文锋”现象背后，AI时代的舆论传播规律和创业者精神，发生了怎样的变化？

本期嘉宾：

清华大学人工智能国际治理研究院副院长梁正；资深媒体人、光锥智能创始人王一粟

DeepSeek的实用体验，“碰撞过程”大于“结论结果”

思远：这两天，刷到几个有趣的新闻——北京和上海很多律所已经把DeepSeek接入工作内网，据说很好用，甚至一些简单案件，DeepSeek的处理又快、又准、又好。对此，有律师表示“这不是抢饭碗，是砸锅”。前段时间，DeepSeek公布R1模型的成本和收益，每天赚346万元，理论利润率能达到545%。你们日常中，对语言大模型的落地的效率和成果怎么看？

一粟：我是新媒体从业者。日常工作中，用得最多的功能是查资料，其次是撰稿，模拟写一些文案。在视频制作中，也尝试一些“一键生成”的功能。前两年，大模型能做到更高效地查资料。DeepSeek出来后，推理方面的能力大幅提升了，能在深度思考上提供一些灵感启发。比如说写采访提纲，以前写提纲至少需要一个小时，DeepSeek可能几秒钟就能写二三十个问题，虽然其中大多数问题用不上，但有几个能给我启发，就比较好了。

不过在稿件写作上实用性较差，内容套路化比较严重，跟我们实际想要的还差挺多。很多人认为，媒体行业会被DeepSeek这些大语言模型颠覆掉，但目前状况看，大模型对原创类报道的影响，更多体现在“助力”上。未来大家在各行各业，都要努力地用AI让自己变成“超级个体”。

思远：同意。我工作中，与大模型协作时，感觉它的思考就像一张网，“啪”地一下就散开了，形成思维导图。做内容的角度、架构，一下就撑起来了，但再用我的专业视角细看，确实存在数据的“纯度”、准确率问题。仔细看是有一些“坑”的，需要查重、验证、判断。梁正老师，听说清华大学现在各个学院都在AI侧“赛跑”，你的感觉怎么样？

梁正：同意两位的观点。DeepSeek出来以后，能力提升主要是在逻辑推理上。我现在非常鼓励研究组的同学们都去用它，答案本身不重要，但给出答案的过程，对我们教学来讲非常有帮助。说到实用性，举个例子——现在是在基金申报季，比如说人文社科的一些学者，某种程度上比较感性、思维比较发散。但有这个工具后，帮他们把发散的思维和观点结构化组合起来，让别人理解起来就更容易、更高效了。

DeepSeek们“后浪压巨头”，是错觉吗？

思远：说到大语言模型，前两年大家谈论最多的是ChatGPT，也是互联网巨头，寄希望于这样的公司去追赶它，但是今年开始DeepSeek似乎在舆论上有种“后浪盖过巨头”的声量和风向，这是事实，还是一种错觉？

一粟：从科技发展规律上讲，颠覆式创新永远都在小公司发生。大公司里，可能只能发生一些常规创新、阶段性创新。有一本书叫《创新者的窘境》，这句话在整本书中是有体现的。

梁正：如果我们回过头去看，为什么OpenAI能够异军突起，而不是谷歌？其实Transformer这个架构是由谷歌提出的，但OpenAI走了一条别人没走的路。DeepSeek绝对是颠覆性创新，但并不是颠覆性的技术。它把现有的技术做了极致的、高效的、低成本的组合——所谓技术的应用化、普及化、开放化。所以，我觉得这不是偶然现象。例如《黑神话：悟空》火了，就是基于市场的需求、丰富的场景，去推动了一些在市场竞争条件下的创新产生。

思远：未来，这些AI大模型的“后浪”会一直这样保持领先吗？

梁正：小公司在这种“突破性路线不走寻常路”、开拓性上有天然的优势。就像DeepSeek都是一些年轻人，公司管理也不是层级化的，“奇思妙想”也可以得到支持，这在大公司很难。但是，真正进入到大规模商业化阶段后，大公司是更有优势的，资源、组织能力、市场化渠道等。在一个产业真正进入到大规模商用阶段后，大公司会收购一些创新型的小公司。其实，上一波OpenAI同时代的小公司，很多已经被收购了。这并不是什么奇怪的现象，是有一定规律的。

从“全网寻找梁文锋”，看AI时代的舆论规律和创业者精神

思远：今年以来，媒体圈都在“寻找梁文锋”。DeepSeek火了以后，各家媒体都想采访一下梁文锋，但目前为止都无果。不只是梁文锋，其实很多AI公司的年轻创始人，都极少出现在公众舆论视野中。反观10年前的创业潮，电商、本地生活等领域的互联网创业者，都特别热衷于向公众发声。这种现象的差异，你们怎么看？是创业者的性格使然，还是AI技术比较抽象，普通人难懂，所以曝光少？

一粟：我觉得是两个时代的底层逻辑在变，移动互联网时代，技术的颠覆性不够强，本身还是商业模式的创新。所以，从项目的创立，到为了让项目落地，寻找融资进而商业化，这都需要大量的公众关注。但现在这个年代，很多硬科技的公司，更像是隐形冠军，在某一些小的领域里面，技术壁垒很强，技术创新很强。2024年豆包投了几千万的广告费营销宣传，结果DeepSeek产品出来后，下载量立刻超过了豆包。技术创新，在这个时代的影响力和结果，是远超其他因素的。这也是这个时代很多低调的隐形冠军存在的原因。

此外，媒体的时代也在变化。比如，宇树科技这家公司，其实跟媒体走得并不近。但在社交媒体如抖音、视频号上，有关他们机器人产品的视频，火热程度非常高。所以，他们一定程度上不再特别需要通过传统第三方媒体的形态，去刻意传播。这个现象背后，也体现出媒介形态的变化。

大模型“开源闭源”路径之争和商业前景

思远：DeepSeek是今年大语言模型的代表性案例。2024年，有位知名投资人说，未来中国没有独立大模型的公司——因为没法挣钱，商业模式就不成立。他明确说，“绝对不投国内的大语言模型”。但今年，这位投资人又对外说“如果DeepSeek开放融资，我们必须投资，价格不重要，参与它很重要”。未来，中国大语言模型的技术水平、商业路径和发展前景，两位怎么看？

一粟：我觉得中国大模型现在肯定已经走出一条自己的路了。DeepSeek是一个非常典型的代表，延续着现在主流的技术路线，但又在提升效率、降低成本和工程化上，做得非常极致。现在，“中国制造”要变成“中国智造”了，技术和成本上两条腿在走路，这就是中国特色的大模型。

思远：关于大模型的最终技术路径，一直有“开源”和“闭源”之争。很多中国大模型公司，既做开源，也做闭源，梁老师怎么看这样的现象？

梁正：个体公司两条腿走路，只是阶段性现象。长远看，行业一定会形成两种竞争性生态。“封闭”的生态，会让协同性更好、在细分市场上创造极致的体验；“开源”的生态，更有生命力，更广泛和多样化。现如今，行业还处在创新的转换阶段，未来会随着产业的进一步发展，阵营逐渐分化。

一粟：同意梁老师观点。DeepSeek前段时间开源后，给大家造成一种错觉“是不是国内大模型不开源就没有活路了？”但其实开源和闭源是不同的选择、不同的生态路线。要做开源，就要纳入更多开发者，让整个生态往前走；要做闭源，就要自己把产品造得更好、自有特色足够强，让市场去买单。这个道理，其实在所有传统IT里，无论数据库、服务器、系统芯片等，道理都一样。这个命题，并不是在大模型时代才有的东西。

从管理视角，看大模型的政务决策风险

思远：关于AI和大模型，世界范围内大家都在讨论技术、法律和伦理上的风险。大模型在防范风险方面，老师怎么看？

梁正：DeepSeek等推理大模型的出现，确实带来一些新风险。之前，我们都说大模型的幻觉问题、真实性问题、准确性问题。但现在可能我们在一些政务服务、政府决策等方面有新的风险，比如深圳的AI公务员，实际上把AI的一些强大能力、推理型模型应用到管理决策中的话，会带来一些隐患，因为我们知道，模型是不可能承担责任的。

之前，我们在自动驾驶领域讨论更多的还是人身安全问题。但在社会管理领域，现在亟待出台一些管理规范。随着模型能力的提升，从感知、认知到决策，一定会提出新的问题和挑战。看到大模型积极方面的同时，也要在安全、伦理等方面予以应对，未雨绸缪。

作者：总台经济之声财经评论员、【远见】栏目制作人王思远