近日,创投圈知名自媒体42章经邀请澜码科技创始人兼CEO周健做客播客栏目。在播客中,42章经创始人曲凯对谈周健,探讨了AI1.0时代和AI2.0时代的异同、各种AI ToB领域的核心问题,以及过往创业公司经历对今天创办澜码科技的经验支撑和借鉴意义等等。
关于AI1.0时代和AI2.0时代的异同,周健认为今天大语言模型时代跟过去CV“四小龙”时期很不一样的创业生态在于,当年CV“四小龙”需要自己端到端打通场景,但今天大语言模型价值链长、生态角色更加丰富,大语言模型厂商在价值链上提供的是偏底层的技术,横向整合还需要有应用方或中间层,帮助它将大语言模型技术连接和落地到各行各业中,AI2.0时代的商业模式因此更复杂。
周健也真诚解答了当下许多广受关注或争议的话题,比如“传统RPA与大语言模型时代的流程自动化的区别是什么?”,“国内AI落地大语言模型的一些场景和局限有哪些?”,“国内ToB领域创业是否还存在结构性机会?”,“创业过程中如何判断和决策社会非共识的事情?”等等。
https://www.xiaoyuzhoufm.com/episode/65febe0b1519139e4f1d717f(链接为播客音频,可点击收听📢)
我们将精彩的对话内容做了不改变原意的整理,分享给大家,以飨读者:
42章经:我们今天很高兴请到了澜码的创始人周健,澜码是去年很多人提到的,且是AI+ToB领域里面很知名、很有代表性的一个项目。周健是2002年首次在ACM获得冠军的亚洲团队成员,后面加入了美国Google等。曾经是AI“四小龙” 公司依图的十号员工,后来在弘玑RPA做CTO,去年开始创办了澜码科技。你可以先给大家简单介绍一下你核心的一些经历。
周健:学生时代拿冠军的经历算是一个光环,一毕业李开复老师就把我招到了谷歌,我很快就去了(谷歌)美国负责整个中文网页的搜索质量的调优,在美国做了两、三年之后,王坚博士从微软去了阿里巴巴,所以我是阿里云的创始团队之一,负责整个阿里云底层存储,是第一个团队负责人。后面在AI1.0时代做AI产品和AI工程,然后在做企业服务中业务流程自动化的公司做CTO。
42章经:你当时怎么想着创办澜码?你正好是去年初的时候出来。
周健:下决心其实就是ChatGPT出来的没几天,因为本身也觉得业务流程自动化是一个需要被解决的问题。今天有了大语言模型之后,就有一个通用性的技术,而且十分便宜、可获得,技术可实现性高了很多,所以值得去重新做一遍。
周健:时间是(前面几段工作经历中)最长的,应该是有六、七年的时间。
42章经:基本上经历了它早期最快发展的几年,是吧?
周健:是的。
42章经:当时我们叫CV“四小龙”,现在正好大模型也剩四家,MINI Max,百川,moonshort,还有智谱,阶跃星辰今年可能后面也会有时间听到这个名字,但不知道他们后面会怎么样。但现在水面上基本上大家也觉得就这几家AI,也有人不看好大模型的这一波,会讲到当年的“四小龙”的故事,说融这么多钱,最后从商业结果或者回报上来讲也不一定有一个多好的回报。因为你正好经历过当年那一波。
周健:我觉得 AI1.0主要还是在所谓的计算机视觉,计算机视觉里面实际上是第一个开始证明我们可以用一些不像过去那种传统的、很重的方式去解题,解人脸识别也好,OCR也好,或者说各种工厂里边生产线上的质量检测也好(的问题)。
但是我自己觉得,CV不是一个通用性的技术,它在企业内部基本上都是点状的,你很难去拿到一个面状的东西,依图我觉得已经找到了一个所谓的PMF(产品与市场匹配度),在安防里边找到了一个场景,随着技术不断的演进可以有新的场景不断的(被)解锁。
因为新场景的解锁,作为技术领先方就能够要求高毛利,但是当时可能只在安防行业里边有这么一个机会,那么这时候实际上商业模式上就没有带来变化的可能性,随着技术到达天花板之后后继乏力,这是我觉得当年AI1.0 时候的一个最大的问题。
现在会有一个很大的区别,首先(技术上)它突破的是自然语言理解,在GPT的角度上来讲,它是个通用性的技术。因为文字在各行各业、各个职能、各个功能上面都会有,当然有先的跟后的,但是各行各业其实都能用上这个技术进步。我们认为,大语言模型把算力和数据变成了一种智力,我们能把它变成一种生产力,或者说能把它变成一种专家时间,这时候实际上它的适用面在加大以及它有可能带来商业模式的改变,因为技术还在不断的演进,这两者其实是兼有。这时候我觉得会打开一个新的跟过去(AI)1.0时代很不一样的地方。
当然对于大模型公司来讲,今天跟CV“四小龙”时候又会不一样的地方在于,当年CV“四小龙”还是自己需要端到端场景打通的,但是今天大语言模型厂商在价值链上仍然是偏底层的技术,在横向的整合,还是需要有应用方或者中间层,帮助它接到各行各业去。
就像现在ToB里做的最深的智谱,已经有好多行业头部企业找到它,那它基本上不可能有能力把所有的客户都服务完,这时候实际上是有一个生态位的,竞争会变得更复杂,很有可能大模型领域公司的竞争是要以生态链为核心来竞争的。
42章经:我也同意你刚才讲的 AI1.0的时候只有CV这个落地场景,就很垂直,肯定不如现在整个的AI大家想象当中的大,但至少CV“四小龙”还是有很多实际化的商业订单跟收入的,但现在的这些大模型还是基本上很少的,智谱还是有些收入的,其他几家应该就更少了。
周健:对,现在其实两种。一种就是ToB,ToB现在其实我觉得比较valid有PMF的,是代码相关的模型,我觉得这是有PMF,GitHub, Copilot,包括现在智谱也有代码生成模型,包括可能跟PRD(产品需求文档)之类的,这个价值是算的过来了。其他所谓的知识问答、指标查询、任务完成、流程提醒,我觉得有价值,但是它跟现在需要付出的成本比起来,账还是算不平。所以现在更多的还是政策在引导大家去积极拥抱这个东西,而并不是说真的是已经到了能够提供商业价值超出成本的时候。
42章经:我听说当年商汤其实他们有个策略,要把所有的钱都拿了,把所有好的人都招过来,然后再慢慢的去发展,我前几天看了一篇文章觉得他讲的挺有意思,他说现在包括过去好多年整个市场其实不是面向用户,而是面向资本,就是有点垄断资本的发展路径。
因为如果这些公司这么缺钱的话,市场上其实能给到大钱的机构可能也没那么多,机构很多时候也会站队,给完A就不会再给B了。当年“四小龙”也有这个情况,现在其实这几家大模型我觉得也是这样的,最后还是说大家先把最多的钱拿了,然后再去慢慢发展。
42章经:你从依图出来就去弘玑,弘玑那两年RPA也蛮热的,你能不能用简单几句话给大家解释一下RPA?
周健:RPA就是相当于运用一些技术能够模拟人对系统的操作,它最核心的一个技术能力就是原来用户鼠标点击了屏幕上面某个应用的一个button(按钮),那么RPA其实就是有一系列的技术使得下一次屏幕上只要有这个应用,我还能选择对,并且去点击进去,相当于是个爬虫的高级版。
过去爬虫如果是网站的话,你需要去写很多复杂的程序才有可能做到这个事情,现在只需要你去点一下,它就可以模仿你的点击操作。有了这个能力能够解决的是,原来数字化转型时,很多员工需要填写数据,需要在不同的系统里作为数据的搬运工,现在就不用了,他可以靠机器人重复性的帮你去做这些“搬运工”的事情。
42章经:这个东西听起来也没有什么壁垒,好像也不是多AI或者多技术突破的事情?
周健:对,我觉得它更多的是经验性。因为不同的行业用的IT系统的程序框架有一点不一样,所以你必须都“磕”过去。每个行业的特殊性需要靠这个技术一个个去解决掉,所以当你做过很多行业的时候,你的效率就会比别人高。
周健:对,是一个经验性的技术,而不是一个深度的技术。
42章经:我前两天看新闻说OpenAI在做一个手机端直接用Agent模拟人的操作,点开APP做什么选择,这个和桌面端还是挺不一样的,好像难度更高一点。
周健:我们尝试过在移动端去做这些,(但)因为移动端的操作系统,特别是IOS有很强的封闭性,去做这样的一个操作模仿可能是比较困难的。但是我也知道有一些技术会用服务器去用虚机模拟出来手机端,因为它本来是虚拟出来的,所以很多权限的问题其实可以被解决掉。实际上OpenAI,包括国内的腾讯、阿里,包括有一家创业公司叫Adept.AI,其实都在试图解决这个问题。
42章经:这个问题今年能解决掉吧?
周健:不确信,从Sora看起来,这件事情应该并没有那么难。因为Sora用的手段其实也是用一个真引擎去生成数据,然后去学会背后的那个模型。我觉得本身低代码之后各种APP已经是有这样的工具了,所以OpenAI用这样的技术路线,用“暴力”把这个问题解决掉,我不意外。但是因为Adept.AI本身已经拿了三、四亿美金了,还有先发优势,在这个问题上Adept.AI是先做的,那么为什么Adept.AI一直没有放出一个产品?它本身的科研实力也不弱,它也是OpenAI的工程副总裁出去做的,所以我不确信。
42章经:因为这个事如果能做,相当于OpenAI不需要跟各个商家去谈合作了,我也不需要接你的API,今天你在OpenAI里面说我要点个外卖,它就直接跳出来帮你打开一个外卖APP,帮你点了就好了。
周健:我其实很意外过去一年国内的大厂并没有互相竞争,因为在我看起来其实不同的应用,比如说携程、滴滴、美团其实是有很多连接在一起的,比如说我要出差,那能不能帮我把机票、酒店、出租车、餐厅都能订好,我不需要在不同的应用之间去换来换去的,但是迄今并没有出现。
42章经:这个主要是资源和利益上的问题,你真的要打通这么多资源方,要做延伸。
周健:对,但是这件事情明显是有它的价值,工程量肯定不小,或者说会需要商业上的连接,确实需要做很多事情。但是价值上把别人推到你背后去的一个工作,大家对于入口其实是应该要去竞争,也有可能大家觉得这场仗一定要打,但是也不想先挑起来,就像当年移动互联网出现之后,滴滴跟快滴的背后是阿里跟腾讯,大家其实也是等了,2007年iPhone出来,一直到2013年、2014年才开始“打架”,所以可能确实是需要一些时间。
42章经:讲回来RPA这一块,过去一年里面也有蛮多人在讲述,RPA和AI是一个特别好的结合,你怎么看这个?
周健:我觉得其实并不对。因为RPA更偏跟系统之间的连接,它最大的问题是对处理的数据并没有理解。但大语言模型最擅长的是对文本进行处理,就是现在的Low-hanging fruit更多的是在文档处理,就是所谓的知识问答以及指标查询上面。
所以RPA本身实际上跟AI的结合,当前为止我看到的厂商基本上都只是在做RPA实施流程当中的提效,这个其实就只是它内部的事情,跟外部的人关系并不大。RPA过去主要解决的还是任务自动化的问题,就是这个人知道应该怎么做,他今天只是不想要这么tedious的一步步去干,这是RPA解决的问题。
原来RPA也讲过要做增强自动化,我们相当于要能够有专家知识去赋能基层业务员工,这个过去是很复杂的、不好做,现在因为有大语言模型,专家可以很容易的把他的知识灌输给AI Agent。
流程自动化也是一样的,所谓的流程其实在任务多的时候,就是人与人之间的协作。那么人与人之间协作,如果你不能理解语言,你根本就没有办法去代表人去协调、去对话。所以我觉得RPA已经不重要了。
42章经:我也听人讲过AI其实低代码这一类好像就都不太行。
周健:其实不是说它会消失,而是说它的天花板被封住了。因为蛮明显的一件事情是说其实Java、Python、JavaScript这些代码其实不应该有大量人再去写了。我们应该是慢慢有点像当年数据库会出来一个SQL,我们其实就应该出来一个类似的声明式的语言去把这个问题以及怎么解决的步骤可以去描述。至于它是怎么实现的,它用RPA、还是低代码、还是BI,还是用其它的大语言模型的prompt,都应该由机器去决定。人应该更多的去说的是问题以及它的解决的思路,而不是怎么去执行这个事情。
42章经:但我觉得核心问题是现在AI还没到那一步,所以大家发现用一些原来已有的技术,加一点点AI,AI其实在里面可能占比都不高。
周健:在C端的应用可能这个逻辑是正确的,但是在B端的应用来讲其实不是。在ToB里面,实际上现有的技术已经达到了,只是说现有的开发厂商思路的转化,包括去探索、去摸索需要时间,并不是技术没到,是探索没到。
42章经:所以你们更多的还是站在下一代的ToB产品对应该会是什么样子来做这件事。然后你从依图跟弘玑这么多年的这些经历来讲,有哪几件事是你觉得当年总结的一些经验教训,现在又可以用到这个创业里面?可以分享某几个比较典型的吗?不管是融资、商业、招聘、管理等等都行。
周健:一个是在依图,因为(依图)是一个技术驱动的公司,所以我们当时在自己公司内部很enjoy自己的这种成长。
42章经:有点那种科研的感觉。
周健:对,我印象很深刻的一件事情是在2018年的时候,我们的人脸识别技术,在演唱会(抓逃犯)的场景在很多的城市达到了PMF,所以那年是十分兴奋的状态,包括年终奖也发的很好,春节之前的一天,突然老板拿来了几个国家标准,发现海康威视在这个领域里边已经制定了国家标准,本来依图是准备后面要去做很多东西的,海康威视用它的办法把它给设定住了。那件事情给我的印象十分深刻,人家根本不跟你在你的战场上面去“玩”,人家就挑了一个自己擅长的,因为它作为大公司可以动用的手段、社会资源比创业公司多很多,所以从这个角度上来讲,它其实是可以去解决掉这个问题的。
42章经:就是说当你到达某个体量以后,其实就不只是拼技术了,它是一个综合商业的竞争,最终发现最大的竞争者不是“四小龙”之间,而是海康或者其他的一些公司?
周健:对,那时候应该是没有商业模式的认知,但是就是开始去被告诉原来是这样的。
42章经:就像我在想现在做AI这一波,最后可能发现最大竞争者可能是浪潮或者其他的这些(公司)。我也发现,尤其是一级市场比较中早期的投资人和不太有经验的创业者其实是相对比较单纯的,或者比较理想主义,觉得我们有个很好的技术,能解决这个需求就可以了,但实际上越往后走越发现这个世界是比想象当中要复杂很多。
周健:这是一个。然后第二个教训其实还是关于组织的规模和状态。
42章经:你是第十个人,对吧?依图最后是多少人?
周健:最高的时候到过2000人,我离开的时候应该是1000多人。其实能够看得到,组织一开始十分有活力,CEO跟一线员工是十分近的,在过程当中能够看到CEO采取了很多的手段试图去解决组织的增长带来的熵增,但是等它到一定的时候之后你会发现,一个创业其实要成功,它的时间一般不会少于七年、十年。
最一开始,所谓的老兄弟肯定有他的弱点,他会跟不上这个公司的发展,就会引入其他人才。那些职业经理人第一他没有0到1的经验,都是拿成熟体系里的经验,就像一直开玩笑讲的“电梯往上走了,可能会有人认为做俯卧撑使得电梯往上走。那这些人进来了之后,你怎么样去用好他?”
第二,对于职业经理人来讲,某种程度上就叫做一个是“雇佣军”,一个是“子弟兵”,雇佣军就是来赚钱的,那怎么平衡好“雇佣军”跟“子弟兵”之间的关系?因为Upside 的时候都没有问题,Downside的时候职业经理人是很容易走掉的。那么这时候其实是靠老兄弟作为“压舱石”的,如果有些没有处理好的话,老兄弟就会走,走完之后整个组织的基石就会受到影响。
所有的企业一开始的时候都是高速增长,在高速增长进入稍微平缓的时候,踩刹车的时候其实就是十分难的一个关。今天我重新创业,现在我在想的是怎么样能够飞起来,但其实如果带上这个势之后,问题就是怎么样能够平缓的去landing,或者说怎么样能够做到现金流为正,这个是公司必经的一个路径。
42章经:这个有一点像这个整体的对节奏的把控,我觉得包括融资节奏其实也是很重要,以及招人的节奏。
周健:是。我觉得创业是特别有意思的一件事情,看似有类似性,但实际上难的就在于判断新的变化。所谓的创业就是在高度不确定情况下要高速增长,肯定是“赌”对了一些事情。有一些社会非共识的事情,你认为是这个样子的,但是它本身是一个什么尺度的事情,它会因此给客户、社会包括技术产品会带来一些什么样的变化?其实这是难(判断)的。虽然我已经经历过AI深度学习的那一波,RPA的那一波,现在已经第三回了,但是第三回的感受跟前两次的感受是不一样的。
比如说像我的品牌,在去年花了至少有20%到30%的我的时间。在过去的经历里边这个其实不对的,就是说你这么花下去效果不会那么好,但现状是确实很多的央国企通过邮件找到我们了,就说明我“赌”对了。这个趋势是大到这个地步,全社会可能都会对这件事情感兴趣,所以这里确实是有意思的地方。有那么多慢变量,社会本身的反应,技术成长的速度,行业merge的水平,甲方自己本身变化速度。每一次其实都会有不同的速率,那么你怎么样能够感知到这个温度,并且能够提前预判、能够做出准备?这个我觉得是挑战的地方,也是有意思的地方。
42章经:从市场上,我觉得你第一段依图其实是市场还是挺好的时候,而且是有很大的热点,但你做的事情我觉得还是拿榔头找钉子,至少在开始阶段的时候,弘玑其实也是市场很好,但是更偏工程落地,是肯定能落地的。
周健:就是做商业化拓展的问题,怎么去扩收入、怎么去做毛利率的事情。
42章经:对,现在的这个AI市场热点虽然很高,也有点拿榔头找钉子,这个榔头好像还不太好用,所以我不知道你整体对于现在市场环境什么感知?
周健:这次的区别在于说大家都特别热情,大家都特别想要去参与这件事情,过去RPA没有。比如说像我刚创业的去年的上半年,我其实通过各种关系很容易就见到了十几个上市公司的CEO,他们就特别关心大语言模型。
42章经:这个我也有感受,去年是我认识上市公司CEO最多的一年。
周健:整个感觉是所有的人都动起来,所以它的变化速度很快。本身外部的新闻实际上也会引起巨大的一个变化,就像Sora,实际上是有很大的变化的。在这些事情上是跟过去很不一样的情况。
42章经:但我感觉大家动起来以后,虽然是热情,但热情都是说大家都动起来,然后坐在这说,OK,我们开始聊吧,到底能做啥?聊半天不一定能聊出来能做啥,热情很难转化成实际的落地。
周健:所以这里其实就是要去分辨,哪些可能只是在做培训、在提高他的认知、免费培训,哪些实际上是真的已经动心思想要去试了、已经下决心了。
42章经:但我这么多年看起来,我觉得ToB里面,尤其是在一个行业早期的时候,很容易就做成咨询加项目制的东西了,甚至有些时候这个是不可避免的。
周健:今天不一样的地方是他们会先投算力,投完算力之后责任或者压力来到了他们这边。因为对他来讲,给领导汇报说花了3000 万,然后领导问做了啥?如果说做了个企业知识问答,那就没法交代。所以这时候实际上对于我们这样的厂商,相当于是说算力本身其实应该是作为我们价值的一部分,那么今天反而是它会作为一个驱动的因素。
本来比如我们做一个应用要用10张卡,那么我就要向客户证明说我这个应用确实是能够把10张卡包进来,价值能够更大的(发挥)。那现状是反过来,现状是说客户已经有10张卡,如果我能把它现有的利用效率提升10%,那10张卡的10%的价值里边我就能去分,这个逻辑是很怪异的逻辑,可能只有在现在这个阶段,市场上才会有这样的需求,可能等到一年(后)我估计就没有这个事情了。
42章经:主要ToB,ToG是一、两单。
周健:对,主要是对的是央国企。
42章经:我有认识一些人挺有意思,他如果之前做了很长时间ToB以后他就不想做ToB了。他觉得ToB太累、太麻烦了。那你做了这么长时间的ToB,尤其是我觉得国内的偏SaaS和ToB的,在过去几年里面经历了好几波的波峰波谷,现在绝对是在波谷了。我记得2021年最夸张的时候,可能大家给 SaaS 项目的估值能到五、六十倍的PS,现在我觉得五、六倍的PS都是很合理的。所以你经历过这么多年,为什么仍然会坚定的选择做国内的ToB?
周健:第一个还是(国内外市场)有巨大的不平衡。在C端,虽然现在阿里、腾讯(市值)又降下来,但至少是跟国外的大企业,谷歌、Facebook是comparable 的,大概可能差三倍、五倍,但是在ToB其实不是,ToB这头 Salesforce、ServiceNow、UiPath,它们比较容易做到一个十分大的规模,100亿美金,1000亿美金,收入可能在100亿人民币以上。
但是国内今天这里是有一个巨大的gap的,这里反而是有机会的。我不觉得中国的管理水平不需要好的软件去赋能,过去最大的原因还是“Low-hanging fruit ”太多了,经济的发展很多时候并不需要问管理去要效应,现在地缘政治的压力越来越倒逼我们去更好的提高管理。提高管理很多时候其实要靠数字化的软件去解决这个问题。
所以我还是觉得在国内应该是有一个结构性的机会的,已经在做ToB的人其实都会觉得这里有一个趋势在。第一个对行业本身的判断。第二个是,ToB是慢了,但是ToB的好处是你做进去了其实也不容易“死”,只要维持着客户你就可以一直在里面解决他的问题。
42章经:ToB里面To大B跟中小B这个问题你怎么看?现在基本上国内的机构直接一听To中小B就否定掉了。
周健:我觉得还是国内的IT预算的分布的问题,基本上都还是来自央国企。今天 AI这一波还不成熟的时候,它的生产力不是通用性的。比如说我们现在做招聘,我们只能是针对招3到5年的工程师。那么这时候哪些公司有单个岗位是有重复性要去招这个岗位的需求,那就只有大公司,中小B其实虽然可能都是财务岗、会计岗,但是每个公司有它自己的特殊性,个性化定制的成本太高,今天其实还是做不到,今年已有的技术没有办法先从中小B开始做起来。
42章经:那你如果是To大B的话,一些私有化定制等等也还是绕不过去。
周健:对,这没办法,但是这里其实有一个好处。对我们这样的创业公司来讲是没有资本去买1000张显卡的。在大B里边他们可能已经买了1000张显卡,那我的产品在1000张显卡的平台上面锤炼过了,我就会比友商有领先优势。所以它是有需要个性化服务的部分,它也能换来产品的更多的enterprise的quality,所以至少现在看起来我觉得不亏,未来肯定从生意的角度,要变成一个毛利高的生意的角度来讲,可能是需要去探讨这件事,但现状其实更多的还是在怎么样去占领根据地的时候。
42章经:所以澜码过去一年里面,我听好多人讲从收入体量上来讲已经还不错了。所以你现在主要到底落地的是什么?什么是能打进客户里面去的?
周健:其实大家可能已经看到的应用场景是类似的,无非是知识问答、数据分析,自动完成一些任务,这是三大类。我们主要还是在做控制合成类的,我们没有在做一些生产类的,比如营销这种我们没有在做,我们主要还是在解决企业内部的、后台的一些办公场景,或者一些职能类的,像财务、HR类的办公场景,这个今天其实是蛮普遍的。
但是这里做这些东西它就变成了大模型应用,个性化定制的开发成本就会比较多。那对企业来讲,或者说对于央国企来讲,今天有一个刚需是企业级的管理,因为今天有个大的趋势是以CPU为核心的价值链会迁移到以GPU为核心。
拿银行举例子,它250亿的IT的预算,现在基本上都是在买CPU,GPU 肯定很少。现在为了这个大模型它一定会开始投入,我相信在五年时间之内,它整体预算当中的 30% 应该会切换到在GPU上面,从算力到模型、到应用、到中间件,这时候其实是有一个企业级(需求),就是怎么把过去 CPU 的那一套东西能够迁过来。
比如说最简单的那么多模型,那么多开源的模型,那么多付费的模型,那么多显卡,首先是应用跟模型的匹配,单应用单模型,单应用多模型、多应用单模型、多应用多模型。其次是应用本身的QPS(每秒查询率),财务的应用可能在月底用的多一些,HR的应用可能在春招、校招的时候用的多一些,这里的调度、编排其实都是困难的地方,这些东西甲方自己肯定不可能做,这个又不是大模型公司能做的,因为如果大模型公司做,它一定又跟自己的模型绑定了,所以这种功能甲方今天实际上特别看重。因为对他来讲那么热火朝天,各个业务部门、各个分行、各个总部的处室都会想要,可能自己也接触了各种各样的厂商,这时候如果我们有个统一的管控,后面我怎么办?现在因为讲了很多新质生产力,甲方肯定会讲这个是一个新质生产力、新的劳动生产对象,那它的治理、运营、培训怎么样去建设?这些其实都是典型性的问题。
如果只是投个30 万、100 万,我觉得可以不用考虑。如果已经投了一个亿、两个亿的单位,一定会去想这件事情。至少在我知道的很多的大行,像四大行、股份制银行投在亿这个级别买算力是蛮多的,包括今天大模型采购的这个标放出来基本上都是千万以上,对他们这样的投资规模来讲,他们要考虑这样一些问题,我觉得很正常。
42章经:那现在先做它内部的各种知识库等等,是不是主要还是因为幻觉的问题?就是内部可以更好的先落地?
周健:事实上在企业,特别是大的像银行、保险,比如说出差,有一个差旅政策变了,我去攀枝花,攀枝花算几级城市?它的那个政策(对应的报销)到底是多少钱?这些其实都是比较浪费大家时间的,包括有些专业性的保险产品的推荐、保险条款的回答,都是现在的大模型能够发挥作用的。
42章经:去年应该也有很多公司想做这条路径,但最后实际的结果跟收入应该跟你们还是有很大差距的,所以你觉得你们做的最好的一些地方是什么?
周健:我觉得一个是时机问题,我们去年2月份就出来了,出来我们就跟金山办公达成合作了,我们在只有3个人的时候就已经跟金山办公的Excel一起合作,他们有几十个人,我们有三、四个人,跟他们一起去做落地,怎么样用 GPT3.5 再做一个Excel Copilot,实际上这是一个真实的场景,而且他们确实是带着上线的目的去做。所以这里其实我比较快,一方面能够迅速的拿到 IDG的投资,另外一方面实际上对于产品或者说对于这个模型的边界什么能做,什么不能做,就比市场上其他团队领先了。
在 5月份、6月份的时候,我们心里大概已经清楚现在的模型能做什么事情,只是当时唯一的一个Delta(变量)是说不知道开源模型(因为LAMA2那时候还没出来),并不知道开源模型什么时候能出来、什么时候能用。后面的三季度、四季度其实也就是在应用不同的开源模型到企业内部的场景当中,所以我们在7、8、9 月份包括后面四季度,已经做了很多的Poc,那时候先摸情况,各行各业的、零售的、电网的、政府的,包括像银行的、保险的、券商的可能都在做,其实就是想摸一下各行各业对这件事情的感知是什么样子。那么现在其实就又可以收回来说,我们在银行里边应该要去认真去做,然后我们央国企里边要再去做一些可能跟财务、业务相关的事情,那这些其实都是一步快,步步快。
42章经:你们在面对客户的时候会遇到智谱或者一些其他云厂商或者各种竞争吗?
周健:大模型(厂商)几乎不竞争,但是跟大厂会有。
42章经:你看之前有人提说就是你做大B的问题,它里面还是有各种BD资源这些因素在的,对吧?
周健:大B的价值链条特别长。
42章经:但我觉得这些像你说的,你全接触那些上市公司老板或者一些银行体系的,可能之前你们应该也不太有这么多的积累吧?
周健:我现在的商业化团队过去其实是也是一直在做的,所以当我们知道某一个甲方有这个需求的时候,我们就能反过来去找到人。本质上是现在假设说没有这个主动Inbound的线索的时候,我们并不知道哪个客户今天是什么状态,但是等到它Inbound进来的时候,我们就知道它已经到了这个状态。这时候再发动我们的资源,它效率就会更高一些,其实是一个配合的过程。
42章经:所以其实还是利用到非常多你之前依图、弘玑等等的一些经验跟资源,那也很合理,“四小龙”毕竟还是有非常多的认知、资源和人才,你们现在其实核心对外讲的一个技术就是Agent的这一块,是吧?
周健:我们其实现在就是在用AI Agent的技术做到业务流程自主化,过去其实用RPA技术,现在相当于用AI Agent的技术来解决这个问题。
42章经:但我们刚才提到你不觉得RPA加AI是个好的解决方案,所以其实你现在做是有点“迭代”你之前做的那个?
周健:现在我认为能够到达业务流程自主化,很重要的是Agent要有一个环境感知能力,它要能够对企业内部的,类似于像各种数据的变更、文档的替换新增,包括应用流程的变化,能够有感知,能够把它作为它解决任务的上下文,而不是说要人主动的告诉它,你去立项看看我下周有些什么行程,应该是它自己就会去做。
那么这样的话它就会个性化、千人千面,就比如说像我们也有客户说能不能通过客户拜访记录生成一个客户画像,然后根据客户画像、根据标准销售话术生成一个特定的销售话术,类似这些其实是自主化的能力是planning 能力、to use的能力,包括怎么样有长、短时的记忆,因为有些信息是需要被遗忘掉的,比如政策更新了,那么这其实是现在的技术突破点。
周健:这个就需要列出来,跟它说是a、b是这个样子,然后你自己看着办。
42章经:反正他因为你不是对外部客户的直接交付就还好一点,然后Agent的这个事,其实从去年那个ChatGPT出来就变得特别火,一堆人讲要做,投资人也都去看,最后好像实际能落地的非常之少,你操作起来觉得这个到底里面的问题是什么?然后现在发展到什么阶段了?
周健:现在已有的模型都是预训练,预训练的问题就在于,它基本上只能学习原始准备的语料当中的经验知识。举个简单的例子,你只通过文本跟视频是学不会游泳的。这里实际上是很大的问题,因为AI Agent十分强调对世界模型的理解,你要自主地感知这个环境,你自己能够去决定怎么样去处理各种各样的事情。那么这件事情上今天其实是在已有的架构上缺失的。
我们现在在做的业务流程自动化,我们就觉得需要赋予它一个能力,它能够去做一些实验、能够去主动观测,比如说销售、客户问一个问题,要看你怎么反馈,从而能够去将自己对这个世界的理解,适配到当前更精确的一个状态。
我最近发了一篇文章,业务流程自主化还缺一个精确的世界模型,今天大语言模型是“文科生”,企业内部有大量的数据,就比如说武汉地区 Java 工程师的薪酬空间是多少?你怎么propose一个薪资?这个事情都不是现有的大语言模型能解决掉,所以实际上是我们在做AI Agent的时候,一个是感知环境,怎么能够知道上下文变了,第二个是怎么跟传统的大数据、更偏数值类的经验知识结合在一起。
这个是至少在我所说的这个领域里面要做好AI的所必需的两个环节,我们其实也是在这两个方向上不断的在努力,在构建这样的模块,包括跟已有的模型(适配),因为本身模型其实也是一直在变,变得太快了,就不像过去可能出个数据库,出个MongoDB,那就用MongoDB就好了,现在不断的在出新的模型,你不断的要去适应,这个是今天对我们中间层的挑战。
42章经:那Agent的这一块的那个算力跟成本的问题呢?
周健:现在这个其实我觉得还比较早期。一方面是说大模型自己其实也在优化它的成本,另外一方面对于最大的模型,比如像GPT-4,我们在SaaS端一块钱人民币大概只能处理一万个汉字,但是在私有云部署这一端,如果我们用一个6B或者13B的模型,一块钱大概能处理200万汉字,所以这个成本差距很大,那么这里现在本质上还是应用阶段,现在还没有完全打通,我们在单应用情况下面是有一个优化的算法的,但是在多应用(下)怎么样去调度不同的算力这里,其实还没有实践经验,我觉得还需要再有3-6个月时间。
周健:我觉得应用应该会爆发,特别是ToB,今天不缺什么,不需要新的、更大的模型出现,应该是已经能够做到很多的百花齐放的应用。
42章经:你们试了一年多发现用户需求其实都是在的,而且今年很多人都是手里有预算、想要去做这个事。
周健:国家在投算力,VC在投大模型,甲方还有很多开发者,还有很多业务的需求。在中间现在没有产品能够把这些应用做出来、能够把这个打通,打通了这个水就“灌”过去了。
42章经:你觉得大模型、底层的各种技术其实现在也是够用的,至少对于ToB这一块是够用的?
42章经:希望是这样,所以作为一个这么多年都在AI领域或者ToB领域的人,经历过基本完整经历AI1.0、“四小龙”的时代,你对这一波的AI创业者,做大模型的、做应用的有什么建议吗?
周健:我能感觉到实际上今天最缺的还是好的AI原生的产品经理,区别点就在于过去做产品其实更像是两维的,现在多了一个维度,就是所谓的数据集,因为任何一个模型能力不够的时候,怎么把端到端的应用准确率做到能够用到生产上?实际上难点就在于怎么样去定义这个数据集。
我也有不少师兄师弟在AI公司,我跟他们在交流,我发现他们实际上最后还是带着一些可能错误的假设,那这里整个新的革命其实是完全不一样的范式。但我看起来,今天我的友商不是太多了,而是太少了,我反而是希望大家一起把这个市场做大,因为仅凭我一家的力量,我就变成不断的需要培训客户。我是希望有更多的友商能够用对的方式把它做出来。那这样的话整个市场明朗,其实对大家都好,就像当年,其实一开始的时候“四小龙”并不觉得是在竞争,大家互相帮衬,把资本市场,把客户给带起来,这是重要的。
42章经:我觉得你最后这个格局打开了,现在反正钱也有,客户也有,市场也有,技术也ready了,大家一起来搞。
周健:对,应该有对的方式更好地能够把这个应用给落地。
42章经:因为你在当时在上交学的就是CS,又是第一季ACM的冠军团队,所以从技术背景的这个视角来讲,你自己信AGI,你觉得Transformer是走向 AGI那个路径吗?
周健:比较快速的一个观点是,Transformer我觉得可能不是。
周健:对,需要世界模型。AGI这个事情我更多的抱的是不可知论,计算机里面有个术语叫做递归,人类能不能创造出来比人类更聪明的东西?如果可以,理论上这件事情就是没有底,西方有很多所谓的叫技术奇点,是像宇宙大爆炸一样,其实也一直在思考这个事情,会发现说人类的方式跟机器的方式还是有巨大的区别。
或者说过去,从无生命到有生命,然后到人类有自我意识,还是有一个进化论在里面。但今天相应的都有,比如说像强化学习,其实是解决所谓的进化的问题,包括遗传学习算法,但是迄今来讲并没有把它整合在一块。其实人类是有能力在小样本上面去学习的,但是现在机器基本都是大样本。
我们自己会讲人机协同、人机融合跟人机共生。我更倾向于大家可能会有不同的特点,大家会有不同的优点跟缺点,最后很有可能人类比如说大脑Off loading到某个Agent上面去,从而能够放大人类的智能,这个是我基本上觉得一定会发生的。至于说最终它会不会有自我的意识,然后能够接管整个人类社会或者整个地球,这个我觉得不太可能。