本文作者:admin

对话猎豹移动傅盛:大模型不是通往AGI的唯一路径

admin 2024-08-27 15:00:06 188
对话猎豹移动傅盛:大模型不是通往AGI的唯一路径摘要: ...

界面新闻记者 | 伍洋宇

界面新闻编辑 | 宋佳楠

8月21日,2024世界机器人大会期间,作为猎豹移动董事长兼CEO、猎户星空董事长,傅盛就AGI(通用人工智能)、具身智能、大模型机器人等话题进行了演讲。

傅盛表示,自己在AI 1.0时代便看到了机器人将从传统的工业场景走到服务业场景,乃至千家万户的机会,因此于七年前投资创办了猎户星空。

而在进阶程度更高的AI 2.0时代,他用“人类科技史上的奇迹年”来形容人工智能的这波崛起,认为可与牛顿的“万有引力”或是爱因斯坦“相对论”的出现相提并论。在他看来,大语言模型带来的端到端创新范式的影响,对全行业、全社会都会产生巨大改变。

受益于ChatGPT在语义理解方面实现的能力突破,机器人也迎来更多发展机会,因为“语言实际上是人类真正独立于其它物种的核心智能”。 

“智能涌现”的整个过程可谓“神奇”。用AI教母李飞飞的话来说,“大模型是个灰盒”。伴随着各种不确定性,OpenAI率先走出一条与众不同的道路,且实现了创新。

但傅盛指出,大语言模型并不一定是通往AGI的唯一道路。他赞同Meta首席科学家杨立昆的观点:大语言模型的天然结构使得它很难实现AGI。

其中有两方面考量因素,一是更小参数的大模型是否同样可以实现智能;另一方面,不是所有工作都需要AGI这样的“爱因斯坦”,整个社会是一个金字塔形的多元结构,基层需要更多平民化的大模型出现。

当前,OpenAI、苹果、微软等科技巨头都在以实际行动验证“小模型”趋势,这可能让大模型直接成为端的一部分,而不只是在云上。

今年1月,猎户星空也曾发布小参数模型Orion-14B。除了考虑大参数模型的成本昂贵之外,这家公司认为,机器人一定要在端上跑自己的模型,才可能既解决数据隐私问题,又做到实时快速响应。 

傅盛表示,端模一体带来的产品和科技变革的意义将更大,会直接引发交互革命和生产力革命,而大模型机器人是猎户星空所押注的赛道。目前,该公司将其分为劳动协作机器人、接待营销机器人和递送配货机器人三类。

就大模型私有化部署而言,傅盛称自己不仅要负责产品,也对销售投入了大量精力。他发现,ToB(企业端)的销售本身就是一个产品化过程。

在他看来,这项业务的收入表现不会是一条很陡峭的曲线,甚至过去几年经历过近乎水平的进程。但由于大模型的介入,明年产业规模可能会有明显变化。

演讲结束后,傅盛接受了界面新闻等媒体采访,对AGI实现路径、小模型趋势、端模一体、双足机器人的未来等热门话题,给出了自己的看法。

以下为采访实录,略作编辑:

问:你说大语言模型不是AGI的唯一路径,所指的到底是Scaling law不行,还是Transformer架构不行?

傅盛:对于Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究员说,现在大语言模型遇到了瓶颈,标志性事件就是GPT-5发不出来。OpenAI作为一家科技创业公司,18个月没有发自己的旗舰产品,而是忙着做Search GPT,或者GPT-4o,说明要么是卡着上不去,要么是训练出的效果不太好,没有质的提升。

硅谷都在盯着GPT-5到底何时出来,出来后是不是有大的提升。如果没有提升,可能会有点类似出现互联网泡沫的感觉。

我也不知道到底是Scaling law不行,还是Transformer架构不行。做大语言模型就是一个尝试的过程。OpenAI有技术信仰,他们坚信这事,靠一个ChatGPT活过来了。但今天到底为什么这样,以后它的Scaling law能走到什么地方,没有原理去证明。此外,新的数据从哪里来也是个问题。

问:从GPT-4o mini和Apple intelligence来看,小模型可能是趋势。你认为端模一体最考验企业的是什么?这个能力现在中美有明显差距吗?

傅盛:小模型已经不断被验证了。技术发展到这一步,一个几十亿参数的模型能力已经不错了,苹果做的所有工作都是在它的小模型上。现在看起来端上的需求是很大的,无论是手机、电脑,未来一定是这样的逻辑。

中美应该没有太大差距。训练小模型对算力要求低,需要结合真正的应用场景,这方面中国有自己的优势,迭代快。包括私有化大模型出海,如果不是美国的大公司在做,那些创业公司和中国的效率还是有差距的。

问:1月份时,你曾说过超越OpenAI的机会一定来自大模型的应用。大半年过去了,现在看到哪些应用的机会?  

傅盛:那个时候,对于是否做好一个特别牛的模型就能解决所有问题,大家有很多争议。今天看起来答案非常明显,即做好一个模型也不能解决大多数问题。学界也在讨论,大语言模型到底能不能实现AGI?去年大家都信心满满,现在很多人觉得不太可能,它只是一个更好用的工具而已。 

我们可能真的不会遇到一种“万能”技术,所有的技术最后都要跟不同的场景结合。即便有这样的能力,还要考虑成本。比如你要取暖,最简单的就是烧柴火,而不是建一个热力站,不同场景中大家的需求不一样。

今天可见之处都是应用的机会,只是有些可能不属于创业者。比如苹果发布了iOS 18,股价最高上涨10%。你把手机改造一下可能有机会,但只要手机厂商自己干,你就没机会。

机器人也是一个很大的应用。虽然我对双足机器人商业化不看好,但对机器人这个行业的发展充满了信心。

大语言模型出来之前,让机器人拿杯子是个世界级难题,当时大家都是绝望的,认为不可能做成。但今天有了大语言模型,它自己具备了规划、判断和模糊的体验,能让机器人成为很重要的产品载体。 

问:为什么不看好双足机器人商业化?

傅盛:技术过于复杂。双足机器人必须依赖于机械结构,但结构不是摩尔定律支撑的,每年能改一点点就不错了。就像汽车刹车系统、底盘,一百年过去了,改了多少?

双足机器人进展比较慢,今天是电机问题,明天也是,最多电机大一点。为了双足牺牲了太多,包括产品的能耗和稳定性。双足机器人要解决摔倒的问题,而人的稳定性相当高。

再者是成本,用几个电机和轮子相比,它成本一定高,还要保证在99%以上的场景不能出错。

作为一个研究方向是可以的,但说现在双足机器人要大行其道,我不看好。每个人的梦想都值得鼓励,但还得看能不能真正量产,以及量产以后市场的接受程度。

问:双足机器人做科研的这几年,主要是解决哪些问题?

傅盛:结构的灵活性问题以及算法问题。膝盖是非常复杂的,有各种肌肉、小关节,还有很好的力反馈,再借助大脑、小脑,才能让我们站立。双足机器人是钢铁的东西,没有这些,只能靠算法。由于端到端,算法的确进步很大,像波士顿动力以前所有的积累可能都废了,但难度还是挺大的。 

问:如果三五年之后,它们真的能落到产线上,会改变你的看法吗?

傅盛:不会,因为你能落在产业上,我一个轮子的结构也能落,而且永远比你便宜100倍以上。今天你花20万买辆汽车,一下能开出去100公里。有一天来了一匹机械马,需要100多万,你买车还是买马?车就是这么打败马的。

机器人用轮子很有优势,等到有一天产品真正稳定的时候,其实干活是用上半肢。

问:有一些双足或者人形机器人的研报,会说现在处在人形机器人的“前夜”,你是否认同这样的观点?

傅盛:去年(特斯拉)“擎天柱”出来的时候,很多投资人都很受震动。当时特斯拉放话,再过一两年,能达到几万台或者10万台的规模。当时我说不可能,今天话就放在这。

之前特斯拉说明年会有1000台“擎天柱”进入工厂,但我认为它们做不到很好地工作。以特斯拉的实力,放1000台去测试是可以的。

一些企业讲人形机器人产线搬运,这完全是作秀,搬运为什么不用叉车?用加机械臂的叉车不行吗?一个轮子能拉100公斤,人形机器人搬运两公斤就不禁摔,更别说造价多少。

现在离“前夜”很远很远。2017年,我的团队就拿机器人点蜡烛,好多机械臂厂商也说要改变行业,后来发现这个行业真的很难改变,因为机械结构是一点点磨出来的。不能因为埃隆·马斯克做了这个事就觉得一定行。人都有骄傲的时候,他也不例外,没有神嘛。 

问:大模型机器人是怎样一个概念?

傅盛:有点“具身智能”的概念。大模型通过语言的学习构建了对这个世界的基本逻辑和认知。大语言模型可以做出规划,反馈给人,这比以前(做机器人)的技术难度要低很多,要知道以前所有的移动都得写控制代码,写起来很费劲。 

大模型是实现具身智能的推动力,是一个基础条件。在没有大模型之前,(机器)理解世界是不可想象的。 

问:这个概念为什么这两年才火起来,它和之前的那些智能化的机器人传感器等有什么不同?

傅盛:之前的很多智能化可以理解成一种程序化的过程,比如先帮你预设好,看了一个什么东西去点一下,这已经算很高级了。最早的都不需要交互,自动化完全匹配,这是第一阶段。

第二阶段有一定判别的技能,我们叫做“规则”。规则很难容纳太多的东西,比如突然出现一杯水,但(代码)没写就傻了。有了大语言模型,它可以理解世界,知道这是水,只要有足够多的数据,就不用再写规则代码,而是通过各种方式去获得更多的数据进行训练。这也是为什么“具身智能”一下火起来了。 

问:猎户星空服务机器人在海外市场主要的应用场景是哪些?中国的机器人产品出海要进一步克服哪些困难?

傅盛:目前猎户星空机器人主要还是递送类,在餐厅送餐、回盘,也有一些交互类的,去做讲解、引导等工作。

海外需求相对旺盛,因为发达国家劳动力比较贵,而且稀缺。要进一步打开市场,就得用大模型把它智能化。

我们在海外遇到了一些问题,也在慢慢克服。早期部署成本很高,不仅机器人过去,也要让商家会用。我们未来的目标是实现“开箱即用”,机器人做到这个并不容易,它得认识环境。以前需要人去给它建图,现在有了大语言模型,这件事的难度会大幅度降低,甚至可以实现自动化。 

另一个问题是交互能力。我们在海外一直没有做交互,因为每个国家语言不同,还得做定制,非常复杂。而大语言模型天然就是翻译机,像猎户星空大模型(Orion-14B)的日语能力在开源模型里是比较好的,因为我们认真训练了一下日语。最神奇的是,你都不用管它,只要把日语输出给它,它自然就会了,而且会翻译。这放以前也是一种颠覆,是它的天然能力。机器人未来要把智能化再提高,拓展它的应用场景。

我虽然不看好人形机器人,但觉得机械臂去做一些动作是可以的。我们下半年会有机械臂方面的产品推出,因为它在某些场景下能够实现一定的任务。 

问:SaaS在中国差不多被验证是失败的,猎豹现在做私有化大模型,会不会也会面临企业付费意愿低的问题?毕竟现在AI应用还没有产生多少收入,包括国外也是。

傅盛:是的。我们现在在和头部的企业合作,一期已经在交付,二期正在做,我们认为是有可能标准化的。

中国的市场我可能改变不了,但只要做好,让企业都能满意,我们就把它标准化,下一步再出海去做。出海本就是我们的基因,很多海外客户也愿意接受(私有化大模型)。海外市场足够大,愿意付费。经过中国市场验证的产品模式,现在到全球都是有竞争力的。 

问:你觉得窗口期大概有多久?

傅盛:最多就到年底,一步一步来,我用更长的时间来看这件事情时,思路就会不太一样,现在就是盯效果,真要说多拿几单进来也不是不能。

问:在猎户星空这边,你的精力主要放在产品这块吗?

傅盛:现在是,销售上我也得花精力。我后来意识到,ToB和ToC最大的不同,就是ToB销售本身就是一个产品化的过程。

比如说私有化大模型跟做ToC不一样,做ToC我自己觉得这个产品不错,不需要ToB。但是ToB必须要了解客户,这对我们以前做ToC的团队来讲是个挑战,这两年慢慢积累了一些经验,学了不少。

问:这种业务收入规模的提升,大概是一条什么样的曲线?有所谓爆发节点吗?

傅盛:ToB的肯定不会那么快,前几年其实还在水平线上,今年开始产品化,能再做好一些。大语言模型是让整个机器人场景发生了很大的拓展。我今天展示的讲解、直播机器人,以前是很难实现的,现在能做到接近于人的水平,明年它的增长可能会比较大。

阅读
分享