作者简介: 王川,投资人,现居加州硅谷。
本文来自2023年4月14号笔者和一群投资分析师做的关于人工智能投资的分享,略有删节。另外可以参考笔者上个月的文章
王川:关于 chatGPT 的随想 (一)
先做一下风险提示。第一,今天和大家的分享全是来自公开可以到网上查的信息。第二,这里只是谈我对美国股票市场的经验,对亚洲和中国的市场,我不了解。第三,我只是预测比较长期的,三四年以上的趋势,也只对这种研究感兴趣。就是你投了以后,可以什么都不管,躺平。也不用挖空心思,揣测下个季度收入好不好,也不用太担心竞争者来了,等等。第四,我的观点,也会随着新的信息,新的变化而不断调整。所以,今天和大家分享的,只是我这一刻的观点, 非投资建议。投资有风险,入市须谨慎。
以 chatgpt 为代表的人工智能大语言模型 (LLM) 的涌现,对世界的冲击力将大于蒸汽机,大于印刷术,大于文字,大于火。其进化速度和传播速度前所未有。终日沉浸其中才能理解其威力。世界结构和运作方式将彻底改变,而且已无法逆转。
去年还在谷歌工作的 Jason Wei有篇论文,“emergent abilities of large languages models" (大语言模型的涌现能力),此文揭示了未来科技加速发展的核心法则之一。很多大语言模型,当计算训练量超过 10^23 FLOP 之后,准确度突然开始飞跃。
chatgpt 的出现是一种"涌现"的现象和数学的必然。理解此机制后,就会意识到下面将有一长串的不断涌现的新的 AI 的强大功能,而且这也是数学的必然。(涌现可以定义为:某个系统的某种能力,在某个维度的参数超过某个临界点后,突然开始迅速增长。而这种能力在未突破临界点之前不存在)
LLM的关键点在于模型大小和数据量达到了一个临界值,过去认为机器不可能的有的推理能力,突然有了。大模型迎来了人工智能的顿悟时刻。人的一生,时刻都在对各种情况,建立模型,做出分析判断,现在人工智能拥有自己的推理能力,而且将不断规模化,自动化,成本不断降低,等于是触及了人类活动本质,对未来的冲击,不可限量。
GPT 里面的 T,是 Transformer 的缩写。这个技术对于自然语言处理上的核心改进,是在训练 AI 理解力时,把距离相对远的词语建立起相关性。比如说这句话 “我对花生过敏,每次吃到它,身体就不舒服”. Transformer 能够通过所谓 “注意力”的机制,把 “花生”和“它”两个词建立起相关性,相对于传统 AI 语言模型而言,其理解力大大提高。把这个概念推而广之,要提升对这个世界的理解力,也应当不断训练自己把各种看似距离较远,但实际上强相关的事物关系,能够迅速提取出来的能力。
人工智能技术的突破一个重要因素是大规模并行计算能力的提升。
人工智能技术的核心是神经网络,神经网络的核心算法是调网络参数时的前向传播和反向传播计算,这本质就是矩阵乘法。而矩阵乘法计算,每一个元素的计算可以单独平行展开,和其它元素的计算互不干扰,所以特别适合用 GPU 的大规模并行计算能力来实现。
人脑里的初级视觉皮质层 (Primary visual cortex),据说有一点四亿个神经元。这些神经元在后台进行复杂的并行计算和信息传递,赋予人脑快速的视觉感知力。这在最底层看,和 GPU 的并行计算获得图像识别能力,其机制是类似的。有视觉能力的动物,在多数环境下,可以迅速在生存竞争中获得压倒性优势,慢慢把没有视觉感知力的其它动物淘汰。
但在听觉和其它文字处理任务上,人脑的并行计算处理能力其实非常差。即使一目十行,也就最多同时看两百多个字。而现在 Gpt-4 一次性输入可以接受三万多个词,比人的能力要高两个数量级,而且还会继续迅速增加。这种不断增加的高并行度,意味着其对文字和世界的理解力和穿透力,将不断达到一个常人难以理解的高度。所以一定要努力学习用这种工具来提升自己对世界的理解力。
需要理解的是,gpt 作为一种以自然语言为界面的工具,可以容忍输入信息的一定模糊性,因此可以几乎无限的向更大的数据培训量上扩展. 之前的很多工具,需要特定的输入界面和语法,差几个字母就完全无法理解,根本不具有扩展性,和 gpt 完全不是同一性质的东西。
效率高的工具,演化到一定程度,会把各种元素连接综合起来,成为一个前所未有的效率越来越高的实体,甚至从一个遥远的观察者来看,像一个有着明确目标的生命体。要注意观察 Gpt 的连接,会造就出什么样的全新的,结构完全不同的实体。
大语言模型将成为智能组合叠加的超级胶水。本质上是语言理解力强,降低了接口的精确性要求(一般软件接口种类繁多,各家定义不同,格式严格精确性要求高,还要考虑兼容,做到通用性不容易),大大提高了接口的通用性, 降低了各个子领域技术组合的门槛
把这个思路延伸一下,在分配时间和注意力的时候,最重要的不是你掌握某个具体的技术的能力,而是要保持始终和智能最高的大语言模型生态连接 (而不被切断)的能力。始终沉浸于这个生态中,你就赢了大半;孤立的闭门造车,而幻想能创造出什么竞争优势,最好也就是昙花一现,大概率则是白忙一场。
未来超级个体和公司的区别会越来越模糊。人与人之间沟通互动的带宽是比较窄的,容易出错掉链子,经常要等待。LLM 和其插件的带宽是没有上限的,而且应当会越来越稳定,迅速,准确。
Gpt 之类的大语言模型属于一种 meta tool (元工具)。一个典型特征是它可以自己对自己纠错,叫它自己反省一下自己的输出后,马上就可以输出新的更高质量的内容。这种能力可以用于无数场景,这是此类工具和之前的各类创新有着本质不同的一个关键。这也是为什么“普通人觉得自己总有什么特长无法被 AI 替代”的想法极为幼稚。
Gpt 的技术,相当于可以让极少数人具有"超大规模处理非结构化数据信息"的能力,这个能力层层叠加爆发出的生产力,看不到上限。以前是机器无法处理“非结构化数据”,现在不一样了。软件开发中大量人力密集型的比较繁琐的工作 (比如写胶水代码),将很容易被替代。
有些人狂妄的以为自己某个单项技能比 AI 强,就不会被超越替代。但 LLM 和各种插件链接上后,想获得新技能是个非常轻松的事情。然后自然会涌现出各种前所未有的超人的能力。
AI 会最终把现在所有人能干的活,慢慢全部自动化,边际成本压到无限接近于零。整个社会结构会有现在无法想象的变化,很多传统概念要么消失,要么彻底重构。而且这个变化已经无法逆转。
英伟达的黄仁勋预计AI 算力十年后可以增加一百万倍,就是六个数量级,2^20。(相对于 Chatgpt 而言)算力增加的原因,主要来自于新的芯片,芯片之间的并行连接,系统之间的并行连接,新的操作系统,新的算法,等等。
技术进步如此之快,以至于现在对普通人而言最佳的策略,恐怕默认是以“躺平,养好身体,等待” 为主。否则你拼死拼活积攒的那点资源,很可能过几年, 就因为技术因素而一钱不值,但你的健康则是切切实实损失掉了。
互联网真正造成实体经济生产力的加速发展,大概要到 2002年之后。比如说,以前美国银行业的文件处理程序还是比较落后,大量依靠传真,或者隔夜快递来传送文件。传真经常会有发不出去的问题,还必须自己打印传真确认发出的信息,免得接收方找不到或者抵赖。真正大家做生意,都开始使用宽带互联网传送文件,是在 2002年之后才慢慢展开的。这已经是互联网浏览器出现后九年的事情了。彻底全面普及要到 2009年之后。
类似的,大语言模型 LLM在很多实体产业应用上普及,需要时间,但这次应当快一些。可能一两年内,一些公司之间做生意,就开始使用 LLM 的工具来提高效率。也许四年之内, 2027年之前就可以全面普及。然后那时的企业再看现在的企业的运作模式,就如同现代人看老人用传真机慢慢发几十页的文件一样,觉得很可笑与落后。
从投资角度看,唯一值得长期投资的是能够控制生态的,强垄断的,具有征税能力的公司;没有征税能力,竞争者可以不断绕过去,或者不断杀你的价, 这都不是好的投资对象。
可以参考笔者的老文章
王川: 从权力和垄断的演化机制,看投资(一)
什么是“收税的生态位”?
当你的投资对象占据收税的生态位的时候,可以拿得很稳,而且基本不会为各种捕风捉影的新闻影响心情和判断力。而且这样你对投资不在“收税生态位”的企业,兴趣就不大了。
收税能力也有强弱之分,比如苹果的收税能力就要强于脸书,强于谷歌。
大部分创业的折腾,如果没有达到“收税的生态位”时,非常辛苦,对投资者风险也大。达到“收税的生态位”是一个长期耕耘的过程,也需要一定运气。但如果你还不确信某个东西是否达到“收税生态位”,那就还没到。
AI 是无限游戏,构建最大最开放最丰富的生态者,让尽可能多的玩家加入自己的生态,帮自己分摊成本,才能真正占据战略制高点。
Netflix 全球付费用户超过一亿。chatgpt plus 据说现在已经有接近两百万付费用户,但只要它不断提升服务的功能,没有任何理由,它的付费用户数会低于 Netflix.
微软和 openai 有一个利润分成的长期协议,大概 openai 前面利润,微软分 75%, 直到它把自己给 openai 最初的一百三十亿美元的投资收回。之后的利润分成比例是各自拿 49%。所以基本上可以把微软和 openai 看成一体的。
真正的竞争壁垒不在于数据,而在于生态的构建,尤其是当大量第三方开发者自发参与生态的建设。
对于开发者而言,微软是 github 的主人,开发者默认要使用的门户网站,你一旦用上 github, 就会使用 github 提供的编程工具 copilot, 一旦用的习惯了,就很难换了。那么你用了 github, 阻力最小的路径就是继续使用微软生态内其它的工具和设施,因为方便和便宜,比如说 chatgpt 的 plugin 插件,或者自己也参与做相关的插件, 因为 openai 这个生态圈里的潜在客户最多。做好之后,不管你是自己训练大模型,还是要把服务部署在云端,你都很难逃离微软的 azure 云服务的轨道,还是因为方便。而且微软正在一步步,把所有这些微软的 AI 工具整合到 office, bing, edge 浏览器, windows 里面. windows 仍然占有桌面电脑市场份额 70%以上。azure 占市场份额 20% 以上, 微软的 office 软件包,包含 excel, powerpoint, word, 占整个相关办公软件市场的份额大约 85-90%。这些工具都会被微软和他的 AI 软件整合。所以你一旦接触到微软的任何工具,就会自然被吸引到他的 AI生态圈里面,越陷越深。
还有一个数据,就是硅谷这边的做天使投资的公司 Y combinator, 最近一期扶植的项目,280个,里面大概 38 个是给 chatgpt 相关的项目,所以这些人最后都是在给微软和 openai 打工, 帮助他们壮大自己的生态。
现在默认微软/openai 是这个领域的领先者。其它竞争者要想超越,必须靠大量的市场数据来证明自己,而不是靠发几篇新闻通稿,就想来忽悠投资者和用户。
微软现在股价不到 290, PE 比值大约 30 左右,并不是特别高。这一波人工智能的狂潮,可能未来五年内导致其利润翻番。有个历史数据,微软 2022年的收入,比 2017年增加 100%, 而利润增加了 200% 也就是涨了三倍。所以预计微软未来五年利润翻一番,并不是很离谱。这是目前逻辑比较清晰的长期躺赢的机会之一。(非投资建议,投资有风险,入市须谨慎!)
关于 AI 的硬件公司,它最大的风险在于,相对而言在价值链的低端,收入来自企业用户,波动可能更大,遇到泡沫崩溃时价格下跌非常厉害。即使是当年的网络器材公司巨头思科 Cisco, 2002年相比于 2000年最高点时的价格回撤,达到接近 90%。而同期微软的价格回撤只有 50%左右。
这是我认为未来几年AI投资领域的一个可能发展趋势。历史很少重演,但它经常押韵。
人们看到了LLM 的力量,看到了OpenAI赚钱;
人们想与OpenAI竞争;
新竞争者购买新的GPU;
像英伟达这样的GPU制造商赚钱;
新竞争者想要超越英伟达,或制造专用芯片。
像TSMC这样的芯片制造商赚钱;
竞争者想要超越TSMC建立更好的晶圆厂,需要更好的光刻设备;
ASML赚钱;
OpenAI上市,早期风投获得超过100倍的回报。
早期风投出去筹集新的巨额基金;
机构投资者涌入,担心错过良机。
更多与AI相关的公司得到资助,尤其是基础设施公司。
估值模型逐渐变得基于恐惧(错过的恐惧、被竞争对手收购的恐惧、显得愚蠢的恐惧)的凭空捏造,而非基于现金流的现实贴现值的合理计算。
追逐趋势的操盘法一段时间内很赚钱,保守行事的人一开始看起来相当愚蠢。
风投可以根据私有市场中虚幻或不可持续的估值,对外炫耀高的内部收益率 IRR,从幼稚的投资者那里筹集更多资金。
然后美联储降低利率,更多的热钱涌入。
潮水涨起,所有的船只都随之上升。有一段时间,每个人都赚了很多钱。
LLM、芯片制造商、晶圆厂、设备供应商、风投、分析师、AI公司员工。任何未将其投资收益重新投入AI相关股票的人,与这样做的人相比,会觉得自己非常愚蠢。
在泡沫的顶峰,做空股票泡沫的对冲基金将遭受重创。
一直对泡沫持谨慎态度,但在五年内一直错误的分析师,在顶峰时改变观点,变得乐观。
然后美联储收紧。然后一切都垮了。
面对泡沫,普通人很难独善其身。一是没有资源长时间坚持一种看上去相对平庸的策略,二是无法承受看上去比自己蠢的人居然暂时大幅度超过自己的巨大精神压力,三是认为自己可以择时提前退场,四是认为自己可以择时而选择主动做空,等等.
即使知道大概演化的框架,实际上无法改变什么。企业资金因为竞争的恐惧而入场,机构资金因为错过的恐惧而入场,散户因为恐惧隔壁老王赚钱比自己多很多而入场,所有入场的资金争先抬高价格,互相强化。这种恐惧驱动的策略相当长一段时间确实有效,大家对此策略的信念也不断强化,难以改变。
公司估值最终要看现金流。但早期高科技公司的现金流分析,非常困难,很多时候几乎不可能,这时人们就容易用一些自欺欺人的片面摘取的技术细节和新技术名词来分析评判公司技术实力,并把它作为现金流分析的替代品。这种分析方法在泡沫膨胀的早期往往显得有效,因此容易被 (错误的)强化。
很多高科技公司的投机者容易陷入的误区是,当整个估值模型发生火山喷发式的彤塌时,没有能力迅速改正思维模型,逃离灾难。
在泡沫酝酿的上升期时,可能有几年时间 “投资某个炫目的增长型高科技公司,不管利润多少,不管是否可以持续,在更高的价格卖出” 这种思维模式,一直有效,渐渐变得根深蒂固,理所当然,理直气壮。
当必然的下跌和行业洗牌发生时: 公司的很多客户本身就破产了,来自他们的营收也消失了; 原来盈利的公司突然变成负现金流; 原来因为 fomo 的恐惧而原意支付一百倍 PE 的投资者现在自身难保,只愿意支付 25 倍 PE ; 原来可以拆东墙补西墙的财务造假,也没有更多腾挪空间来维系。这时候,预期和现实的合龙,只能靠崩溃的股价来实现,没有别的选择。
之前发财的投资者,没有理解这是一个大彤塌,本来理性的反应是马上切换成“自我保全的应急模式”, 逃得越远越好。但对于思维模式固化的人而言,阻力更小的更自然的反应是,自我安慰说, 这一切都是暂时的,几个月后就会会反弹的,以前我都是这样渡过暂时的难关的!
在火山喷发时,还继续往里跑,不断投入自己宝贵的资源去消耗。这是把自己一生的积蓄,几个月内就消耗光的最有效模式。不管你之前做得有多好,积累有多少,在必然到来的周期性萧条和行业洗牌之前,远离这种大彤塌造成的伤害,是决定成败的关键之一。
行业洗牌时,即使是一些长期基本面看好的龙头公司,也难免遭遇股价下跌 75%以上的价格回撤。原因很简单:营收减少 20%,利润可能减少一半以上,pe 再从 比如 60跌到 30以下,股价自然下跌 75%以上。至于非龙头公司,价格回撤 95%以上或者彻底归零,更是司空见惯。价格回撤无法完全避免,但行动之前要清楚理解可能出现的最坏情况,并且有资源有能力能够承受这种冲击。
面对新的科技浪潮来临,创业者常犯的一个错误是,没有理解自己真正有什么可以持续的竞争优势的时候,就跟风往前冲,以为自己把某个一厢情愿的产品做出来之后,一切就会迎刃而解。更多时候,他内心深处,可能并不想真正做好产品,只是幻想做了足够多的时候,一定可以找到下家接盘,发笔小财。如果他碰巧遇上一个和他同样天真而猴急的投资者,很容易一拍即合,把这种盲动推进下去。
实际操作上,一旦要面临市场考验的时候,会发现:产品做出来,潜在客户不买账 ;有客户有兴趣,但不愿意付那么多钱 ;客户服务和运营支持成本太高,根本无法盈利 ;突然有新的竞争者推出类似产品,价格更低更好用,推广渠道更强大,自己过去花的功夫完全白搭 ;长时间没有反馈,无人理睬的感觉实在痛苦,只能打掉牙往肚子里吞。最后实在没有财力物力继续,只能灰溜溜悄悄收摊,然后惨痛教训淹没在茫茫人海中,继续被后面各种满怀希望的年轻人一次次重复。