ChatGPT狂欢背后:别让科技新概念昙花一现
对于一个颠覆性科技成果的出现,人们容易只看到狂欢,背后漫长的蛰伏、长久的付出却常常被忽略。去年年底至今年年初,OpenAI公司打造的ChatGPT爆火,目前,在股市上与ChatGPT概念沾点儿边儿的股票全部疯涨,各种追风者蜂拥而上。
新的科技概念一波接一波,有的公司踩在风口,顺势越飞越高;有的公司没踩准点儿,成为大潮退去后的裸泳者。去年和前年投资市场故事里的“吹涨器”是元宇宙,今年元宇宙之热骤降,有消息称,微软将在HoloLesn、Surface、Xbox部门裁员,其中工业元宇宙团队去年10月才成立。曾经爆火的NFT、Web3等科技新概念遭遇类似的窘境。ChatGPT的前景如何?似乎也没人说得清。
比尔·盖茨有一句话很经典——“技术总是在短期内被高估,但是在长期又被低估。”发展硬科技不仅需要真金白银的投入和脚踏实地的创新,还离不开科学的商业模式和清晰的发展规划,否则科技新概念只会沦为赚估值、挣快钱的工具,还会透支社会对科技的信任。
科技“飓风”的轨迹惊人相似
这一波ChatGPT热以及上一轮AI风潮的缔造者为OpenAI和AlphaGo的创造者DeepMind,而这两家公司都是人工智能深度学习革命的参与者与获益者。
深度学习在十年前并不被产业界“待见”,直到2012年,图灵奖获得者杰夫·辛顿和他的两位学生凭借神经网络AlexNet拿下ImageNet(大规模视觉识别挑战赛)冠军,证明了深度学习的能力,才被产业界关注。
2012年12月,辛顿将自己和两名学生组成的“DNN研究”,在拉斯维加斯某赌场的731房间进行秘密竞拍,最终,谷歌以4400万美元战胜了百度、微软、DeepMind,在竞拍中获胜,辛顿与两名学生加入了谷歌。再后来的故事是,谷歌在2014年以6.5亿美元收购DeepMind,两年后DeepMind交出了“AlphaGo战胜围棋冠军李世石”的答卷;2015年辛顿的一名学生与埃隆·马斯克和几个科技大佬成立OpenAI,OpenAI在2022年11月30日发布的ChatGPT,在2023年迎来高光时刻。
另一个风潮是智能手机和移动互联网,这场产业变革由苹果扣响发令枪。2007年苹果发布iPhone智能手机,拉开了移动互联网的序幕,而让苹果智能手机带来颠覆效应的功臣是多点触控技术。多点触控技术从酝酿到在苹果手里大放异彩,同样经历了漫长的“养在深闺”的蛰伏过程。
多触点技术诞生于20世纪80年代初,起源于多伦多大学和贝尔实验室。到20世纪90年代初,施乐公司帕洛阿尔托研究中心的多触点技术实现了用两根手指缩放和转换图像。1993年,IBM推出的第一台平板电脑(Tablet PC)也融合了多触点技术。从那时到2003年,多伦多大学、微软、索尼、东芝等研究机构和公司分别在多触点技术上取得长足的进步,但因缺乏承载的爆款产品,触控操作技术一直未能成为主流。直到2007年,乔布斯将多点触控技术应用到最新发布的iPhone手机上,多点触控技术才走出实验室变身市场流行产品,这个过程历经了25年。
不管是深度学习还是多点触控技术,从萌芽到走向大众市场,再到开启一个新时代,其演进都有着惊人的相似轨迹。事实上,不仅仅是这两项技术,这些年ICT产业里大部分引爆产业变革的核心技术,都拥有同样的演变轨迹。人们常感慨硅谷及美国科技界善于制造概念、制造风口,但事实上这些风之所以能够刮起来,从来都不是一夜之功,它们大多萌芽于大学、研究机构,经历长时间积累、演变,最终由某一明星企业将其做成爆款产品、爆款应用,从而流行,引发“飓风”。
明星企业是偶然中的必然
虽说上述技术萌芽于大学、研究机构,但为什么是在OpenAI、DeepMind和苹果的手里变成了爆款?为什么是这些公司成为“飓风”的制造者?
OpenAI创始人山姆·奥特曼(Sam Altman)说过:“最好的公司都是使命导向的。如果你不热爱也不相信你正在打造的东西,你很可能就会半路放弃。而且创业是一项为期10年的承诺。”
使命导向、长期思考是打造别人无法复制的好产品的关键词。事实上,ChatGPT并不是OpenAI一开始就全力倾注的产品,在OpenAI,有三条技术路线:一是做机器人,二是做游戏人工智能,三是开发语言模型,让人工智能用文本语言学习理解世界,即GPT系列。
前三年,OpenAI的研究成果并没有太多建树,直到2019年2月14日发布GPT-2模型,其能够根据用户输入的内容,生成续写文本,而且让人无法分辨真假。又因为担心对手率先发布同类产品“抢风头”, OpenAI在2022年11月中旬用13天开发出ChatGPT这个聊天程序,上线即爆火。
还有非常重要的一点,在2019年,奥特曼辞去YC总裁终于全心全意担任OpenAI公司CEO,将OpenAI从一个非营利组织变成了一家需要营利的公司。在这一年,奥特曼三番五次飞往西雅图,给微软CEO萨提亚演示GPT模型,终于在2019年7月,OpenAI拿到了微软的10亿美元投资,此后两年又从微软拿到了数十亿美元。
应该说奥特曼对于OpenAI有两大突出贡献。一是解决了钱和商业模式的问题。很多创业公司尤其是想做大模型的AI公司,通常都不能如此长时间“烧”如此多的钱,用以支付AI技术大牛的薪水和购买训练模型的算力。而奥特曼通过将公司“借给”微软的合作模式,很好地解决了OpenAI的生存问题,同时又给公司的未来预留了空间。
据《财富》杂志报道,当OpenAI的第一批投资者收回初始资本后,微软有权获得OpenAI 75%的利润直到收回投资成本;当OpenAI赚取920亿美元的利润后,微软的份额将降至49%。与此同时,其他风险投资者和OpenAI的员工也将有权获得OpenAI 49%的利润,直到他们赚取约1500亿美元。
有人说OpenAI总裁布罗克曼(Brockman)等人推动OpenAI完成从0到1的发展过程,而CEO奥特曼帮它实现了1到100。在奥特曼到来之前,OpenAI的钱几乎被“烧”光,因为有了微软的融资,才让其GPT完成GPT-2、GPT-3迭代,有了ChatGPT的问世。
如果一定要从OpenAI身上找到“偶然中的必然”,或许可以总结为:长期主义的视角打磨出生成式对话AI,再加上灵活的商业头脑探索出“借公司”合作模式。正是因为奥特曼有过创业失败的经历,而且经营过创业孵化器机构,所以知道怎么来平衡创业的理想和现实。
二是打造了面向直接用户的应用。这是ChatGPT横空出世的直接原因,奥特曼有一个旗帜鲜明并且强烈的“建立客户群”的理念,那就是创始人必须亲自去获得用户,而不是通过付费广告。他在YC时告诫创业者:“手动获取用户并记住,目标是让一小群人喜爱你。极其了解那个群体,和他们关系密切,倾听他们,你会发现他们很愿意给你反馈。即使你在为自己打造一个产品,也要听取外部用户的意见,他们会告诉你如何打造一个他们愿意买单的产品。”
这段话诠释了奥特曼为什么一定要在去年年底匆匆忙忙研发免费聊天机器人应用ChatGPT,因为OpenAI公司必须要有一个应用,与最终用户进行互动,而不仅仅是将语言模型迭代得更好。
2022年11月中旬,当OpenAI的87名技术员接到高层指令——“立刻停掉手里正在进行的GPT-4模型研发,全力以赴基于GPT-3.5开发一个聊天机器人应用”时,大家都蒙圈了,因为GPT-3.5是两年前的模型,而GPT-4已经测试完毕,等待发布。但因为在AI绘画上,OpenAI公司有过被人抢先的惨痛教训,2021年爆火的AI绘画事实上是始于OpenAI发布的DALL·E,但因版权、伦理等顾虑选择了内测邀请制,最后被免费、开源的Stable Diffusion抢走了大部分风头。所以这次奥特曼当机立断,用了13天把ChatGPT先做出来,上线。
让客户用口碑相传来教育市场,远比自己去拓展市场更重要,更容易实现突破。口碑像病毒,能够更快蔓延,而且成本更低,所以专注打造好自己的应用,让产品和应用说话比市场人员和公关人员去教育市场来得更迅猛。这或许就是ChatGPT带给我们的启示。
ChatGPT之所以能像“病毒”一样快速流行的原因,特斯拉CEO埃隆·马斯克道出了其中的核心关键:“人工智能已经发展了相当长时间,它只是并不具备大多数人都能使用的用户界面。ChatGPT所做的,是在已有若干年的人工智能技术上添加了一个可用的用户界面。”
用户界面技术的变革,对于这个世界的影响从来都具有潮水效应。苹果的iPhone用多点触控技术改变了人类使用手机的习惯,OpenAI的ChatGPT让普罗大众有了人工智能技术的可用界面,从这个意义上看,iPhone与ChatGPT何其相似。如果我们用苹果与OpenAI的思路来寻找和打造其他技术的用户使用界面,我们是不是就有机会找到或制造下一个风口。
解决用户痛点的技术才会长久
ChatGPT会昙花一现吗?会像上一轮的AlphaGo那样掀起一股浪,就偃旗息鼓吗?还是像元宇宙,热闹一两年,就立即出现“风过也”的迹象。
微软全渠道事业部首席技术官徐明强认为,ChatGPT之前,人工智能领域有两次公众视野内的高光时刻——AlphaGo击败李世石、机器视觉的产业爆发。但前两次的高光时刻,都存在明显的局限性。
“AlphaGo在围棋对弈中虽有出色表现,但除了领域较为狭窄外,更多的是一种能力展示,而没有对生产力、社会关系产生实质性影响。前几年,机器视觉经历过一次短暂的爆发。诸多初创企业试图利用机器视觉人工智能来改造传统零售环境。但由于SKU更新速度快,且相对特殊,模型需要大量训练,最终机器视觉的商业模型未能跑通。”徐明强认为,普适性及训练数据的获取,是人工智能获得大规模使用场景的第一道关卡。反观冠以“Chat”之名的ChatGPT,以自然语言为突破口,在适用领域上天然更广阔。正因为ChatGPT以语言作为反馈形式,其对于所有行业都具有影响力。
一个技术能否有生命力,取决于是否能规模化地解决用户的问题和用户的真实痛点,就像辅助驾驶,经过这些年的发展,确实解决了用户在驾驶过程中的很多问题,所以才慢慢被接受,慢慢变成新车的标配。AR/VR能够带来不一样的用户体验,但是不是能够解决眼下用户很多真实痛点,还有待观察。
近期,不少巨头调整了AR/VR策略,希望进行更多探索,找到更合适、更有价值的落地与变现场景也很自然,微软Cloud for Industry的商业副总裁科里·桑德斯日前回应了外界的猜测,工业元宇宙是创新的变革催化剂,而微软将沉浸式体验带到各行各业的能力有望令全球数百万人受益。同时,为满足客户的需求,帮助他们充分实现基于工业元宇宙的价值,微软正不断投资于相关的技术、平台和解决方案。他再次强调,微软对HoloLens2和Microsoft Dynamics 365混合现实应用程序的承诺依然坚定。
而ChatGPT相对于目前市场上的其他聊天机器人,无论是训练数据规模、模型规模和训练方法都有很大的改变,所以能够生成更为自然、连贯的文本,将其加持于搜索会有很大的效率和体验提升。
一个技术的流行,一个产业的大发展需要大量的玩家,能否在一个正在起飞的风口乘势而上,成为市场持续的赢家,取决于用技术解决现实难题、用户痛点的能力。每一个科技浪潮的到来,暴风眼的企业通常只有一两家,但是同样会造就庞大的生态链企业,在大潮中渔翁得利,充分发挥各自在各个领域、各个段位解决现实难题的能力,就有机会水涨船高。
中国工程院院士王坚不久前谈及了AI解决时代命题的话题,他认为DeepMind的AI工具——AlphaFold,极大地降低了蛋白质的结构预测门槛,缩短了相关研究的时间,同时也降低了研究成本。“AlphaFold解决的是一个非常有高度的问题,(人工智能领域)其他(时代命题)尽管也很了不起,但都还是属于娱乐性比较强的问题。”王坚表示。
ChatGPT与元宇宙未来会走多远?其掀起的飓风将会持续多久?“技术总是在短期内被高估,但是在长期又被低估。”比尔·盖茨这句经典名言很好地回答了关于ChatGPT、元宇宙的现在和未来。
责任编辑:甘霖