首页 资讯 民生 科技 财经 汽车 房产 娱乐 文化 能源 公益 时尚 健康 图片

网络

旗下栏目: 三农 教育 法治 体育 消费 旅游 网络

生成式AI进入第二阶段了

来源:深思圈 作者:复兴网网络 发布时间:2023-09-21
摘要:一年前,我们发布了一个假设,即生成式AI将成为技术中的一个深远的平台转变,然后,风暴来临。 科学家、历史学家和经济学家长久以来都在研究创新的寒武纪大爆发的最佳条件。在生成式AI中,我们已经达到了一个现代的奇迹,我们这一代的太空竞赛。 这一时刻已经酝酿了几十

去年的今日,红杉美国官网发表了一篇题为《Generative AI: A Creative New World》的文章,我个人认为当时的那篇文章代表着新一轮Paradigm shift(范式转移)的开始,拉开了AIGC时代的序幕。原文作者是红杉的两位合伙人:Sonya Huang和Pat Grady,当时我也在第一时间翻译了那篇文章,并且在国内广为流传。那篇文章也可以说是开启了我自己的AIGC的创业之路,无论是深思圈自媒体还是自己的创业项目,都因此发生了巨大的变化。

时间过得很快,转眼间一年时间就过去了。红杉美国的两位投资人作者又带来最新的一周年新文章——《Generative AI’s Act Two》,让我们一同来回顾一下过去一年里AIGC发生了哪些巨大变化,以及接下来的第二阶段,又会有哪些新的东西出现呢?

此外,我们还加入了一个新的LLM开发者栈,反映了公司在生产中构建生成型AI应用时转向的计算和工具供应商。

但人们会继续使用吗?并不真的。下面的图表比较了AI优先应用与现有公司的第一个月移动应用保留率。

用户参与度也不佳。一些最好的消费公司有60-65%的DAU/MAU;WhatsApp的为85%。相比之下,生成式AI应用的中位数为14%(Character和“AI陪伴”类别是显著的例外)。这意味着用户还没有在生成式AI产品中找到足够的价值,以至于每天都在使用它们。

简而言之,生成式AI最大的问题不是寻找使用案例、需求或分发,而是证明价值。正如我们的同事David Cahn所写:“2000亿美元的问题是:你打算使用所有这些基础设施来做什么?它如何改变人们的生活?”建立持久的业务的路径将需要解决保留问题,并为客户生成足够深入的价值,使他们坚持并成为每日活跃用户。

但我们不应该绝望。生成式AI仍处于其“尴尬的青春期”。有时会有卓越的迹象,当产品没有达到预期时,失败通常是可靠的、可重复的且可修复的。我们的工作摆在面前。

五、第二阶段分析

创始人正在进行prompt工程、微调和数据集策划的艰苦工作,以使他们的AI产品优秀起来。他们正在逐步地建设,将引人注目的Demo演示变成完整的产品体验。与此同时,基础模型底层继续充满研究和创新。

随着公司找到持久价值的路径,正在发展一个共享的剧本。我们现在有了共享的技术来使模型变得有用,以及将塑造生成式AI第二幕的新兴UI范式。

1. 模型开发栈

  • 新兴的推理技术,如连锁思考、树状思考和反射,正在提高模型执行更丰富、更复杂的推理任务的能力,从而缩小了客户期望与模型能力之间的差距。开发者使用像Langchain这样的框架来调用和调试更复杂的多链序列。
  • 迁移学习技术,如RLHF和微调,正变得更加可用,特别是随着GPT-3.5和Llama-2的微调的最近可用性,这意味着公司可以将基础模型适应其特定领域,并从用户反馈中改进。开发者从Hugging Face下载开源模型,并微调它们以实现优质的性能。
  • 检索增强生成(RAG)正在引入关于业务或用户的上下文,减少幻觉并增加真实性和实用性。像Pinecone这样的公司的向量数据库已成为RAG的基础设施支柱。
  • 新的开发者工具和应用框架为公司提供了可重用的构建块,以创建更先进的AI应用,并帮助开发者评估、改进和监控生产中的AI模型的性能,包括像Langsmith和Weights & Biases这样的LLMOps工具。
  • 像Coreweave、Lambda Labs、Foundry、Replicate和Modal这样的AI-first基础设施公司正在解除公共云的捆绑,并提供AI公司最需要的东西:大量的GPU以合理的成本、按需可用和高度可扩展,以及一个不错的PaaS开发者体验。

这些技术应该能够在基础模型同时改进的情况下,缩小期望与现实之间的差距。但使模型变得出色只是成功了一半,生成式AI优先的用户体验也在进化:

2. 新兴产品蓝图

  • 生成式界面:基于文本的对话用户体验是LLM的默认界面。渐渐地,新的形态进入了武器库,从Perplexity的生成用户界面到Inflection AI的语音发声等新的模态。
  • 新的编辑体验:从Copilot到导演模式(Director‘s Mode)。随着我们从Zero-shot到ask-and-adjust(感谢Zach Lloyd),生成式AI公司正在发明一套新的旋钮和开关,它们看起来与传统的编辑工作流程非常不同。Midjourney的新的平移命令和Runway的导演模式创造了新的相机般的编辑体验。Eleven Labs使得通过提示(Prompt)操作声音成为可能。
  • 越来越复杂的代理系统。生成式AI应用越来越不仅仅是需要人来审查的自动完成或初稿;它们现在有自主权来解决问题、访问外部工具并代表我们端到端地解决问题。我们正稳步从0级进展到5级自主性。
  • 系统范围内的优化。有些公司并不是嵌入单个人用户的工作流程并使该个体更有效,而是直接解决系统范围内的优化问题。你能否选择一部分支持票据或拉取请求并自主地解决它们,从而使整个系统更加有效?

参考材料

[1]https://www.sequoiacap.com/article/generative-ai-act-two/

结尾的思考

当我们接近前沿悖论,当Transformers和扩散模型的新奇性逐渐消失时,生成式AI市场的性质正在发生变化。炒作和快速展示正在为真正的价值和完整的产品体验所取代

在红杉美国,我们仍然坚定地相信生成式AI。这个市场起飞所需的条件在几十年的时间里已经累积起来,市场终于到来了。杀手级应用的出现和终端用户需求的巨大规模加深了我们对市场的信心。

然而,Amara的法则——我们倾向于在短期内高估一项技术的效果,在长期内低估其效果的现象——正在发挥作用。我们在投资决策中运用耐心和判断,密切关注创始人是如何解决价值问题的。公司使用的共享剧本来推动模型性能和产品体验的界限,使我们对生成式AI的第二阶段感到乐观。

专栏作家

深思圈,公众号:深思圈,人人都是产品经理专栏作家。《十五个酷应用玩转树莓派》作者,连续创业者。做过教育、工具和SaaS等行业,关注出海、SaaS和AIGC领域,擅长产品、营销和增长。

本文翻译发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

责任编辑:复兴网网络

最火资讯

关于我们 | 联系我们 | 广告服务 | 法律声明 | 招聘信息 | 网站地图

复兴网版权所有,未经书面授权禁止使用

复兴时报社主办 版权所有:复兴时报社 © 2014-2023 CHINAFXNEWS.com All Rights Reserved.

举报邮箱: chinafxnews@163.com

电脑版 | 移动版