生成式AI进入第二阶段了_复兴网_复兴新闻网

去年的今日，红杉美国官网发表了一篇题为《Generative AI: A Creative New World》的文章，我个人认为当时的那篇文章代表着新一轮Paradigm shift（范式转移）的开始，拉开了AIGC时代的序幕。原文作者是红杉的两位合伙人：Sonya Huang和Pat Grady，当时我也在第一时间翻译了那篇文章，并且在国内广为流传。那篇文章也可以说是开启了我自己的AIGC的创业之路，无论是深思圈自媒体还是自己的创业项目，都因此发生了巨大的变化。

时间过得很快，转眼间一年时间就过去了。红杉美国的两位投资人作者又带来最新的一周年新文章——《Generative AI’s Act Two》，让我们一同来回顾一下过去一年里AIGC发生了哪些巨大变化，以及接下来的第二阶段，又会有哪些新的东西出现呢？

此外，我们还加入了一个新的LLM开发者栈，反映了公司在生产中构建生成型AI应用时转向的计算和工具供应商。

但人们会继续使用吗？并不真的。下面的图表比较了AI优先应用与现有公司的第一个月移动应用保留率。

用户参与度也不佳。一些最好的消费公司有60-65%的DAU/MAU；WhatsApp的为85%。相比之下，生成式AI应用的中位数为14%（Character和“AI陪伴”类别是显著的例外）。这意味着用户还没有在生成式AI产品中找到足够的价值，以至于每天都在使用它们。

简而言之，生成式AI最大的问题不是寻找使用案例、需求或分发，而是证明价值。正如我们的同事David Cahn所写：“2000亿美元的问题是：你打算使用所有这些基础设施来做什么？它如何改变人们的生活？”建立持久的业务的路径将需要解决保留问题，并为客户生成足够深入的价值，使他们坚持并成为每日活跃用户。

但我们不应该绝望。生成式AI仍处于其“尴尬的青春期”。有时会有卓越的迹象，当产品没有达到预期时，失败通常是可靠的、可重复的且可修复的。我们的工作摆在面前。

五、第二阶段分析

创始人正在进行prompt工程、微调和数据集策划的艰苦工作，以使他们的AI产品优秀起来。他们正在逐步地建设，将引人注目的Demo演示变成完整的产品体验。与此同时，基础模型底层继续充满研究和创新。

随着公司找到持久价值的路径，正在发展一个共享的剧本。我们现在有了共享的技术来使模型变得有用，以及将塑造生成式AI第二幕的新兴UI范式。

1. 模型开发栈

新兴的推理技术，如连锁思考、树状思考和反射，正在提高模型执行更丰富、更复杂的推理任务的能力，从而缩小了客户期望与模型能力之间的差距。开发者使用像Langchain这样的框架来调用和调试更复杂的多链序列。
迁移学习技术，如RLHF和微调，正变得更加可用，特别是随着GPT-3.5和Llama-2的微调的最近可用性，这意味着公司可以将基础模型适应其特定领域，并从用户反馈中改进。开发者从Hugging Face下载开源模型，并微调它们以实现优质的性能。
检索增强生成（RAG）正在引入关于业务或用户的上下文，减少幻觉并增加真实性和实用性。像Pinecone这样的公司的向量数据库已成为RAG的基础设施支柱。
新的开发者工具和应用框架为公司提供了可重用的构建块，以创建更先进的AI应用，并帮助开发者评估、改进和监控生产中的AI模型的性能，包括像Langsmith和Weights & Biases这样的LLMOps工具。
像Coreweave、Lambda Labs、Foundry、Replicate和Modal这样的AI-first基础设施公司正在解除公共云的捆绑，并提供AI公司最需要的东西：大量的GPU以合理的成本、按需可用和高度可扩展，以及一个不错的PaaS开发者体验。

这些技术应该能够在基础模型同时改进的情况下，缩小期望与现实之间的差距。但使模型变得出色只是成功了一半，生成式AI优先的用户体验也在进化：

2. 新兴产品蓝图

生成式界面：基于文本的对话用户体验是LLM的默认界面。渐渐地，新的形态进入了武器库，从Perplexity的生成用户界面到Inflection AI的语音发声等新的模态。
新的编辑体验：从Copilot到导演模式（Director‘s Mode）。随着我们从Zero-shot到ask-and-adjust（感谢Zach Lloyd），生成式AI公司正在发明一套新的旋钮和开关，它们看起来与传统的编辑工作流程非常不同。Midjourney的新的平移命令和Runway的导演模式创造了新的相机般的编辑体验。Eleven Labs使得通过提示（Prompt）操作声音成为可能。
越来越复杂的代理系统。生成式AI应用越来越不仅仅是需要人来审查的自动完成或初稿；它们现在有自主权来解决问题、访问外部工具并代表我们端到端地解决问题。我们正稳步从0级进展到5级自主性。
系统范围内的优化。有些公司并不是嵌入单个人用户的工作流程并使该个体更有效，而是直接解决系统范围内的优化问题。你能否选择一部分支持票据或拉取请求并自主地解决它们，从而使整个系统更加有效？

参考材料

[1]https://www.sequoiacap.com/article/generative-ai-act-two/