从Agent进阶至Agentic,探索超越基础模型的下一代人工智能
与其争论哪些工作才算是真正的 Agent,不如承认系统可以具有不同程度的 Agentic 特性。” —— 吴恩达。

Agentic AI:超越基础模型的下一代 AI — 来自吴恩达的洞察
“与其争论哪些工作才算是真正的 Agent,不如承认系统可以具有不同程度的 Agentic 特性。” —— 吴恩达
2024年 Snowflake 峰会开发者日上,人工智能领域的领军人物吴恩达 (Andrew Ng) 发表了题为“AI 代理工作流及其推动 AI 进展的潜力 (How AlAgentic workflows could drive more Al progress than even the next generation of foundation models)”的演讲,为我们揭开了 Agentic AI 的神秘面纱,并指出这可能是比下一代基础模型更具潜力的 AI 发展方向。
Agentic AI :从 Agent 到 Agentic,开启 AI 新纪元
近年来,大型语言模型 (LLM) 如 GPT-3、GPT-4 等的出现,为人工智能领域带来了前所未有的突破。然而,传统的 LLM 交互方式更像是一种“非代理型工作流程 (Non-agentic workflow (zero-shot))”,用户输入指令,模型输出结果,缺乏迭代优化的空间,犹如一位才华横溢的作家,却被迫只能按照固定模板写作,无法自由挥洒其创作才能。

Agentic AI 的出现打破了这一僵局,它不再将 AI 系统视为被动接收指令的 Agent,而是赋予其主动思考、规划和执行任务的能力,使其更像是一个能够自主决策的智能体。而实现这一目标的关键,就是“代理型工作流程 (Agentic workflow) ”。
吴恩达指出, Agentic workflow 的核心在于将复杂任务分解成多个步骤,并通过循环迭代的方式逐步优化结果。这种工作方式更接近于人类解决问题的思维模式:
-
目标设定: 明确任务目标,例如“写一篇关于 Agentic AI 的文章”。
-
规划分解: 将任务分解成多个子任务,例如“确定主题、搜集资料、撰写内容、修改润色”等。
-
迭代执行: 依次执行每个子任务,并根据反馈结果进行调整和优化,最终完成目标。
LLM-based agents:Agentic Workflow 大显身手的舞台
吴恩达在演讲中,特别以 “基于 LLM 的智能体 (LLM-based agents)” 为例,展示了 Agentic Workflow 如何提升 AI 系统的性能表现。
传统的 LLM 交互方式类似于“一次性 prompting ”,用户输入一个指令,模型生成一个输出,缺乏迭代优化的空间,难以处理复杂的任务。而 Agentic Workflow 则将 LLM 视为一个智能代理,通过多轮对话和反馈机制,引导 LLM 逐步完善输出结果。
为了验证 Agentic Workflow 的效果,吴恩达的团队进行了一项基于代码生成基准测试集 HumanEval (Coding Benchmark (HumanEval)) 的实验。

实验结果表明,即使是性能相对较弱的 GPT-3.5 模型,在采用 Agentic Workflow 后,其代码生成性能也能超过 GPT-4。下图展示了不同模型在 HumanEval 基准测试中的性能对比:

从图中可以看出,采用 Agentic Workflow 的模型 (橙色点) 普遍取得了优于 Zero-shot 方法的性能表现。这充分证明了 Agentic AI 在突破性能瓶颈方面的巨大潜力。
Agentic vs Agent:一场认知的跃迁
在理解 Agentic AI 的过程中,我们需要厘清一个重要的概念区别:Agent 和 Agentic。
吴恩达在其博客文章中精辟地指出,“Agent” 是一个名词,意味着一种非黑即白的二元划分,而 “Agentic” 则是一个形容词,代表着一种程度概念。
传统的 AI 系统,例如我们熟悉的机器学习算法,大多可以被归类为 Agent。它们接收输入,根据预设的规则进行处理,最终输出结果。然而,Agentic AI 则更进了一步,它不再局限于被动执行指令,而是能够主动感知环境、理解目标,并自主选择行动方案,表现出不同程度的自主性和智能性。
这种从 Agent 到 Agentic 的转变并非一蹴而就,而是一个渐进式的演化过程。正如机器学习领域的发展历程,从早期的线性回归到如今的深度学习,Agentic AI 也需要经历不断的迭代和优化,才能最终实现其全部潜力。
更重要的是, Agentic 这一概念的提出,意味着我们不再纠结于 AI 系统是否真正具备了“智能”,而是将关注点放在了系统能够表现出多少“智能”上。这是一种认知上的重大转变,也是 Agentic AI 区别于传统 AI 的本质特征。
Agentic AI 的应用:从代码生成到视觉任务,重塑各个领域
除了在代码生成领域的突出表现,Agentic AI 在其他领域也展现出巨大的应用潜力,例如:
Vision Agent: 让 AI 看懂世界
在 Snowflake 峰会的演讲中,吴恩达还展示了他的团队开发的一款名为“Vision Agent”的视觉智能体。

Vision Agent 可以像一位经验丰富的程序员一样,根据用户的自然语言指令编写代码,完成各种视觉任务,例如目标检测、图像分割、视频分析等。
例如,用户可以输入指令“帮我找到所有带红色帽子的人”,Vision Agent 就会自动编写代码,识别图像或视频中所有符合条件的目标。

Vision Agent 的工作流程如下:
-
接收指令: 用户输入自然语言指令,例如“计算鲨鱼和最近的冲浪板之间的距离”。
-
生成代码: Vision Agent 根据指令自动生成代码,完成图像处理和分析任务。
-
执行代码: 代码被执行,并输出结果,例如鲨鱼和冲浪板之间的距离。

Vision Agent 的核心是一个名为“Coder Agent”的模块,它负责将自然语言指令转换为可执行的代码。

Coder Agent 的工作原理如下:
-
规划: 根据指令,制定一个计划,列出完成任务所需的步骤。
-
检索工具: 为每个步骤检索所需的工具,例如图像处理函数、目标检测模型等。
-
生成代码: 将计划和工具组合成可执行的代码。
为了进一步提高代码的质量和可靠性,Vision Agent 还引入了一个名为“Tester Agent”的模块,它负责对 Coder Agent 生成的代码进行测试和评估。

Tester Agent 的工作原理如下:
-
执行代码: 执行 Coder Agent 生成的代码。
-
检查结果: 检查代码的执行结果是否符合预期。
-
反馈错误: 如果发现错误,将错误信息反馈给 Coder Agent,以便其进行修正。
通过 Coder Agent 和 Tester Agent 的协同工作,Vision Agent 能够自动生成高质量的代码,并完成各种视觉任务。
以下是一些 Vision Agent 的应用示例:
- 检测图像中的人脸,并判断是否佩戴口罩:

- 分析视频,识别交通事故:

吴恩达的呼吁:拥抱 Agentic AI,共创智能未来
吴恩达认为,Agentic AI 的出现是人工智能领域的一场重大变革,它将从根本上改变我们与 AI 的交互方式,也将为人类社会带来巨大的价值。
他呼吁开发者积极拥抱 Agentic AI,探索其应用边界,共同推动 AI 技术的发展。同时,他也提醒人们关注 Agentic AI 可能带来的伦理和社会影响,例如算法偏见、隐私泄露等问题,并呼吁各界共同努力,确保 AI 技术安全可控地发展,为人类创造更加美好的未来。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。


👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

👉4.大模型落地应用案例PPT👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)

👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
最后,感谢每一个认真阅读我文章的人,礼尚往来总是要有的,下面资料虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:
openvela 操作系统专为 AIoT 领域量身定制,以轻量化、标准兼容、安全性和高度可扩展性为核心特点。openvela 以其卓越的技术优势,已成为众多物联网设备和 AI 硬件的技术首选,涵盖了智能手表、运动手环、智能音箱、耳机、智能家居设备以及机器人等多个领域。
更多推荐



所有评论(0)