工作流¶
Workflow和Agent的差异¶
在理解了智能体作为“工具”和“协作者”两种模式后,我们有必要对Workflow和Agent的差异展开讨论,尽管它们都旨在实现任务自动化,但其底层逻辑、核心特征和适用场景却截然不同。
简单来说,Workflow 是让 AI 按部就班地执行指令,而 Agent 则是赋予 AI 自由度去自主达成目标。
1️⃣Workflow:即工作流,是指通过预定义的代码路径来编排LLMs和工具的系统,当前的主流“智能体”产品都是以workflow形态为主。
2️⃣Agents:即真正的智能体,Agent是一套依赖大模型 动态地指导自身的流程和工具使用的系统,对如何完成任务保持从始到终的控制。

工作流是一种传统的自动化范式,其核心是对一系列任务或步骤进行预先定义的、结构化的编排。它本质上是一个精确的、静态的流程图,规定了在何种条件下、以何种顺序执行哪些操作。一个典型的案例:某企业的费用报销审批流程。员工提交报销单(触发)-> 如果金额小于500元,直接由部门经理审批 -> 如果金额大于500元,先由部门经理审批,再流转至财务总监审批 -> 审批通过后,通知财务部打款。整个过程的每一步、每一个判断条件都被精确地预先设定。
与工作流不同,基于大型语言模型的智能体是一个具备自主性的、以目标为导向的系统。它不仅仅是执行预设指令,而是能够在一定程度上理解环境、进行推理、制定计划,并动态地采取行动以达成最终目标。LLM在其中扮演着“大脑”的角色。一个典型的例子,便是智能旅行助手。当我们向它下达一个新指令,例如:“你好,请帮我查询一下今天北京的天气,然后根据天气推荐一个合适的旅游景点。” 它的处理过程充分展现了其自主性:
- 规划与工具调用:Agent首先会把任务拆解为两个步骤:① 查询天气;② 基于天气推荐景点。随即,它会自主选择并调用“天气查询API”,并将“北京”作为参数传入。
- 推理与决策:假设API返回结果为“晴朗,微风”。Agent的LLM大脑会基于这个信息进行推理:“晴天适合户外活动”。接着,它会根据这个判断,在它的知识库或通过搜索引擎这个工具中,筛选出北京的户外景点,如故宫、颐和园、天坛公园等。
- 生成结果:最后,Agent会综合信息,给出一个完整的、人性化的回答:“今天北京天气晴朗,微风,非常适合户外游玩。为您推荐前往【颐和园】,您可以在昆明湖上泛舟,欣赏美丽的皇家园林景色。”
在这个过程中,没有任何写死的if天气=晴天 then 推荐颐和园的规则。如果天气是“雨天”,Agent会自主推理并推荐国家博物馆、首都博物馆等室内场所。这种基于实时信息进行动态推理和决策的能力,正是Agent的核心价值所在。
总结:
- 什么是大语言模型驱动的智能体?我们首先明确了其定义,理解了现代智能体是具备了能力的实体。它不再仅仅是执行预设程序的脚本,而是能够自主推理和使用工具的决策者。
- 智能体如何工作?我们深入探讨了智能体与环境交互的运行机制。我们了解到,这个持续的闭环是智能体处理信息、做出决策、影响环境并根据反馈调整自身行为的基础。
- 如何构建智能体?我们以“智能旅行助手”为例,亲手构建了一个完整的、由真实LLM驱动的智能体。
- 智能体有哪些主流的应用范式?最后,我们将视野投向了更广阔的应用领域。我们探讨了两种主流的智能体交互模式:一是以GitHub Copilot和Cursor等为代表的、增强人类工作流的“开发者工具”;二是以CrewAI、MetaGPT和AgentScope等框架为代表的、能够独立完成高层级目标的“自主协作者”。同时讲解了Workflow与Agent的差异。
Dify¶
Coze = Bot as a Service (机器人即服务)
Dify = LLM App as a Service (AI应用即服务)
N8N = Workflow as a Service (工作流即服务)
Coze¶
FastGPT¶
Computer Use Agent¶
Hugging Face¶
以模块化和易用性为核心,用户可通过灵活组合工具完成从实验到生产的全流程。免费版可用、社区(200万+)、基于模型库构建AI流程,支持工具调用与链式推理。
Manus¶
n8n¶
ComfyUI¶
LangChain¶
开源的工作流自动化平台,结合了可视化操作与代码灵活性,支持跨平台集成和复杂流程编排。开源、社区(Star 70k+)、代码构建链式工作流,集成多类工具。
腾讯元器¶
百度云千帆¶
参考:
https://mp.weixin.qq.com/s/feABoM0SFQEdFRIi_c3v7w