今天学习了一节讲座,介绍了大模型的局限性,以及智能体和工作流的作用。笔记如下:
在实际应用中,大模型存在明显局限。一方面,它无法在特定步骤停留以实现内容迭代;另一方面,其底层训练数据存在时效性短板,多停留在2023年或2024年,若2025年出现新理论、新教学框架,单纯依赖大模型难以输出贴合新框架的结果。不过,部分大模型产品右下角的“联网搜索”功能,可通过获取最新资源在一定程度上弥补这一缺陷。
针对大模型的“幻觉”问题,RAG(检索增强生成)技术能有效解决。该技术可避免大模型调取过往数据时出现信息混乱,通过匹配数据库或知识库中与当前任务更契合的内容来输出结果。
鉴于大模型自身的局限性,以大模型为基座构建智能体,成为执行精准、具体任务的关键方案。智能体可通过传感器感知环境、制定决策,并借助执行器采取行动。在日常AI产品使用中,用户输入文本即向智能体传递信息,文本会转化为向量,大模型的知识库则依据向量匹配最优字段(Token)并输出,此过程可视为智能体的“行动”。若需生成图片、视频等内容,智能体还会调用相应工具。
例如,纯文本输出类智能体,可通过设定基础信息、提示词、专属知识库,若有特殊需求还能调用工具,进而完成特定任务。如实验项目检索智能体,用户输入“自制指南针”的需求,它会按预设输出规范精准检索并反馈结果。
在工具调用方面,图片生成智能体与文本对话智能体存在差异。前者需选中“图片生成”工具,且会先根据提示词向用户确认细节。如用户提出“创作两只猫晒太阳的图”,智能体会询问更多画面细节,待用户补充后,再依据描述生成准确图片。
智能体虽能改善大模型的部分问题,但面对复杂任务仍有局限。例如设计教案时,若需精准输出每个教学环节,且各环节间存在逻辑关联(如先依理论设计学生活动,再基于该活动设计评价指标),单一智能体可能因无法实现多轮交互、易修改全部内容等问题难以满足需求。此时,需多个智能体以“工作流”形式协同作业。
工作流是完成复杂任务的标准化流程,借助大语言模型技术简化或自动化任务流程。
例如,一个“基于设计思维的创作助手”工作流可包含五个智能体:
定义需求:引导学生明确项目目标与用户需求;
方案构思:引导学生进行头脑风暴;
原型制作:指导学生创建原型;
反馈验证:对原型(如代码)进行可行性检查;
测试优化:组织测试并推动改进。
每个智能体专注特定子任务,通过分工协作实现高质量、结构化的输出。
总结一下,大模型虽功能强大,但在时效性、准确性和复杂任务处理上存在局限。通过引入RAG、智能体及多智能体工作流,能够有效弥补这些不足,推动AI应用向更精准、可控、高效的方向发展。