--- number headings: first-level 2, max 6, 1.1. --- # 基础篇 - AI大模型的核心概念与基础使用 ## 1. AI大模型是什么? 1. 想象有一个人,这个人在以下环境中长大 2. 情景 1. 黑屋子,这个人听到‘peng’的一声,可能是没有任何反应,也可能哭起来。 2. 广州城市,这个人听到‘peng’的一声,也许会想:“这是什么声音?” 3. 广州城中村,这个人听到‘peng’的一声,也许会想:“谁家放鞭炮!” 4. 以色列,这个人听到‘peng’的一声,可能会想:“我有没有中枪!” 3. 分析: 1. 黑屋子里长大的,这个人的大脑没有任何处理信息的模式,与想法,他的大脑就是一个有机的结构复杂的神经运算网络。 2. 下面三种,在特定的环境,人文条件下,长期大量信息训练出的,有固定处理信息模式的个体。 4. 总结 1. 我们常见的大模型:ChatGPT,ChatGLM,文言一心,讯飞星火,LLAMA等等,都属于2,3,4这几种,即经过训练的神经运算网络 3. 同样一个神经运算结构,没经过任何训练,对于信息的处理不可预期,取决于这些神经元初始化的参数。 5. 我们考虑一个大模型, 1. 运算结构,参数量,可以处理更多的信息 2. 训练数据,有更好的逻辑性,基础处理能力。 ## 2. AI大模型能解决什么问题? > 大模型 ==== 一个非常新的实习生 > 1. 实习生会成长,很快就能学会主动发现问题,尝试分析解决问题, > 2. 大模型永远都只能按要求做事,而且要求说的不明白,他还干不好, 我刚刚毕业的时候,入职一家公司,我的带教导师给我一个程序开发任务,给了我一份文档里面详细的写了任务的要求: > 任务的目标,”用户请求账户余额时,返回多两个字段,一周内支出总额,一周内的收入总额“。 > 详细的程序逻辑说明,如何获取原始数据,如何处理,循环解析出哪些字段,条件如何判断。 > 运行后,要校验哪些结果。 我做这项工作时,我不需要分析这个任务需要如何解决,我实际上只做了,生成一段代码,执行这段代码,生成校验结果。 如果他真的是给一个大模型布置任务,任务目标的描述可能就会改为: > 帮我写一段COBOL程序 > 通过一个账号ID,得到近一周的消费记录,循环解析这个数组里的数据,分别统计type值为income和outcome的总金额 > 调用这段程序,传入参数‘AC33841’,校验返回值分别为income = 100, output = 200时,为正确 所以说:大模型,其实只会生成内容 > 根据用户给定的资料 > 按照用户给定的逻辑 > 生成用户想要的内容 ## 3. 大模型应用核心概念与技术 ### 3.1. 让大模型更好的工作 1. 再次教育 2. 清晰的描述用户需求 3. 提供足够,并且准确的数据,让AI可以有依据 ### 3.2. 任务描述 提示词 ### 3.3. 熟悉用户私有数据 embedding数据 & 原始数据 知识库,数据准备,标注 [关于向量的一些问题](https://chat.openai.com/share/30935bc2-ad74-4385-b6c7-b9fa5b7b1ae8) ### 3.4. 再次教育 大模型的微调,就当成于是把一个直挺挺的松树砍成迎客松。 通过学习二次训练的业务场景的数据,这个模型的将更家适应这个业务场景的需求,或受到对应的约束。 ## 4. 用起来 ### 4.1. 可以生成哪些内容 1. 基本格式 1. 文本内容 2. 图片 3. 语音 4. 视频 2. 具体扩展 1. 图片--》流程图--》程序调用顺序说明 2. 文本--》代码--》SQL语句--》任务清单 3. 语音--》唱一首歌 ### 4.2. OLLAMA一个可以本地运行的AI模型工具 安装与运行 试验 ## 5. 家校互动3.0 - 产品AI功能设计 ### 5.1. AI教学辅助 1. 根据知识点,由AI生成教案 2. 根据教案中的知识点,讲解预习资料,提出思考问题! 3. 回复知识点,回顾预习过程中的问题,根据知识点,解答预习时的思考问题! 4. 作业对错分析,学生给出解题思路,AI判断对与错,统计知识点点的掌握情况。 ### 5.2. AI综合分析 1. 复习与作业 2. 知识点掌握情况 3. 预习情况 4. 其他方面,如课堂表现、同学相处、行为举止,老师给出评价 5. AI汇总结出总结 ![2024030714-KctzA2|900](https://picbed-1253586264.cos.ap-guangzhou.myqcloud.com/uPic/2024030714-KctzA2.png) ## 6. 研发框架 1. 开发框架Langchain,大模型开发的spring 2. 模型 1. 加载本地模型并调用 2. 三方模型的接口调用 3. 支持不同的语言 1. **python**官方原生支持 2. **javascript**官司方原生支持 3. dart 4. golang 4. 处理AI大模型应用的 1. 经验数据,embeddings,原生数据 2. 任务描述数据, 提示词 3. AI大模型调用代理Agent,处理用户的输入,整理模型的输出 5. 实操 // TO-PREPARE # 进阶篇 - AI大模型的知识库应用 ## 1. 单次处理的数据数量 如果一次布置了十几项任务,最后能记住几个就不错了。 AI大模型也会有这样的问题,接收一次任务的数据,不能超出限制。 ## 2. Token - AI模型的表义单元 # 高阶篇 - 训练