Leanku

渐入佳境便是我对人生的最大祝福…

OpenClaw +QQ机器人

OpenClaw +QQ机器人助手 OpenClaw 适用于任何操作系统的 AI 智能体 Gateway 网关，支持 WhatsApp、Telegram、Discord、iMessage 等。发送消息，随时随地获取智能体响应。通过插件可添加 Mattermost 等更多渠道。 1. 搭建 OpenClaw 可参考官方文档，按需选择适合的安装方式。如果服务器上安装了1Panel,可以直接从应用商店安装 2. 接入 QQ 1. 申请 QQ 机器人打开 QQ 开放平台，注册登录，然后创建 QQ 机器人。地址： https://q.qq.com 创建完成后，进入机器人的开发管理页面，找到 AppID 和 AppSecret，复制保存好，等会要用。还要把你云服务器的公网 IP 添加到 IP 白名单里，然后保存。在沙箱配置里给你的 QQ 账号（或者 QQ 群）添加访问机器人的权限： 2. 给 OpenClaw 绑定 QQ 机器人安装 qqbot 插件 https://github.com/BytePioneer-AI/openclaw-china 远程登录到云服务器上，执行命令来安装 @openclaw-china/qqbot 插件。 openclaw plugins install @openclaw-china/qqbot 安装插件成功后,配置QQ 机器人参数，用之前保存的 id 和 secret ： openclaw config set channels....

LeanNav | 精选开发者导航。nav.leanku.com

LeanNav | 精选开发者导航。nav.leanku.com https://nav.leanku.com LeanNav | 精选开发者导航。一个简洁的精选开发者导航网站。旨在整合高质量网站、工具等资源，分享给更多需要的人。汇集全球优质编程资源、设计素材和实用工具，为开发者提供最高效的上网导航。如果你感兴趣或者需要分享、建议、反馈… 请邮件联系我： support@leanku.com

闻言录｜字句成录，回响为闻。 www.wenyanlu.cn

闻言录｜字句成录，回响为闻。 https://www.wenyanlu.cn 闻言录｜字句成录，回响为闻。一个以诗词、句子为核心的现代数字平台。大道至简，极简设计。换一句，多维度推荐开放收藏、投稿功能提供开放API 公开服务状态 AI集成完善中如果你也喜欢或者有想法、建议、问题等请邮件联系我： support@leanku.com

从零到一搭建个人AI知识库

从零到一搭建个人AI知识库为什么要搭建个人AI知识库？电脑里存了几百个文档，却怎么也找不到上周写的那份技术方案；收藏了无数篇优质文章，等到想用时却像大海捞针。在这个信息过载的时代，我们每个人都在知识管理的泥潭中挣扎。 AI知识库，正在改变这一切。想象一下：当你需要某个资料时，不用在十几个软件间来回切换，只需在一个搜索框里输入问题，AI就能立即从所有文档中精准定位，不仅给出答案，还会把相关内容整理好放在你面前。本篇将介绍从零开始，一步步搭建一个属于自己的AI知识库。一、理解核心概念：什么是RAG？ RAG（检索增强生成，Retrieval-Augmented Generation）传统的AI大模型（如GPT）虽然知识渊博，但它们有一个致命缺陷：知识是固定的，且可能产生“幻觉”（编造出看似合理但完全错误的信息） RAG的出现完美解决了这个问题。它的核心思想可以形象地理解为“给AI递小抄”——在回答问题前，先从外部知识库中检索出最相关的信息，然后将这些信息连同问题一起“喂”给AI，让它基于给定的材料进行回答。这就像一场开卷考试：AI不再是凭记忆瞎编，而是有参考资料可以查阅。一个完整的RAG系统包含两个阶段：阶段一：索引构建（离线） ——把文档“搬进”知识库加载：读取PDF、Word、Markdown等各种格式的文档切分：将长文档切成语义完整的小块向量化：通过嵌入模型将文本块转换成高维数字向量存储：将向量存入专门的向量数据库阶段二：检索生成（在线） ——回答用户问题用户提问 → 将问题也转换成向量检索：在向量数据库中找最相似的Top K个文本块增强：将检索结果与问题组合成提示词生成：AI基于参考资料生成准确回答这个流程听着复杂，但现在有大量开源工具帮你自动完成这一切。二、选择工具链搭建AI知识库，你不需要从零写代码。以下几类工具可以大幅降低门槛： 2.1 大模型（AI的大脑） Ollama + DeepSeek：本地部署方案。Ollama是一个模型管理工具，设计思路类似于Docker，专门针对AI模型进行了优化。执行 ollama run deepseek-r1 就能自动下载并运行模型。数据完全留在本地，隐私无忧。云API（DeepSeek API、OpenAI等）：无需本地显卡，按调用量付费，开箱即用。对于个人知识库，推荐先从Ollama + DeepSeek入手——免费、隐私保护、够用。 2.2 向量数据库（知识的仓库）向量数据库是RAG系统的核心存储组件。以下是主流选择：数据库特点适合场景 Chroma 轻量级，Python原生，上手最快快速原型、个人项目 Qdrant 性能优秀（5-8ms），单服务部署简单中小规模生产项目 Milvus 性能最强（4-6ms），但需3个服务（etcd+MinIO）大规模、企业级 PgVector PostgreSQL扩展已有PostgreSQL的项目个人项目推荐从Chroma或Qdrant开始，资源占用低，部署简单。 2.3 一站式平台如果你不想自己拼装各个组件，这些开源平台可以一站式搞定： AnythingLLM：开箱即用，支持多种文档格式，可本地部署. Dify：功能全面的开源LLM应用开发平台，支持可视化工作流 FastGPT：国产开源，知识库功能强大，高性能RAG框架 MaxKB：轻量级，知识库优先的垂直解决方案三、动手搭建：两种路径路径一：零代码/低代码步骤1：安装Ollama并下载模型 # 安装Ollama（Mac/Linux） curl -fsSL https://ollama....

RAGFlow

RAGFlow 一、介绍 RAGFlow是一个完整的、开源的RAG（检索增强生成）系统。你可以把它看作一个已经搭建好的智能问答应用框架。 RAGFlow不是一个需要你从零编码的库，而是一个可以直接运行起来的服务。它内置了我们聊过的RAG的完整流程：上传文档 -> 自动解析 -> 切片 -> 调用Embedding模型生成向量 -> 存储 -> 检索 -> 调用大模型生成回答。 RAGFlow 官网二、搭建一个智能问答系统整体架构：你的文档 (PDF/Word/PPT) ↓ [RAGFlow核心] ├─ 深度文档解析 → 保留表格/图片/格式 ├─ 智能分块 → 按语义切割文档 ├─ 向量化 → 调用Embedding模型 └─ 向量存储 → 存入数据库 ↓ 用户提问 → [检索引擎] → [你的微调模型] → 带引用的精准回答 2.1 部署RAGFlow 这里使用 Docker 方式环境要求： CPU ≥ 4 cores (x86); RAM ≥ 16 GB; Disk ≥ 50 GB; Docker ≥ 24.0.0 & Docker Compose ≥ v2....

向量数据库-Qdrant使用

向量数据库Qdrant使用一、什么是向量数据库？向量数据库是专门用于存储、管理和检索“向量嵌入（Embedding）”的数据库。 Embedding 的本质：深度学习模型（如 OpenAI 的 text-embedding-3 或本地的 BGE 模型）能将文本、图片等转化为一串高维数值（向量）。在这个高维空间中，语义越接近的数据，其向量距离就越近。核心功能：与传统数据库通过 SQL WHERE 子句匹配关键词不同，向量数据库通过“最近邻搜索（ANN）”寻找语义上最相似的内容。它是实现 RAG（检索增强生成）技术的关键。常见向量数据库数据库特点适用场景 Milvus 超大规模、分布式海量数据、互联网 Qdrant 易部署、性能高、支持过滤企业级 AI 应用 Weaviate GraphQL、模块丰富 AI 平台 Chroma 轻量级本地开发、测试 Pinecone SaaS 云服务快速上线 pgvector PostgreSQL 扩展已有 PostgreSQL 项目二、Qdrant介绍 2.1 什么是 Qdrant？ Qdrant 是一款使用 Rust 开发的开源向量数据库，专门用于高性能相似度搜索。主要特点：高性能 ANN 检索 HNSW 索引 REST API gRPC Payload 元数据过滤多向量支持 Snapshot 备份集群部署 Docker 支持 2....

RAG

RAG技术（检索增强生成）引言：当大模型遇上知识库想象一下，你正在参加一场开卷考试。你的面前有两样东西：一个记忆力超群但知识停留在去年的天才同学（这就是大语言模型），以及一个可以随时查阅的最新版百科全书（这就是外部知识库）。你让这位同学回答问题，他既可以凭借自己的记忆作答，也可以随时翻阅百科全书获取最新、最准确的信息。这个场景，就是 RAG（检索增强生成）最形象的比喻。它不是要取代大模型，而是为大模型装上了一个可以实时更新的"知识图书馆"。一、什么是 RAG？ 1.1 官方定义 RAG 全称是 Retrieval-Augmented Generation，中文译为"检索增强生成"。它是一种将信息检索系统与大语言模型的生成能力相结合的技术架构。核心思想很简单：在让大模型回答问题之前，先从一个知识库中检索出与问题最相关的信息，然后将这些信息作为"参考资料"连同原始问题一起交给模型，让它基于这些资料生成最终答案。 1.2 为什么要用 RAG？传统的大语言模型存在三个先天性缺陷：缺陷表现后果知识截止日期模型训练完成后，新发生的事件一概不知问"今天的天气"、“最近的新闻”，模型只能道歉幻觉问题模型会"自信地胡说八道" 在金融、医疗等严肃场景无法直接使用缺乏专业深度对企业内部知识、专业领域知识不了解无法回答基于私域数据的专业问题 RAG 的出现，一次性解决了这三个问题：知识实时更新：只要更新知识库，模型就能"知道" 答案可追溯：每个回答都能找到对应的参考资料低成本私有化：无需训练模型，只需构建知识库 1.3 RAG 的三步工作流程一个标准的 RAG 流程包含三个核心步骤：用户提问："去年的销售额是多少？" ↓ [第一步：检索] ↓ 在向量数据库中搜索 → 找到"2023年财报.pdf"中的相关段落 ↓ [第二步：增强] ↓ 构建新的提示词： "基于以下资料回答问题：【资料】2023年公司财报显示，全年销售额为1.2亿元... 问题：去年的销售额是多少？" ↓ [第三步：生成] ↓ 大模型生成："根据公司财报，2023年的销售额为1.2亿元。" 二、RAG 的核心技术组件要深入理解 RAG，需要认识它的三个核心技术组件： 2.1 向量化与嵌入模型是什么：将文本转化为计算机能够理解的数学向量（一组数字）。为什么需要：计算机无法像人类一样理解文字的"含义"，但它擅长计算数字之间的"距离"。通过将文字转化为向量，我们可以用数学方式衡量两段文字的相似度。像 OpenAI 的 text-embedding-3-small 模型，或者本地的 bge-large-zh 模型，都是常用的嵌入模型。...

模型微调

模型微调一、模型微调到底是什么简单来说，模型微调就是让一个已经博学多才的“通才”，通过针对性的“岗前培训”，变成精通某个领域的“专家”。预训练模型（通才大厨）：就像一位精通全球菜系的米其林大厨，他掌握了所有的基础知识和烹饪技巧，但未必了解你餐厅的特色。微调（岗前培训）：你想开一家川菜馆，于是让这位大厨用三个月时间，专门学习川菜的食材、调料和烹饪手法。微调后的模型（川菜大师）：最终，他不仅保留了原有的厨艺基础，更能做出一手地道的麻婆豆腐，成为了川菜领域的专家。这个过程直接调整模型的“大脑”（参数），让学到的技能内化为模型自身的能力。相比于RAG（它更像是让大厨在做菜时随时翻阅菜谱），微调后的模型在推理时速度更快，且能深度掌握某种特定的风格或知识。二、核心技术：LoRA——四两拨千斤的微调利器你可能会担心，重新训练一个包含几十亿甚至上千亿参数的大模型，得需要多强大的计算资源？这正是LoRA（低秩自适应）技术大显身手的地方。它的核心思想非常巧妙，我们可以继续用“川菜大厨”的比喻来理解全量微调：相当于让大厨忘掉过去的一些习惯，全身心地重新学习川菜的每一个步骤。效果最好，但成本极高，需要强大的算力支持。 LoRA微调：我们不动大厨已经固化的核心“厨艺”（预训练权重），而是给他一个轻量级的“川菜秘方贴纸”（低秩矩阵）。这张贴纸只记录了川菜的关键调整点，比如“多加花椒”、“牛油比例提升”。大厨在做川菜时，只需要在关键步骤上参考这张贴纸即可。这样做的好处是巨大的：显存占用低：可训练的参数通常只有不到1%，让在消费级显卡（如RTX 4090）上微调大模型成为可能。训练速度快：大幅缩短了训练时间。模型性能高：在绝大多数任务上，效果可以媲美全量微调。 QLoRA 则是LoRA的进阶版，它先把基础模型“压缩”（量化）到4位精度，再应用LoRA，进一步降低了硬件门槛。三、具体如何实现理解了原理，我们来看看如何上手。你完全不需要从零开始写复杂的训练代码。这里有两条清晰的路径：路径一：使用云端服务（最简单、快速上手）这是最省心的方式，你只需要准备好数据，在云平台上点点鼠标，就能完成微调。例如华为云的ModelArts Studio，流程大致如下：准备数据：整理好你的训练集（如客户问答对、特定风格的文本等）。选择模型：在平台界面选择你想要微调的基础模型，例如盘古大模型。配置任务：选择“微调”训练类型，并可以灵活选择“全量微调”或“LoRA微调” 。然后设置一些基本参数，如：学习率：决定模型参数更新的幅度，通常设为很小的值如 2e-5 。训练轮数：整个数据集被训练的遍数，通常设为 3 以避免过拟合。数据批量大小：每次处理的数据量，根据你的资源情况设定。启动训练：提交任务，等待训练完成。过程中可以观察损失值（Loss）曲线，它应该呈下降趋势，代表模型在有效学习。部署使用：训练完成后，平台会自动生成一个微调后的模型版本，你可以像调用普通API一样，通过PHP代码来使用这个专属模型。路径二：使用本地开源工具（更灵活、适合动手实践）如果你想在自己的电脑上体验整个过程，Ollama + Python是一个非常棒的组合，它让微调变得异常简单。步骤如下： 1. 安装Ollama 参考另一篇 Ollama搭建本地我们选择一个轻量级模型，普通电脑也能流畅运行 ollama pull llama2 2. 准备微调数据微调的核心是数据。我们将创建一个非常简单的数据集，让模型学习用莎士比亚的风格回答问题。 2.1 创建项目目录在合适的位置新建一个文件夹： mkdir ollama-finetune-demo cd ollama-finetune-demo 2.2 创建Python虚拟环境...

Embedding：理解语义的基础

Embedding：理解语义的基础引言：当计算机学会了"理解"含义在上一篇文章中，我们讨论了大语言模型的工作原理。但有一个根本问题还没解决：计算机是如何"理解"词语含义的？计算机只能处理数字，它不认识"猫"，不认识"爱情"，更不懂"苹果"和"橘子"的相似性。但今天的AI不仅能理解这些概念，还能进行语义推理。这一切的基石就是 Embedding（嵌入）。一、什么是Embedding？ 1.1 从一个思想实验开始想象你要向一个来自外星、不懂任何人类语言的外星人解释"苹果"这个词。你会怎么做？你可以给他一个多维度的描述：维度描述颜色通常是红色或绿色形状圆形大小拳头大小味道甜或酸甜口感脆用途可以吃 … … 如果把这些维度变成数字，就得到一个向量：苹果 = [红色: 0.9, 圆形: 0.8, 大小: 0.5, 甜度: 0.7, 脆度: 0.8, 可食用: 1.0, ...] 这就是Embedding的基本思想：用一个数字数组（向量）表示一个概念的含义。 1.2 正式定义 Embedding（嵌入）是将离散的符号（词语、句子、图片等）映射到连续向量空间的技术。每个符号被表示为一个固定长度的实数向量。关键特性：语义相近的符号，向量距离也相近向量之间可以进行数学运算向量的维度（长度）通常在几十到几千之间 1.3 直观理解：语义空间地图可以把Embedding想象成绘制了一张"语义空间地图"： [国王] ↑ 男人 ↑ [苹果] ← 水果 → [橘子] [王后] ↑ / 女人 / ↑ / [女王] 在这张地图上：...

AI Agent

AI Agent：从"回答问题"到"主动行动"的智能体引言：当AI从"思考者"变成"行动派" 到目前为止，我们讨论的所有AI应用都有一个共同点：被动响应。你问一个问题，模型给出一个回答。就像一位知识渊博但从不主动行动的学者。而 AI Agent（智能体）将彻底改变这个模式。它不再是单纯的"问答机器人"，而是一个能够自主理解目标、规划步骤、调用工具、执行行动的智能系统。用一个形象的比喻来理解AI的进化：阶段比喻能力基础LLM 刚毕业的大学生知识丰富，但只会回答问题 RAG增强配备了图书馆的大学生能查阅资料，回答更准确微调模型经过专业培训的专家在特定领域更精通 AI Agent 项目经理 + 执行团队能接收任务，规划执行，调用资源，交付成果一、什么是AI Agent？ 1.1 核心定义 AI Agent（智能体）是一个能够感知环境、自主决策、执行行动以达到特定目标的智能系统。它具备以下核心特征：自主性：无需人工干预，自主运作目标导向：所有行动都围绕达成目标工具使用：能调用外部工具完成任务记忆能力：记住历史，持续优化规划能力：将复杂任务拆解为可执行的步骤 1.2 Agent vs 传统程序 vs LLM 对比维度传统程序大语言模型(LLM) AI Agent 工作方式按固定逻辑执行按输入生成输出自主规划并执行灵活性低，只能做预设的事中，能处理多种问题高，能适应新任务工具使用内置固定功能无（需外部配合）主动调用各种工具记忆能力有状态但有限会话级记忆长期记忆+经验积累目标理解执行指令理解问题理解意图并拆解 1....