ai - 技术圈

AI 工程化实战：Go 语言中的 Prompt Caching 优化策略

在 2026 年，衡量一个 AI 后端工程师（Gopher）水平的标准，除了看他能写出多复杂的 Agent 逻辑，更要看他能否在保障性能的同时，把 Token 成本降到极致。

随着 RAG 和长上下文应用的普及，Prompt Caching（提示词缓存） 已成为后端架构中的“省钱神技”。今天我们就来聊聊，作为 Go 开发者，在实战中应如何最大程度地利用厂商的缓存机制。

要利用缓存，首先要明白它的“脾气”。目前的缓存机制主要分为两类：

GoLang 15天前 1029

给 AI 装上“手”：Go 语言 Function Calling 实践

在 2026 年的今天，大模型（LLM）已经展现出了惊人的逻辑推理能力。但如果你真正尝试过构建生产级别的 AI 应用，你一定会发现一个残酷的现实：大模型虽然“聪明”，但它没有“手”。它能为你写出一篇完美的库存分析报告，却无法直接帮你登录后台去扣减一个库存。

为了给大模型装上这双“手”，Function Calling（函数调用） 技术应运而生。它不仅是目前构建 Agentic Workflow（智能体工作流）的核心基石，更是连接“不确定的大模型输出”与“确定的业务逻辑”之间的唯一桥梁。

很多开发者习惯于依赖 LangChain 等重型框架，但对于追求性能与简洁的 Gopher 来说，理解其底层原理并手动实现一套轻量级的函数分发系统，不仅能让架构更清晰，更能大幅降低系统的响应延迟。

GoLang 05月10日 694

Go语言实现MCP服务中的Prompt的实践

在AI应用开发领域，MCP（Model Context Protocol）正在成为连接AI模型与外部系统的标准协议。作为Anthropic推出的开放协议，MCP主要包含三个核心概念：

Prompt（提示模板）用于定义可复用的提示词模板。

Tool（工具）用于扩展AI的能力边界。

GoLang 03月03日 234

用 Go 写 AI 命令行工具的实践

随着各种AI工具的出现，CLI工具也成为了AI应用的一种重要形式。你有没有想过，用 Go 写一个支持流式输出的 AI 命令行工具？

很多 AI 应用都支持 CLI 模式，比如 Claude Code、 CodeBuddy CLI 等，命令行工具有它的优势：启动快、资源占用少、适合开发调试。而且用 Go 写的话，编译出来就是一个单文件，分发特别方便。

这篇文章就来分享一下如何用 Go 实现一个支持流式输出的 AI 命令行工具。

PHP 02月23日 240

Go在AI对话上下文压缩处理上的实践

你有没有遇到过这样的情况：和 AI 聊了十几轮，突然发现它"忘记"了之前说过的内容？或者 API 调用因为 Token 超限直接报错？

这是因为大模型有上下文长度限制，对话越长，历史消息越多，就越容易超限。结合我的理解，这篇文章分享一下如何实现上下文压缩，让你的 AI 应用既能"记住"关键信息，又能节省成本。

GoLang 02月23日 1148

Go 实现 AI 多模型负载均衡的实践

调用大模型 API 时，你有没有遇到过这些问题：某个模型突然限流、响应变慢、甚至直接挂掉？或者 不同模型价格差异大，想根据任务复杂度选择合适的模型？如果你的服务只依赖单一模型，这些问题就是单点故障。解决方案很简单：多模型 + 负载均衡。这篇就聊用 Go 实现 AI 多模型负载均衡的思路和代码。

假设你的应用只调用 OpenAI 的 GPT-4，某天 OpenAI 服务波动，你的应用就跟着「躺平」。更现实的问题是：

GoLang 02月22日 738

Go优雅管理AI应用Prompt的实践

调用大模型 API 时，你是直接拼接字符串，还是用模板管理？如果只是简单调用，字符串拼接够用；但当 Prompt 越来越多、越来越复杂，散落在代码各处的字符串就成了维护噩梦。变量替换、多语言提示、版本化管理，这三个问题不解决，代码迟早变成「意大利面条」。这篇就聊用 Go 实现 Prompt 模板管理的实践。

假设你有一个翻译场景，最简单的写法：

GoLang 02月21日 764

Go 对接向量数据库：Pgvector、Milvus、Qdrant 等客户端的选型

做 RAG、语义检索或推荐时，要把 Embedding 向量 存起来、按相似度查，就得用向量数据库。Go 里常见的选择有三类：Pgvector（PostgreSQL 扩展）、Milvus、Qdrant。选哪个取决于你是否已有 Postgres、数据量和运维成本。这篇就聊这三者在 Go 里的客户端选型和接入要点。

Pgvector：是 PostgreSQL 的一个扩展，向量当一列存。适合本来就用 Postgres 的团队，不想多维护一个组件，数据量在百万级以内、QPS 不是特别夸张时很够用。Go 里用 pgx + pgvector-go 即可。
Milvus：独立向量库，支持大规模、分布式，适合向量数据量很大或要单独扩缩容的场景。官方有 milvus-sdk-go，接口偏「集合 + 列式插入 + 建索引再搜」。
Qdrant：也是独立向量库，API 设计偏 REST/gRPC，过滤条件（payload filter）和多向量支持比较顺手。Go 用 github.com/qdrant/go-client，文档和示例都比较全。

GoLang 02月20日 262

如何用 Go 实现 RAG？文档切块、向量化与检索实践

想让大模型回答你公司内部文档的问题？直接喂文档太占 Token，而且模型会「忘记」长内容。RAG（检索增强生成） 的做法是：把文档切块、转成向量存起来，用户提问时先检索相关片段，再把片段和问题一起发给模型，让它基于这些上下文回答。实现一套 RAG 服务，核心就三步：文档切块、向量化、检索。

大模型有两个局限：上下文长度有限（不能塞太多文档）、知识有时效性（训练数据可能过时）。RAG 的做法是：

GoLang 02月19日 218

Go语言计算向量相似度的解决方案

用 Go 做语义检索、推荐或 RAG 时，总要算向量相似度。做法大致三种：自己写几行、用数值库、或者交给向量数据库。下面按「方案」捋一捋，方便你按场景选。

向量相似度用在语义检索、推荐、去重聚类等场景很常见，但数据量差别很大：有时就几百几千个向量在内存里算，有时是百万级要做近似最近邻（ANN）检索。所以没有一种写法能通吃，有的场景适合手写，有的适合用库，有的直接上向量库。下面分别说。

GoLang 02月18日 230

Go 做 Function Calling 服务端：解析 tool_calls 与执行逻辑

大模型支持「工具调用」后，对话里可以查天气、查库、调 API；模型会返回该调用哪个函数、传什么参数。服务端要做的，就是解析模型返回的 tool_calls、执行对应逻辑、把结果塞回对话。用 Go 实现，结构清晰、易维护。下面说清楚解析、执行与一整轮怎么串起来。

Function Calling（Tool Use）指：你把可调用的函数列表以 JSON Schema 等形式传给大模型，模型在需要时会在回复里带 tool_calls，指明函数名和参数。服务端解析后执行真实逻辑，把结果再发给模型，由模型生成最终回答。

GoLang 02月17日 246

AI 中的 Skill 会完全取代 MCP 吗？

最近在折腾 Cursor、Claude 等 AI 编程工具的朋友，多半见过两个词：Skill 和 MCP。一个负责「教 AI 怎么做事」，一个负责「让 AI 能调用外部能力」。于是有人问：既然 Skill 越来越强，会不会有一天完全取代 MCP？

目前来看：不会。 二者解决的是不同层面的问题，更像是「左手和右手」的关系，而不是谁替代谁。

GoLang 02月16日 302

Go 生态里的 AI 库盘点：SDK、开源与选型指南

用 Go 写后端、CLI 或运维工具时，要把大模型能力接进去，第一个问题往往是：Go 里该用哪个 SDK？生态够不够用？ 和 Python/Node 相比，Go 的 AI 生态更「散」，但近几年已有不少可用方案。本文按云端大模型、MCP、本地模型、RAG 四类场景盘点主流库，并给出选型建议。

场景：调用 OpenAI、国产大模型或兼容 OpenAI 协议的 API。

首选：openai-go（github.com/openai/openai-go），OpenAI 官方维护的 Go 库，覆盖 Chat 补全、流式输出、Function Calling、Embeddings、语音与图像等能力，与官方 REST API 保持一致，后续迭代有保障。

GoLang 02月15日 1153

当 AI 应用需要查数据库、调 API、读文件时，总不能把整套系统都塞进提示词里。Model Context Protocol（MCP） 就是为解决这个问题而生：它让大模型通过统一协议安全、可控地连接外部数据源和工具。如果你在用 Go 做后端或 CLI，用 Go 写 MCP 服务再合适不过——编译成单二进制、并发友好、部署简单。这篇文章就聊聊 Go 里如何快速实现一个 MCP 服务，以及目前主流的 Go MCP 框架 该怎么选。

MCP（Model Context Protocol）是一套开放标准，用来在 AI 应用和外部系统之间建立安全、可控的连接。大模型通过 MCP 可以：

调用工具（Tools）：执行计算、查库、发请求等
访问资源（Resources）：读文件、读 API 数据等
使用提示模板（Prompts）：复用结构化提示

GoLang 02月14日 306

什么是 AI Agent？

你是否曾希望有一个能真正理解你指令的数字助手？你不再需要一步步指导它做什么，只需告诉它“帮我策划一个三亚五日游行程，并预订机票和酒店”，它就能自动完成搜索、比较、预订的全过程。这就是AI Agent（智能体）带来的未来。

简单来说，如果把ChatGPT这样的大模型比作“超级大脑”，那么AI Agent就是给这个大脑装上了“手脚”和“工具”，让它能够主动行动，而不仅仅是被动回答问题。

与传统AI系统不同，AI Agent具备自主决策能力。你只需要给定一个目标，它就能够独立思考并规划如何达成这个目标，调用各种工具完成任务。

其他 2025年12月09日 256

AI 工程化实战：Go 语言中的 Prompt Caching 优化策略

给 AI 装上“手”：Go 语言 Function Calling 实践

Go语言实现MCP服务中的Prompt的实践

用 Go 写 AI 命令行工具的实践

Go在AI对话上下文压缩处理上的实践

Go 实现 AI 多模型负载均衡的实践

Go优雅管理AI应用Prompt的实践

Go 对接向量数据库：Pgvector、Milvus、Qdrant 等客户端的选型

如何用 Go 实现 RAG？文档切块、向量化与检索实践

Go语言计算向量相似度的解决方案

Go 做 Function Calling 服务端：解析 tool_calls 与执行逻辑

AI 中的 Skill 会完全取代 MCP 吗？

Go 生态里的 AI 库盘点：SDK、开源与选型指南

用 Go 快速搭一个 MCP 服务：框架选型与实战

什么是 AI Agent？

标签

排行

解决方案

网站建设

系统开发

技术支撑

业务中台

文案策划

新媒体运营