Zhengdong.jzd 个人博客

所有文章

2026

工程化记忆：大模型短期记忆与长期记忆的驾驭之道
记忆不是存储问题，而是时机问题。引言：AI 的"金鱼困境" 你把一个需求拆成五步告诉 AI。第一步它理解得很好，第二步它开始调用工具，第三步它停下来问你要一个——已经在第一轮对话里告诉过它的信息。这不是模型不够聪明。GPT-4o、Claude 4.6、Gemini 3.1 …
2026-06-22
RabbitMQ 深度实践：在 Kubernetes 上构建生产级消息队列
服务已经全面上了 Kubernetes，但消息队列还孤零零地跑在一台虚机上——这是很多团队在云原生迁移中都会遇到的阶段性尴尬。消息队列的 K8s 化比无状态服务复杂得多：数据持久化、集群选主、滚动升级期间的消息可靠性，每一项都需要在部署前想清楚。本文面向已在 K8s 上运维过服务、正在考虑引入或迁 …
2026-06-16
GPU 芯片全景：国内外厂商对比、市场格局与异构部署实践
随着大模型训练与推理需求的爆发，GPU 芯片从图形处理器演变为 AI 时代最核心的算力基础设施。本文系统梳理国内外主要 GPU 厂商的芯片系列、性能横向对比、市场格局，以及软件生态与异构混合部署的架构实践，供技术选型参考。 1. 为什么 GPU 在 AI 时代如此关键 1.1 从图形渲染到通用并行计 …
2026-06-01
Harness Engineering：当模型趋同，胜负在模型之外
同一匹马，套上不同的挽具，有的能拉着马车一路狂奔，有的却原地打转。今天的大模型也是如此。模型只是那匹马，决定它能干多少活的，是套在它身上的那套"挽具"——Harness。引言：为什么同一个模型，能力却天差地别？关注 AI Coding Agent 的人，大概都撞见过一个反 …
2026-05-30
从单机到千卡集群：Ray 如何让 Python 代码拥有超能力？
引言：一个让 Python 程序员"无痛"进入分布式计算的框架为什么训练 AI 模型越来越像"喂显卡吃数据"？ 2023 年，GPT-4 的参数规模达到了 1.8 万亿。这个数字意味着什么？如果把它想象成一座图书馆，那大约是 1800 亿本书——而这些 …
2026-05-13
Coding Agent 崛起之后：软件研发哪些变了，哪些永远不会变？
“你今天写了多少行代码？” 这个曾经衡量程序员生产力的问题，正在变得越来越没有意义。引言：那个"敲代码"的时代，正在结束 2023 年之前，软件工程师的核心工作可以被粗暴地概括为一件事：把人类的意图翻译成机器能理解的语言。这个翻译过程极度耗费精力，门槛 …
2026-05-07
企业级 RAG 实战指南：从理论到落地的完整避坑手册
本文系统梳理了 RAG（检索增强生成）技术在企业场景中的落地全流程，涵盖五大应用场景、六步实施路径，以及十大常见陷阱的针对性解决方案。无论你是刚接触 RAG 的初学者，还是正在部署企业知识库的工程师，都能从中获得可落地的实践经验。一、为什么企业需要 RAG？ 1.1 LLM 的先天局限你们公司 …
2026-04-29
当 AI 能写代码，我们还需要软件工程师吗？
“软件正在吞噬世界。” — Marc Andreessen，2011 年而今天，AI 正在吞噬软件的执行层。那些曾经定义我们职业身份的事情，正在被一个工具接管。一个让人不安的早晨你盯着那段代码，脑子里冒出一个问题：这件事，还需要我吗？你打开 LinkedIn，又看到 …
2026-04-27
Claude Code 是如何工作的？一个自主编程智能体的架构深度解析
你有没有想过，当你在终端输入 claude "帮我重构这个认证模块" 之后，接下来的几分钟里究竟发生了什么？Claude 是怎么在没有任何人逐步指导的情况下，自己找到文件、理解代码结构、做出修改、运行测试、再迭代修复的？这篇文章试图从架构层面，把这个过程讲清楚，面向对 AI …
2026-04-26
Agent 真正的分水岭，不是“会回答”，而是“会稳定做事”：一文讲透推理框架与工程落地
大多数人构建 Agent 失败，不是因为用的模型不够强，而是因为根本没想清楚"怎么让它持续、可靠地把一件事做完"。一、你遇到的那堵墙，叫"会回答"与"会做事"之间的鸿沟很多团队第一次做 Agent 的过程是这样的：用一个强模型，写几 …
2026-04-22

Page 1 of 10 Next →