所有文章
2026
- GPU 芯片全景:国内外厂商对比、市场格局与异构部署实践随着大模型训练与推理需求的爆发,GPU 芯片从图形处理器演变为 AI 时代最核心的算力基础设施。本文系统梳理国内外主要 GPU 厂商的芯片系列、性能横向对比、市场格局,以及软件生态与异构混合部署的架构实践,供技术选型参考。 1. 为什么 GPU 在 AI 时代如此关键 1.1 从图形渲染到通用并行计 …
- Harness Engineering:当模型趋同,胜负在模型之外同一匹马,套上不同的挽具,有的能拉着马车一路狂奔,有的却原地打转。 今天的大模型也是如此。模型只是那匹马,决定它能干多少活的,是套在它身上的那套"挽具"——Harness。 引言:为什么同一个模型,能力却天差地别? 关注 AI Coding Agent 的人,大概都撞见过一个反 …
- 从单机到千卡集群:Ray 如何让 Python 代码拥有超能力?引言:一个让 Python 程序员"无痛"进入分布式计算的框架 为什么训练 AI 模型越来越像"喂显卡吃数据"? 2023 年,GPT-4 的参数规模达到了 1.8 万亿。这个数字意味着什么?如果把它想象成一座图书馆,那大约是 1800 亿本书——而这些 …
- Coding Agent 崛起之后:软件研发哪些变了,哪些永远不会变?“你今天写了多少行代码?” 这个曾经衡量程序员生产力的问题,正在变得越来越没有意义。 引言:那个"敲代码"的时代,正在结束 2023 年之前,软件工程师的核心工作可以被粗暴地概括为一件事:把人类的意图翻译成机器能理解的语言。这个翻译过程极度耗费精力,门槛 …
- 企业级 RAG 实战指南:从理论到落地的完整避坑手册本文系统梳理了 RAG(检索增强生成)技术在企业场景中的落地全流程,涵盖五大应用场景、六步实施路径,以及十大常见陷阱的针对性解决方案。无论你是刚接触 RAG 的初学者,还是正在部署企业知识库的工程师,都能从中获得可落地的实践经验。 一、为什么企业需要 RAG? 1.1 LLM 的先天局限 你们公司 …
- 当 AI 能写代码,我们还需要软件工程师吗?“软件正在吞噬世界。” — Marc Andreessen,2011 年 而今天,AI 正在吞噬软件的执行层。那些曾经定义我们职业身份的事情,正在被一个工具接管。 一个让人不安的早晨 你盯着那段代码,脑子里冒出一个问题:这件事,还需要我吗? 你打开 LinkedIn,又看到 …
- Claude Code 是如何工作的?一个自主编程智能体的架构深度解析你有没有想过,当你在终端输入 claude "帮我重构这个认证模块" 之后,接下来的几分钟里究竟发生了什么?Claude 是怎么在没有任何人逐步指导的情况下,自己找到文件、理解代码结构、做出修改、运行测试、再迭代修复的? 这篇文章试图从架构层面,把这个过程讲清楚,面向对 AI …
- Agent 真正的分水岭,不是“会回答”,而是“会稳定做事”:一文讲透推理框架与工程落地大多数人构建 Agent 失败,不是因为用的模型不够强,而是因为根本没想清楚"怎么让它持续、可靠地把一件事做完"。 一、你遇到的那堵墙,叫"会回答"与"会做事"之间的鸿沟 很多团队第一次做 Agent 的过程是这样的: 用一个强模型,写几 …
- MultiAgent 协作模式全解析:从单体 Agent 到分布式 AI 系统当你的 Agent 开始在复杂任务面前"力不从心",不是模型不够强,而是架构不够好。这篇文章,我们彻底讲透多智能体系统的六大经典模式。 1. 引言:为什么单体 Agent 不够用了? 单体 Agent 的边界与天花板 2023 年,大多数人对 AI Agent 的想象是这样的: …
- Transformer 全面拆解:从「预测下一个词」到改变世界的技术写给那些不满足于"注意力机制很强大"这种解释的人。 本文目标:把一个"黑箱",拆成你能 mentally simulate 的系统。 引言:一个看似简单的问题 你有没有想过——ChatGPT 为什么"看起来懂你"? 当你问它"帮 …
Page 1 of 10
Next →