所有文章 · 笔墨文思

大模型 2025-11-30 · 1 min read

推理服务别只盯模型：我踩坑后总结的三件小事

用户觉得“模型不稳定”，很多时候是网关、队列、超时策略在暗地里打架。

AI 2025-11-24 · 1 min read

我开始给 AI 做“体检”：不是为了挑刺，是为了别被它骗

模型的“自信”不等于正确。做一套小小的评测题库，比吵架更有效。

AI 2025-11-11 · 1 min read

提示词像做菜：同样的食材，火候一变就翻车

提示词不是玄学，是沟通。把需求说清楚，比“会不会写提示词”更重要。

大模型 2025-11-06 · 1 min read

微调？RAG？还是提示词？我用一张“决策树”把自己救了

别一上来就想着“训练一个更懂我的模型”。很多时候，你缺的不是更聪明的模型，而是更清楚的需求。

AI 2025-10-29 · 1 min read

一台旧电脑的复活：我把大模型搬到本地以后，心里踏实多了

我没指望本地模型能“打遍天下”，但它像一个不出门的助手：慢一点，却让人安心。

大模型 2025-10-22 · 1 min read

同一句话第二次更快：我终于把 KV Cache 想明白了

KV Cache 听起来像黑魔法，其实它更像“你翻过的页不需要再翻一次”。

AI 2025-10-16 · 1 min read

把公司文档“喂”给模型的一周：RAG 没那么玄，但很挑食

“把文档丢进去就能问”是误会。真正花时间的是：清洗、切块、命名，以及把脏话（无效信息）赶出去。

AI 2025-10-03 · 1 min read

我让 AI 写周报翻车了：它太会夸我了

周报不是文学创作，它更像账本。AI 一夸，我就知道自己偷懒的地方被放大了。

AI 2025-09-18 · 1 min read

早高峰里的一点小聪明：我用 AI 把“碎片阅读”拼成体系

我不缺文章链接，我缺把它们串起来的线。AI 不负责“学会”，但很擅长帮我“整理”。

大模型 2025-09-12 · 1 min read

上下文窗口这事儿：我怎么让大模型“别忘太快”

我以前总以为模型“记性差”，后来才发现：很多遗忘是我自己喂的内容太乱。