跳到正文
墨然
首页 归档 分类/标签 订阅 关于
首页 归档 分类/标签 订阅 关于 GitHub
返回分类

大模型

共 5 篇文章

大模型 2025-12-15 · 1 min read

评测大模型别只看榜单:我给它出的 30 道“小考卷”

榜单像体检报告的平均分,真正重要的是:你的业务里它会在哪些题上失手。
#大模型 #评测 #可靠性
阅读全文
大模型 2025-11-30 · 1 min read

推理服务别只盯模型:我踩坑后总结的三件小事

用户觉得“模型不稳定”,很多时候是网关、队列、超时策略在暗地里打架。
#大模型 #部署 #推理服务
阅读全文
大模型 2025-11-06 · 1 min read

微调?RAG?还是提示词?我用一张“决策树”把自己救了

别一上来就想着“训练一个更懂我的模型”。很多时候,你缺的不是更聪明的模型,而是更清楚的需求。
#大模型 #微调 #RAG
阅读全文
大模型 2025-10-22 · 1 min read

同一句话第二次更快:我终于把 KV Cache 想明白了

KV Cache 听起来像黑魔法,其实它更像“你翻过的页不需要再翻一次”。
#大模型 #推理 #性能
阅读全文
大模型 2025-09-12 · 1 min read

上下文窗口这事儿:我怎么让大模型“别忘太快”

我以前总以为模型“记性差”,后来才发现:很多遗忘是我自己喂的内容太乱。
#大模型 #上下文 #提示词
阅读全文
笔墨文思 © 2025 墨然. Built with Hugo & Tailwind concept.
RSS 订阅 友情链接 关于本站