跳到正文
墨然
首页 归档 分类/标签 订阅 关于
首页 归档 分类/标签 订阅 关于 GitHub
返回

所有文章

共 21 篇文章

大模型 2025-11-30 · 1 min read

推理服务别只盯模型:我踩坑后总结的三件小事

用户觉得“模型不稳定”,很多时候是网关、队列、超时策略在暗地里打架。
#大模型 #部署 #推理服务
阅读全文
AI 2025-11-24 · 1 min read

我开始给 AI 做“体检”:不是为了挑刺,是为了别被它骗

模型的“自信”不等于正确。做一套小小的评测题库,比吵架更有效。
#AI #评测 #可靠性
阅读全文
AI 2025-11-11 · 1 min read

提示词像做菜:同样的食材,火候一变就翻车

提示词不是玄学,是沟通。把需求说清楚,比“会不会写提示词”更重要。
#AI #提示词 #沟通
阅读全文
大模型 2025-11-06 · 1 min read

微调?RAG?还是提示词?我用一张“决策树”把自己救了

别一上来就想着“训练一个更懂我的模型”。很多时候,你缺的不是更聪明的模型,而是更清楚的需求。
#大模型 #微调 #RAG
阅读全文
AI 2025-10-29 · 1 min read

一台旧电脑的复活:我把大模型搬到本地以后,心里踏实多了

我没指望本地模型能“打遍天下”,但它像一个不出门的助手:慢一点,却让人安心。
#AI #本地 #隐私
阅读全文
大模型 2025-10-22 · 1 min read

同一句话第二次更快:我终于把 KV Cache 想明白了

KV Cache 听起来像黑魔法,其实它更像“你翻过的页不需要再翻一次”。
#大模型 #推理 #性能
阅读全文
AI 2025-10-16 · 1 min read

把公司文档“喂”给模型的一周:RAG 没那么玄,但很挑食

“把文档丢进去就能问”是误会。真正花时间的是:清洗、切块、命名,以及把脏话(无效信息)赶出去。
#AI #RAG #知识库
阅读全文
AI 2025-10-03 · 1 min read

我让 AI 写周报翻车了:它太会夸我了

周报不是文学创作,它更像账本。AI 一夸,我就知道自己偷懒的地方被放大了。
#AI #写作 #职场
阅读全文
AI 2025-09-18 · 1 min read

早高峰里的一点小聪明:我用 AI 把“碎片阅读”拼成体系

我不缺文章链接,我缺把它们串起来的线。AI 不负责“学会”,但很擅长帮我“整理”。
#AI #学习 #笔记
阅读全文
大模型 2025-09-12 · 1 min read

上下文窗口这事儿:我怎么让大模型“别忘太快”

我以前总以为模型“记性差”,后来才发现:很多遗忘是我自己喂的内容太乱。
#大模型 #上下文 #提示词
阅读全文
← 上一页 2 / 3 下一页 →
笔墨文思 © 2025 墨然. Built with Hugo & Tailwind concept.
RSS 订阅 友情链接 关于本站