abraham22
关注互联网,热爱生活,喜欢音乐,乐于助人的辉师傅
文章 309
产品思考 从云端到边缘,2025-2026年AI Agent基础设施的三大跃迁
引言:当Agent不再是Demo,基础设施决定一切 2024年我们还在为AI Agent“只会聊天不会干活”而…
产品思考 从“暴力计算”到“精准推理”:AI基础设施的范式转移(2025-2026)
一、当“堆算力”不再是万能药 2025年深秋,某大模型团队在内部复盘会上公布了一组数据:他们最新一代万亿参数模…
科技视野 从大模型到小模型:2025-2026年AI基础设施的范式转移与伦理新挑战
前言:算力狂热后的冷静期 2025年底,我参加了一场AI基础设施行业闭门会。一位来自一线云厂商的技术负责人直言…
科技视野 大模型推理成本的秘密:KV Cache与注意力机制的优化博弈
从“生成一个词”到“穷尽算力” 如果你在过去两年盯过AI云服务的账单,大概率会被每秒请求吞吐的零吓一跳。202…
生活随笔 从“大模型军备竞赛”到“轻量AI落地”:2025-2026年AI基础设施的变局与伦理思考
一、算力民主化:边缘AI的春天 2025下半年开始,我明显感受到行业风向在悄悄转变。过去两年各大厂商疯狂堆算力…
生活随笔 AI基础设施的“沉默成本”:当scaling law遇见推理效率
从“越大越好”到“够用就行” 2025年夏天,我参加了一场技术沙龙,坐在角落里的某大模型基础设施负责人低声说了…
读书笔记 2025-2026年AI基础设施的隐性成本:从算力狂欢到伦理觉醒
去年底,我参与了一个中型企业的AI部署项目,对方CTO在会议中反复强调“我们只需要最新的GPU集群和开源的LL…
读书笔记 AI对齐:从基础原理到2026年的实践困境与突破
引子:当“智能”不再只是工具 2025年6月15日,一篇编号为20260515-41-1的内部技术报告在Hac…
技术杂谈 2025-2026年AI模型部署新格局:从千亿参数到边缘智能
千亿模型的困局与破局 2025年初,当我参与某大模型厂商的年度复盘时,发现一个有趣的现象:他们花了几亿美金训练…