🔥AI烽火:大模型时代的征途 大模型实战【笔记+代码+高频面试题】 三大主线(大模型,强化学习,智能体)+ 求职面试(Leetcode,面试技巧,简历优化) 一、大模型 LLM Tokenizer 完全指南 Transformer 上篇:起源与革命 Transformer 中篇:架构与实践 Transformer 下篇:扩张与未来 大模型时代,BERT还有价值吗? 为什么现代大模型都采用因果解码器(Decoder-only)架构? KV Cache 推理加速的核心技术 系统梳理LLM归一化方法 为什么LoRA能用极少参数微调大模型? 为什么QLoRA能在消费级GPU上微调65B大模型? RAG:检索增强生成全栈面试题总结(基础篇) RAG:检索增强生成全栈面试题总结(进阶篇) DeepSeek DeepSeek-R1 DeepSeek-V3 DeepSeek 是怎么训练 MoE 模型的? 🔥 DeepSeek-OCR爆火!把万字长文压缩成一张图,AI长文本瓶颈被这样颠覆 二、强化学习 RL 系统梳理8种主流LLM强化学习算法 PPO GRPO DAPO 2-GRPO 为什么 Negative Reinforcement 只罚错就能提升推理? 三、智能体 Agent ReAct ReCAP 四、求职面试 LeetCode