Michel Johnson's Blog

告别“一本正经地胡说八道”：大模型幻觉的底层逻辑与硬核缓解指南

Posted on 2026-05-19 In AI 技术

引言

突破大模型记忆瓶颈：长上下文的技术挑战与硬核解析

Posted on 2026-05-19 In AI 技术

引言：从“金鱼脑”到“过目不忘”的进化

揭开大模型核心：Transformer 注意力机制的数学本质与优雅实现

Posted on 2026-05-19 In AI 技术

自从 2017 年 Google Brain 的那篇石破天惊的论文《Attention Is All You Need》发表以来，Transformer 架构便彻底重塑了整个深度学习的版图。从自然语言处理（NLP）的 BERT、GPT 系列，到如今席卷全球的多模态大模型（如 Sora、GPT-4o），其底层核心无一例外都是 Transformer。

重塑未来教育：AI 驱动下的个性化学习与智能辅导系统架构与实践

Posted on 2026-05-19 In AI 技术

引言：从“千人一面”到“千人千面”的教育演进

驯服巨兽：大语言模型背后的秘密武器——RLHF 完全流程解析与实战

Posted on 2026-05-19 In AI 技术

在当今的 AI 领域，大语言模型（LLM）如 GPT-4、Claude 3 和 Llama 3 已经展现出了令人惊叹的能力。然而，一个仅仅掌握了人类语言规律的“续写机器”，并不能直接成为得力的AI助手。如果你对一个未经微调的基座模型说“帮我写一封请假条”，它可能会接着你的话续写“……给老板发过去之后，老板把你开除了”。