Michel Johnson's Blog

从噪点到艺术：一文通透扩散模型（DDPM 到 Stable Diffusion）核心原理与代码实战

Posted on 2026-05-29 In AI 技术

引言

从规则到通用大模型：命名实体识别（NER）技术的演进之路与实战解析

Posted on 2026-05-29 In AI 技术

引言：信息抽取的“锚点”

破茧与蝶变：从 GPT 到 Claude，万字揭秘主流大语言模型架构演进史

Posted on 2026-05-29 In AI 技术

导读：自 2017 年 Transformer 诞生以来，自然语言处理领域经历了翻天覆地的变化。从初代 GPT 的试探性探索，到 GPT-3 的暴力美学，再到如今以 Claude 3、Llama 3 为代表的新一代架构崛起，大模型的底层设计经历了无数次“微调”与“重构”。本文将带你深入时间线，剥开黑盒，从工程和数学的视角全景式剖析主流大模型架构的演进史。

像素炼金术：从 GAN 到 Diffusion，AI 图像生成的进化之路与硬核原理解析

Posted on 2026-05-28 In AI 技术

编者按： 从模糊不清的噪点，到以假乱真的照片；从漫长的等待，到输入提示词按下回车的瞬间惊艳。AI 图像生成技术在过去几年里经历了一场堪比“寒武纪大爆发”的进化。今天，我们就来拨开 Midjourney 和 Stable Diffusion 背后的魔法迷雾，硬核解析这场从 GAN 到 Diffusion 的技术革命。

炼丹术的巅峰：强化学习从人类反馈（RLHF）全景解密与实战指南

Posted on 2026-05-28 In AI 技术

在当今的生成式 AI 浪潮中，大语言模型（LLM）展现出了令人惊叹的能力。然而，一个拥有万亿参数的模型，如果在预训练阶段只学会了“预测下一个词”，它本质上只是一个超级“续写机器”。它可能会输出不安全的内容、捏造事实，或者完全不听从人类的指令。

跨越感知边界：深入解析多模态大模型的融合架构与统一理解

Posted on 2026-05-28 In AI 技术

在人工智能的发展历程中，我们一直渴望创造出能像人类一样感知世界的机器。人类认知世界的方式从来不是单一的——我们不仅阅读文字，还会观察图像、聆听声音、观看动态视频。过去几年，大语言模型（LLM）展现了令人惊叹的文本处理能力，但“仅懂文字”显然无法触及物理世界的全貌。

拆解大模型底层逻辑：Transformer 注意力机制的数学本质与工程实现

Posted on 2026-05-28 In AI 技术

自 2017 年 Google 大脑团队发表那篇著名的《Attention Is All You Need》论文以来，Transformer 架构以摧枯拉朽之势重塑了整个深度学习的版图。从自然语言处理（NLP）的绝对霸主 BERT 和 GPT 系列，到如今在计算机视觉（CV）大放异彩的 ViT（Vision Transformer），再到引领新一轮工业革命的多模态大模型，Transformer 已经成为现代人工智能的基石。