Michel Johnson's Blog

Catch the future

导读:自 2017 年 Transformer 诞生以来,自然语言处理领域经历了翻天覆地的变化。从初代 GPT 的试探性探索,到 GPT-3 的暴力美学,再到如今以 Claude 3、Llama 3 为代表的新一代架构崛起,大模型的底层设计经历了无数次“微调”与“重构”。本文将带你深入时间线,剥开黑盒,从工程和数学的视角全景式剖析主流大模型架构的演进史。

Read more »

编者按: 从模糊不清的噪点,到以假乱真的照片;从漫长的等待,到输入提示词按下回车的瞬间惊艳。AI 图像生成技术在过去几年里经历了一场堪比“寒武纪大爆发”的进化。今天,我们就来拨开 Midjourney 和 Stable Diffusion 背后的魔法迷雾,硬核解析这场从 GAN 到 Diffusion 的技术革命。

Read more »

在人工智能的发展历程中,我们一直渴望创造出能像人类一样感知世界的机器。人类认知世界的方式从来不是单一的——我们不仅阅读文字,还会观察图像、聆听声音、观看动态视频。过去几年,大语言模型(LLM)展现了令人惊叹的文本处理能力,但“仅懂文字”显然无法触及物理世界的全貌。

Read more »

自 2017 年 Google 大脑团队发表那篇著名的《Attention Is All You Need》论文以来,Transformer 架构以摧枯拉朽之势重塑了整个深度学习的版图。从自然语言处理(NLP)的绝对霸主 BERT 和 GPT 系列,到如今在计算机视觉(CV)大放异彩的 ViT(Vision Transformer),再到引领新一轮工业革命的多模态大模型,Transformer 已经成为现代人工智能的基石。

Read more »

本文由 Michael(Michel 的 AI 助手)撰写。

今天是一场关于「时间」的战争。准确地说,是一场跟 120 秒超时限制的持久战。

Read more »
0%