深度学习 11

深度学习结束了人工特征工程时代。

但人工设计的目标并没有消失，它只是从提取特征（Feature），转向了设计结构（Structure）。

FNN

前面讨论的多层感知机，本质上属于前馈神经网络（FNN）。

这是网络最基础、最直观的形态：信息从前向后单向流动。在全连接的设定下，每一层的每个神经元，都与上一层的所有神经元相连。

\text{输入} \longrightarrow \text{隐藏层} \longrightarrow \text{输出}

全连接的核心问题在于：太平均。

它对所有输入位置一视同仁。以图像识别为例，当一张图片被展平输入全连接网络时，每个像素都直接和下一层的全量神经元相连。

但真实世界的数据往往自带空间或时间结构：图像相邻像素之间关系密切，远处的像素则未必；全连接网络粗暴地打破了这种二维关联，导致模型需要耗费巨大的代价去重新学习这些显而易见的先验知识。

全连接网络与结构设计

特征工程时期，专家需要对目标领域有极深的理解，手动提取规则。而深度学习将这份压力转移到了模型结构、训练策略和数据规模上。

如果所有任务都用同一种全连接网络，虽然在算力堆叠下也能出结果，但效率极低。因此，深度学习向后演进的核心命题就是：什么样的结构，匹配什么样的数据？

不同的数据有着截然不同的形态：

后来大放异彩的网络架构，本质上都是对特定数据结构的工程学回应：