版权声明:本文为博主原创文章未经博主允许不得转载。 /u/article/details/
28?28大小的灰度图像组成共有10个类别,每一类别各有7000张图像数据集划分为两部分,即训练集和测试集其中,训练集共有60000张图像每个类别各有6000张;测试集共有10000张图像,每一类别各有1000张
采用CapsNet网络模型,该网络由两部分组成:编码器和解码器湔3层网络为编码器,即卷积层、PrimaryCaps层和DigitCaps层;后3层网络为解码器即三层全连接层。
16?10大小的矩阵作为输出
该层用于检测图像的基本特征。卷积核大小为9?9步长为1,filter数为256激活函数为Relu。输出大小为
该层接受卷积层检测到的基本特征用于生成特征组合。该层共有32个PrimaryCapsules每个PrimaryCapsules由8個卷积核为9?9,步长为2的卷积组成输出大小为
8?16的权重矩阵将8维输入空间映射至16维Capsules输出空间。输出大小为
Tk?=1否则为0。λ=0.5用于确保训练Φ的数值稳定性
Wij? 表示权重矩阵,u^ij?为预测向量可视为底层capsules的输出向量进行仿射变换。
解码器由三层全连接层构成用于重建图像,損失函数为MSE函数训练时仅使用正确的DigitCap向量。