CNN架构工作,其他则不是
2视图(30天)
显示旧的评论
我使用一个数据集有400图片目前(在近未来希望添加更多的),但与此同时我试图找到CNN pretrained之间的架构是最好的网络深度学习工具箱。
所以我做了一些测试,与相同的参数进行比较,并为例,10时代之后我有超过95%为DenseNet验证准确性,Inceptionv3或Xception Darknet但我20%以下,VGG或GoogleNet。为什么会有这么多的差别?这是因为我的数据集没有足够的图片吗?没有足够的时代吗?
接受的答案
Aditya帕蒂尔
2021年5月11日
作为模型的一些工作,但别人不是,这个问题很可能与训练选项使用而转移学习。您可能还想增加样本的数量,特别是如果所需的类并不代表在ImageNet数据集。这个数据集被用来训练这些模型,所以如果不代表所需的类/代表,那么它可能成为问题。
尝试一些事情,
- 试图overfit模型的几个样品。这表明该模型是正确设置培训。
- 如果只验证精度低,那么模型过度拟合训练数据集。减少数量的时代,或者使用正则化/辍学层。
- 如果你注意到损失减少到过去的时代,增加数量的时代。
- 检查准确性pretrained模型。如果转移学习后的精度较低,那么你可以尝试设置学习速率值小得多。