快R-CNNの入力サイズにつてい

7次浏览(最近30天)
沪元
沪元 2021年2月25日
评论道: 2021年2月28日
こんにちは。
快R-CNNを学習させようとしています。こちらのドキュメント( 快R-CNN深層学習オブジェクト検出器の学習- MATLAB trainFasterRCNNObjectDetector MathWorks日本 )を実際に実行してネットワークの入力サイズを確認したのですが,32×32×3でありかなり小さいサイズでした。
入力サイズがその値ということは,車の映る画像全体を32×32にリサイズしてネットワークに入力し,その後RPNで車のみをプーリングし分類+検出すると思うのですが,物理的に入力サイズが小さすぎませんでしょうか。しかし,ドキュメントではこの値で精度良く検出できていて不思議です。
逆にこちらのドキュメント( 快R-CNN深層学習の検出器を使用したオブジェクトの検出- MATLAB MathWorks日本 )では,Resnetを使用しており入力サイズが224×224であり,かなりサイズが違います。物理的な大きさで言えばこちらの方が特徴が学習しやすいように感じます。
そもそもこの2つのドキュメントですが,タイトルが違うものの検出器を学習させ最後にオブジェクトを検出しているので,行っていることは同じでしょうか吗?
最後に32×32のような人間が見ても特徴がわからないサイズで物体検出できている理由が知りたいです。
勉強不足で申し訳ありませんが,よろしくお願いいたします。

接受的答案

健
2021年2月28日
32×32のほうはあくまで例として用意されていて,実質はより大きな画像サイズで試すべきなのだと思います。32×32にしても,ぼやっと車のピクセルなどが存在するので,今回はそれをうまく拾える場合が多いので検出自体はできる,くらいの理解でよいのではないでしょうか。快RCNNはそれなりに計算時間がかかるので,小さいサイズにして試しやすくしているのかな,と思っていました。手元のデータで試すときは,おおよそ224×224以上の入力サイズで実行されてはいかがでしょうか。
2的评论
健
2021年2月28日
いえいえ,参考になったようで幸いです。

登录评论。

更多的答案(0)