딥러닝을 위해 영상 전처리하기

신경망을 훈련시키고 새로운 데이터에 대해 예측을 수행하려면 영상이 신경망의 입력 크기와 일치해야 합니다. 신경망에 맞게 영상의 크기를 조정하려면 데이터를 필요한 크기로 다시 스케일링하거나 자를 수 있습니다.

데이터에 무작위 방식의증대를 적용하여 훈련 데이터의 양을 효과적으로 늘릴 수 있습니다. 또한 증대를 사용하면 신경망이 왜곡된 영상 데이터에 대해 일관된 결과를 도출하도록 훈련시킬 수 있습니다. 예를 들어, 신경망이 회전된 입력 영상에 대해서도 일관된 결과를 도출하도록 하기 위해 입력 영상에 무작위로 회전을 가할 수 있습니다.增强图像数据存储는 분류 문제용 2.차원 영상에 다양한 방식의 증대를 편하게 적용할 수 있는 방법을 제공합니다.

그 밖의 고급 전처리 연산이 필요하거나 회귀 문제를 위해 영상을 전처리해야 하거나, 3.차원 볼륨 영상을 전처리해야 하는 경우에는 내장된 데이터저장소를 사용할 수 있습니다.使改变함수와结合함수를 사용하여 사용자 고유의 파이프라인에 따라 영상을 전처리할 수도 있습니다.

재스케일링 또는 자르기를 사용하여 영상 크기 조정하기

영상 데이터를 숫자형 배열,图像数据存储객체 또는 테이블로 저장할 수 있습니다.图像数据存储를 사용하면 너무 커서 메모리에 담을 수 없는 영상 컬렉션에서 데이터를 배치 단위로 가져올 수 있습니다. 증대 영상 데이터저장소나 크기 조정된 4.차원 배열을 훈련, 예측 및 분류를 위해 사용할 수 있습니다. 크기 조정된 3.차원 배열은 예측 및 분류를 위해서만 사용할 수 있습니다.

신경망 입력 크기와 일치하도록 영상 데이터의 크기를 조정하는 방법에는 두 가지가 있습니다.

재스케일링은 영상의 높이와 너비에 스케일링 인자를 곱합니다. 스케일링 인자가 세로 방향과 가로 방향에서 동일하지 않은 경우, 재스케일링은 픽셀의 공간 범위와 종횡비를 변경합니다.
자르기는 영상의 하위 영역을 추출하고 각 픽셀의 공간 범위를 보존합니다. 영상을 중앙에서 자르거나 임의의 위치에서 자를 수 있습니다.

크기 조정 옵션	데이터 형식	크기 조정 함수	샘플 코드
재스케일링	하나의 색 또는 다중분광 영상을 나타내는 3.차원 배열 회색조 영상 스택을 나타내는 3.차원 배열 영상 스택을 나타내는 4.차원 배열	`调整大小`	im=imresize（I，outputSize）； `输出大小`는 다시 스케일링할 영상의 차원을 지정합니다.
재스케일링	영상 스택을 나타내는 4.차원 배열 `图像数据存储` 테이블	`增强图像数据存储`	auimds=增强图像数据存储（outputSize，I）； `输出大小`는 다시 스케일링할 영상의 차원을 지정합니다.
자르기	하나의 색 또는 다중분광 영상을 나타내는 3.차원 배열	`imcrop`（图像处理工具箱）	im=imcrop（I，rect）； `直肠`는 2.차원 자르기 윈도우의 크기와 위치를 지정합니다.
	회색조 영상 스택을 나타내는 3.차원 배열 컬러 영상 스택 또는 다중분광 영상 스택을 나타내는 4.차원 배열	`imcrop3`（图像处理工具箱）	im=imcrop3（I，长方体）； `长方体`는 3.차원 자르기 윈도우의 크기와 위치를 지정합니다.
	영상 스택을 나타내는 4.차원 배열 `图像数据存储` 테이블	`增强图像数据存储`	auimds=增强图像数据存储（outputSize，I，“OutputSizeMode”，m）； 입력 영상의 중앙에서 자르려면`M`을`“中心作物”`으로 지정합니다. 입력 영상의 임의의 위치에서 자르려면`M`을`“randcrop”`으로 지정합니다.

무작위 기하 변환을 사용하여 훈련용 영상 증대하기

영상 분류 문제를 위해增强图像数据存储를 사용하여 크기 조정, 회전, 반사, 전단, 평행 이동 변환을 무작위로 결합하여 영상을 증대할 수 있습니다.

다음 도식은列车网络가 증대 영상 데이터저장소를 사용하여 각 纪元에 대해 훈련 데이터를 변환하는 방법을 보여줍니다. 데이터 증대를 사용하면 훈련의 각 纪元마다 각 영상의 무작위로 증대된 버전 하나가 사용됩니다. 이 워크플로의 예제는증대 영상을 사용하여 신경망 훈련시키기항목을 참조하십시오.

훈련 영상을 지정합니다.
图像数据增强器를 만들어서 회전 각도의 범위나 무작위로 반사를 적용할 지점과 같은 영상 변환 옵션을 구성합니다.

팁

샘플 영상에 적용된 변환을 미리 보려면加强함수를 사용하십시오.
增强图像数据存储를 만듭니다. 훈련 영상, 출력 영상의 크기 및图像数据增强器를 지정합니다. 출력 영상의 크기는 신경망의图像输入层의 크기와 호환되어야 합니다.
列车网络의 데이터 소스로 증대 영상 데이터저장소를 지정하여 신경망을 훈련시킵니다. 훈련의 각 반복마다, 증대 영상 데이터저장소는 훈련 데이터의 미니 배치에 있는 영상에 임의의 변환 조합을 적용합니다.
증대 영상 데이터저장소를 훈련 영상의 소스로 사용하면 각 纪元에 사용되는 훈련 데이터가 무작위로 섭동되어 纪元마다 조금씩 다른 데이터 세트가 사용됩니다. 각 纪元에 사용되는 실제 훈련 영상의 개수는 변경되지 않습니다. 변환된 영상은 메모리에 저장되지 않습니다.

내장된 데이터저장소를 사용하여 추가적인 영상 처리 연산 수행하기

일부 데이터저장소는 데이터 배치를 읽어 들일 때 제한된 특정 영상 전처리 연산을 수행합니다. 다음 표에는 이러한 응용 사례별 데이터저장소가 나열되어 있습니다. 이러한 데이터저장소는 深度学习工具箱™를 사용하는 딥러닝 응용 사례를 위한 훈련, 검증 및 테스트 데이터 세트의 소스로 사용할 수 있습니다. 이들 데이터저장소는 모두列车网络에서 지원하는 형식으로 데이터를 반환합니다.

데이터저장소	설명
`增强图像数据存储`	심층 신경망을 훈련시키기 위해 크기 조정, 회전, 반사, 전단, 평행 이동을 비롯한 무작위 아핀 기하 변환을 적용합니다. 예제는基于预训练网络的迁移学习항목을 참조하십시오.
`像素标签图像数据存储`（计算机视觉工具箱）	의미론적 분할 신경망을 훈련시키기 위해 영상과 그 대응되는 실측 레이블에 동일한 아핀 기하 변환을 적용합니다（计算机视觉工具箱）™ 필요). 예제는딥러닝을 사용한 의미론적 분할항목을 참조하십시오.
`随机抽取数据存储`（图像处理工具箱）	영상 또는 픽셀 레이블 영상으로부터 임의 부분의 여러 개의 쌍을 추출합니다（图像处理工具箱）™필요). 선택적으로 이런 부분의 쌍에 동일한 무작위 아핀 기하 변환을 적용할 수 있습니다. 예제는딥러닝을 사용한 단일 영상 초고해상도 복원 기법항목을 참조하십시오.
`去噪图像数据存储`（图像处理工具箱）	잡음 제거 신경망을 훈련시키기 위해 임의로 생성된 가우스 잡음을 적용합니다（图像处理工具箱）필요).

결합 및 변환을 적용하여 추가적으로 영상 처리하기

응용 사례별 데이터저장소에서 제공하는 것보다 일반적이고 복잡한 영상 전처라 연산을 수행하려면使改变함수와结合함수를 사용할 수 있습니다. 자세한 내용은用于深度学习的数据存储항목을 참조하십시오.

영상 데이터가 있는 데이터저장소 변환하기

使改变함수는 데이터저장소(기본 데이터저장소)에서 읽어 들인 데이터를 사용자가 정의한 변환 함수에 따라 변환하여 변형된 형식의 데이터저장소를 만듭니다.

사용자 지정 변환 함수는 기본 데이터저장소의阅读함수가 반환하는 형식으로 데이터를 받아야 합니다.图像数据存储에 있는 영상 데이터의 경우, 형식은可读大小속성에 좌우됩니다.

可读大小가 1.이면 변환 함수는 정수형 배열을 받아야 합니다. 배열의 크기는图像数据存储에 있는 영상의 유형과 일치합니다. 예를 들어, 회색조 영상은 차원이 m×n이고, 트루컬러 영상은 차원이 m×n×3이고, 채널이 C개인 다중분광 영상은 차원이 m×n×c입니다.
可读大小가 1.보다 크면 변환 함수는 영상 데이터로 구성된 셀형 배열을 받아야 합니다. 각 요소는 배치에 있는 각 영상에 대응됩니다.

使改变함수는 신경망의 입력 크기와 일치하는 데이터를 반환해야 합니다.使改变함수는 일대다 관측값 매핑을 지원하지 않습니다.

팁

使改变함수는 기본图像数据存储가 JPG또는 巴布亚新几内亚영상 파일의 배치를 읽어 들일 때 프리페치를 지원합니다. 이러한 영상 유형의 경우,图像数据存储의readFcn인수를 사용하여 영상 전처리를 적용하지 마십시오. 이 옵션은 일반적으로 상당히 느립니다. 사용자 지정 阅读함수를 사용하는 경우,图像数据存储는 프리페치를 수행하지 않습니다.