Statistical Methods in MATLAB
교육과정 세부 정보
본 2일 교육과정은 실습 위주로 진행되며 MATLAB®과 Statistics Toolbox™를 이용한 통계적인 자료분석을 다룹니다. 예제와 연습문제를 통해 자료 불러오기 및 구성하기부터 탐색적 데이터 분석과 확증적 데이터 분석 및 시뮬레이션에 이르는 전체 분석 과정을 MATLAB과 Statistics Toolbox의 기능들을 이용하여 다룹니다. 본 과정의 주요 내용은 다음과 같습니다.
- 자료 불러오기 및 구성하기
- 기술 통계
- 자료의시각화(그래프그리기)
- 분포 피팅(fitting)
- 가설 검증
- 분산 분석
- 회귀 분석
- 자료의 차원 축소
- 난수 생성과 시뮬레이션
이 프로그램은 GARP에 의해 승인되었으며 GARP CPD 크레딧 14시간을 부여합니다. Certified FRM 또는 ERP를 보유한 경우https://www.garp.org/cpd에서 이 활동을 프로파일에 추가하시기 바랍니다.
Day 1 of 2
데이터 가져오기 및 정리하기
Objective:데이터를 MATLAB으로 가져와서 분석을 위해 구성합니다. 데이터 병합, 누락된 데이터 처리 등 일반적인 작업을 수행합니다.
- 데이터 가져오기
- 데이터형
- table형 데이터
- 데이터 병합
- categorical형 데이터
- 누락된 데이터
데이터 탐색
Objective:기술 통계량의 계산 및 시각화를 비롯하여 데이터 세트의 기본 통계값을 조사합니다.
- 플로팅
- 중심 경향성
- 산포
- 모양
- 상관
- 그룹화된 데이터
분포
Objective:여러 확률 분포를 조사하고 분포를 데이터 세트에 피팅합니다.
- 확률 분포
- 분포 모수
- 분포 비교 및 피팅
- 비모수 피팅
가설검정
Objective:데이터 세트에 대한 어설션 가능성의 정도를 결정합니다. 일반적인 사용하는 두 분포의 비교, 표본평균의 신뢰구간 결정 등에 가설 검정을 적용합니다.
- 가설검정
- 정규분포에 대한 검정
- 비정규분포에 대한 검정
Day 2 of 2
분산분석
Objective:다수 그룹의 표본평균을 비교하고 그룹 간에 통계적으로 유의한지 찾아봅니다.
- 다중 비교
- 일원분산분석
- 다원분산분석
- 다변량분산분석
- 비정규분포 분산분석
- categorical형 상관
회귀
Objective:선형 및 비선형 모델을 데이터 세트에 피팅하여 예측 모델을 추정합니다. 모델 성능을 개선할 기법을 알아봅니다.
- 선형 회귀 모델
- 데이터에 선형 모델 피팅
- 피팅 평가
- 모델 조정
- 로지스틱 및 일반화 선형 회귀
- 비선형 회귀
다변량 데이터 작업
Objective:차원 수를 줄여서 고차원 데이터 세트를 단순화합니다.
- 특징 변환
- 특징 선택
난수 및 시뮬레이션
Objective:난수를 사용하여 모델의 불확실성 또는 민감도를 평가하거나 시뮬레이션을 수행합니다. 여러 분포를 따르는 난수를 생성하고 MATLAB 난수 생성 알고리즘을 관리합니다.
- 부트스트랩 및 시뮬레이션
- 표준 분포에서 숫자 생성
- 임의 분포에서 숫자 생성
- 난수 스트림 제어