TL;DR
신경망 학습은 MLE, 손실 함수, 역전파, 자동 미분이 결합된 결과이다. 이 과정의 수학적 도출과 수치적 안정성 확보가 현대 딥러닝의 핵심이다.
배경
신경망 학습의 수학적 토대인 손실 함수와 최적화 알고리즘의 원리를 다룬다.
대상 독자
딥러닝의 기초 수학과 구현 원리를 깊이 이해하고자 하는 ML 엔지니어 및 연구자
의미 / 영향
이 영상은 딥러닝 프레임워크 내부의 작동 원리를 이해함으로써 모델 디버깅과 성능 최적화 능력을 향상시킨다. 수학적 도출 과정을 통해 블랙박스 모델의 학습 과정을 투명하게 파악할 수 있다.
챕터별 상세
손실 함수와 최대 우도 추정
최대 우도 추정(MLE)은 주어진 데이터가 발생할 확률을 최대화하는 파라미터를 찾는 통계적 방법이다.
이진 분류와 시그모이드
베르누이 분포는 성공 확률이 p인 시행을 한 번 수행할 때의 확률 분포이다.
다중 분류와 소프트맥스
소프트맥스 함수는 입력 벡터의 각 요소를 지수화하여 합으로 나누어 확률 분포를 만든다.
수치적 안정성 확보
부동 소수점 연산에서 지수 함수의 결과가 너무 커지면 표현 범위를 벗어나는 오버플로우가 발생한다.
역전파의 재귀적 도출
연쇄 법칙은 합성 함수의 미분을 각 함수의 미분 곱으로 계산하는 미분법이다.
자동 미분 방식 비교
자동 미분은 프로그램을 구성하는 기본 연산들의 미분 값을 연쇄 법칙으로 결합하는 방식이다.
야코비안과 미분 모드
야코비안 행렬은 다변수 함수의 편미분 값을 모아놓은 행렬이다.
실무 Takeaway
- 소프트맥스와 교차 엔트로피의 조합은 기울기 계산 시 수치적 안정성이 뛰어나므로 분류 문제의 표준으로 사용된다.
- 역전파는 연쇄 법칙을 재귀적으로 적용하여 복잡한 신경망의 기울기를 효율적으로 계산하는 알고리즘이다.
- 자동 미분은 수동 미분이나 수치 미분의 한계를 극복하고, 대규모 신경망 학습을 가능하게 하는 핵심 기술이다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.