[논문리뷰] UNDERSTANDING DEEP LEARNING REQUIRES RETHINKINGGENERALIZATION

Notice

Recent Posts

Recent Comments

Link

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

MJ's Blog

[논문리뷰] UNDERSTANDING DEEP LEARNING REQUIRES RETHINKINGGENERALIZATION 본문

[논문리뷰] UNDERSTANDING DEEP LEARNING REQUIRES RETHINKINGGENERALIZATION

minje_kim 2025. 5. 22. 15:35

일반화(generalization)
일반화는 모델이 학습한 데이터 이외의 새로운 데이터에도 잘 작동하도록 하는 것.
즉 말그대로 특수한 데이터에만 성능이 잘 나오는게 아니라 일반적으로(general하게) 모든 데이터에 성능이 잘 나오도록 하는 것을 의미함.

정규화(regularization)
정규화는 과적합을 방지하는 기법들
기법들은 보통 모델의 복잡도를 제한하는 방식으로 만들어져있는데, 이는 모델이 너무 복잡해지면 훈련데이터만 외우게 되기 때문임. (모델이 더 복잡해질수록 과적합 가능성이 커짐)

전통적으로 무작위 라벨링, 즉 패턴이 없는 데이터에 대해선 학습이 매우 어려울 것으로 예상했었다. 왜냐하면,
모델이 복잡하고 매개변수가 많을수록 특정 정답에 과적합하기 쉬울것으라고 생각했기 때문이다.

논문의 발견은 아래와 같았음 :
1)신경망은 사실 전체 데이터셋을 통으로 암기해버릴수 있을정도의 용량을 가지고있었다.
2)그럼에도 훈련시간도 크게 증가하지 않는다.

저작자표시 (새창열림)

'AI' 카테고리의 다른 글

ICML 2025 후기 (5)	2025.07.19
25' AI Agents Live + Labs (1)	2025.07.08
[논문리뷰] Pix2NeRF (0)	2022.07.13
[논문리뷰] Image GANs meet differentiable rendering for inverse graphics and interpretable 3D neural rendering (0)	2022.06.06
Reproduction 을 위한 Seed 고정 (0)	2022.05.26

'AI' Related Articles

MJ's Blog

[논문리뷰] UNDERSTANDING DEEP LEARNING REQUIRES RETHINKINGGENERALIZATION 본문

[논문리뷰] UNDERSTANDING DEEP LEARNING REQUIRES RETHINKINGGENERALIZATION

'AI' 카테고리의 다른 글

티스토리툴바