home..

GPT revolution

ChatGPT를 활용하는 이유

  1. 대화형 인터페이스: 실제 전문가와 대화하는 것과 유사한 경험을 제공한다.
  2. 접근성: 복잡한 기술 지식 없이 누구나 활용할 수 있다.
  3. RLHF(Reinforcement Learning from Human Feedback): 인간의 피드백을 통한 강화학습으로 자연스러운 응답을 생성한다..

GPT 1

GPT 모델의 전체 구조를 개략적으로 나타낸 그림. 왼쪽에는 입력 토큰에 대한 임베딩 벡터와 위치 인코딩이 더해져 디코더 블록들의 스택으로 전달되는 과정을 보여주고, 오른쪽에는 단일 Transformer 디코더 블록의 내부 구성을 확대해서 나타냈는데, 각 디코더 블록은 (아래쪽부터) LayerNorm을 시작으로 멀티-헤드 어텐션 (Head 1 … Head H) 및 마스킹, 소프트맥스 연산과 드롭아웃, 그리고 상단의 피드포워드 층(Linear-GELU-Linear)으로 이루어진다. 각 서브층 출력은 잔차 연결(+ 기호로 표기)로 블록 입력과 더해진 뒤 LayerNorm을 거쳐 다음 단계로 전달된다.

파인튜닝(지도 학습):

사전훈련된 GPT-1 모델은 다양한 다운스트림 NLP 작업에 대해 지도 학습으로 미세조정(fine-tuning)되었는데,

GPT-2 (2019) – 구조 개선과 Zero-shot 학습

구조적 개선점:

In-Context Learning과 Zero-Shot 활용:

학습 데이터 확장:

GPT-3 (2020) – 대규모화와 Few-Shot 학습

구조적 구성:

Few-Shot Learning과 작업 적응:

요약하면

학습 최적화 및 데이터 처리:

© 2025 Jeewon Yoon   •  Powered by Soopr   •  Theme  Moonwalk