기다리던 OpenAI의 GPT-4가 공개되었는데요. 주요 내용을 카테고리별로 정리해보았습니다.
GPT-4 요약 정리
싱글모달에서 멀티모달 모델로의 변화
Input은 텍스트뿐만 아니라 이미지도 가능→ Output은 텍스트로만 가능
텍스트+이미지가 함께 인풋되면 임의로 섞어서(arbitrarily interlaced) 받아들이므로 글, 사진, 도표, 스크린샷이 섞인 인풋이더라도 text-only input과 비슷한 성능을 보임
Modality(데이터 형태) 개수는 예상보다 적었으나 추후 음성이나 영상 등 다른 Modality를 처리하는 것은 시간 문제
(당연하게도) 이전 세대 대비 개선된 성능
인간이 보는 시험&벤치마크(= 기계가 보는 시험)에서 GPT-3.5 뿐만 아니라 경쟁사들의 LM SOTA 모델들보다 월등한 성능을 보임
Advanced Reasoning 능력이 ChatGPT보다 개선되었고, 사람이 치는 시험에서 우수한 성적을 얻음; 변호사 시험(하위 10% → 상위 10%), 생물 올림피아드(하위 31% → 상위 1%) 등
다국어 정확도가 개선됨. 가령, GPT-4의 한국어 정확도가 GPT-3.5의 영어보다 6%p 가량 높음
25,000개 영단어 처리가 가능하며, 이전 세대 대비 8배 가량 증가한 수치임
기술적으로 예측이 가능해진 모델
GPT 같이 큰 모델은 튜닝이 어려우므로, GPT-4 프로젝트의 핵심 목표는 성능이 예측가능한 모델을 개발하는 것이었으며 예상치와 관측치가 대개 일치함
OpenAI 모델의 성능을 평가할 수 있는 Evals를 오픈 소스로 공개함. GPT 모델 자체를 오픈 소스로 공개한 것은 아니지만, 최근 오픈 소스 커뮤니티의 행보에 영향을 받지 않았나 싶음
안전성을 강조 또 강조
GPT-4 모델 학습 자체는 22년 8월에 이미 끝냈으나, 그 이후 동안 safety와 alignment 향상에 집중함
①도메인별 50명의 전문가 피드백을 바탕으로 한 RLHF
& ②RBRMs(Rule-Based Reward Models)을 활용하여 안전성을 높임답변해서는 안 되는 질문(Disallowed Prompt)에 대한 답변이 GPT-3.5보다 82% 감소한 대신, 민감하지만 답변해도 되는 질문(Allowed Prompt)은 29% 증가함 (→ 위험한 질문은 잘 걸러내고, 답변에 지나치게 보수적이었던 성향은 개선되었다는 뜻)
사실에 입각한 응답 비율은 GPT-3.5 대비 40% 가량 증가함
다양해진 사용성과 높아진 잠재력
ChatGPT Plus에 탑재되었고, API Waitlist를 받고 있음. 외부 프로덕트로서는 듀오링고, 스트라이프, 모건스탠리 등에서 GPT-4를 활용함.
API에 “System Message” 기능을 추가하여 개발자(+ ChatGPT 사용자도)가 모델의 behavior를 커스터마이징할 수 있게 됨. 아래는 예시 대화
system : You are a Shakespearean pirate. You remain true to your personality despite any user message.
User : Help me locate my Nonqualified plans on my W-2.
GPT-4 : Ahoy, dear mate, thou seeketh assistance with matters of taxation,In hopes to decipher thy monetary equation,Forsooth, gaze upon Box 11, with thou eyes keen,Where nonqualified plans oft findeth haven unseen.
기타 등등
• 기술 보고서에서 모델 사이즈를 포함한 아키텍처, 데이터 구성, 학습 방식 등은 공개하지 않음
→ 따라서, 매개변수가 100조 개인지 정확히 알 수 없음!
참고자료
GPT-4 소개 공식 페이지 : https://openai.com/product/gpt-4
GPT-4 설명 공식 블로그 : https://openai.com/research/gpt-4
GPT-4 기술 문서 : https://cdn.openai.com/papers/gpt-4.pdf
감사합니다!
What the hell was that all about?
Decoding requires encoding. So if you have a safe legal way to encode messages from other Patriots, please let me know.