본문 바로가기
AI

[AI] ChatGPT 사용법 (28) - GPT-4o에 관한 모든 것

by 노력남자 2024. 9. 8.
반응형

이번 포스팅에선 지금까지 발표된 GPT-4o에 대한 모든 내용들을 정리해보려고 한다.
 
최근에 너무 바쁘고 여유가 없어서 포스팅을 못 했는데 오늘부터 다시 시작해보려고 한다.
 
늦었지만 GPT-4o에 대해 알아보자!
 

GPT-4o란?

 
GPT-4o(omni)는 2024년 5월 13일에 공개된 비전(이미지, 동영상), 오디오, 텍스트를 모두 처리할 수 있는 OpenAI의 새로운 플래그쉽 모델이다. (4o에서 o는 "omni"로 모든, 전부를 의미하는 뜻이다. 다양한 입력을 수용하고 다양한 형식을 출력할 수 있는 다재다능함을 강조하기 위해 쓰인 걸로 보인다.)
 
GPT-4o는 비전, 오디오, 텍스트를 통합하여 단일 모델로 훈련되었다. 별도로 비전, 오디오 처리를 위해 어떤 모드를 선택할 필요가 없다는 뜻이다.
 
응? GPT-4에서도 다 해줬던 기능이 아닌가?라고 생각할 수 있는데, 아니다 엄청나게 다르다. GPT-4o가 아니라 GPT-5라고 불려도 무방할 정도다.
 

그래서 뭐가 얼마나 어떻게 달라졌는데?

 

오디오와 비전

 
2024년 5월 14일 OpenAI가 유튜브에서 GPT-4o를 소개했는데, 처음봤을 때 정말 충격과 공포였다. (시간이 있다면 유튜브 영상을 한 번 보자. 괜찮은 자막 영상이 있어서 링크 걸어논다.)
 
오바아니야? 라고 생각할 수 있다. 아래 링크를 클릭해서 영상을 보자.
 
https://vimeo.com/945586717
 
어떤가? 잘 와닿지 않는가? 아래도 링크 클릭해서 영상을 한 번 보자.
 
https://vimeo.com/945587185
 
사람이랑 대화하는 거 같이 응답이 빠르고 중간에 말을 끊을 수도 있다. 다양한 목소리도 지원한다. 영화 Her가 이제 현실이 됐다. (실제로 Her에 나오는 요한슨 목소리랑 비슷하다고 voice mode가 중단됐다. 아직 오픈 X)
 
이전 모델들의 응답 속도를 보면 GPT-3.5는 2.8초, GPT-4는 5.4초로 쓰기엔 정말 답답한 속도였다. 반면에 GPT-4o의 응답 속도는 최소 232밀리초, 평균 320밀리초다. 미쳤다.
 
OpenAI에서 제공해준 성능지표로 얼마나 좋아졌는지 확인해 보자.
 

오디오 ASR(Automatic Speech Recognition, 자동 음성인식) 성능

 
OpenAI의 Whisper v3랑 비교를 했는데 단어 인식 실패율이 현저히 낮은 걸 볼 수 있다.
 
타사 제품이랑은 비교하기가 힘들었나보다.
 

 

오디오 번역 성능

 
이건 어떻게 타사 제품이랑 잘 비교를 해놨다.
 
GPT-4o가 Gemini보다 좀 더 좋은 걸 알 수 있다.
 

 

비전 인식 성능

 
어떤 걸 비교한 건진 정확히 모르겠다. 다른 제품들과 비교했을 때 더 높은 수치라 비전 인식을 더 잘한다고 볼 수 있겠다.
 

 

텍스트

 

텍스트 분석 성능
 

텍스트의 품질이나 특성을 분석을 얼마나 정확하게 했는지에 대한 수치이다.
 
그래프에 수치 값이 너무 작아서 잘 안 보이는데 GPT-4o가 88.7, GPT-4가 86.4, Claude3 Opus가 86.8로 GPT-4o가 높은 걸 알 수 있다.
 
숫자로 봤을 땐 얼마 차이 안 나는 걸로 보이는데, 나는 저 차이가 얼마나 큰 건지 와닿지는 않지만 다른 모델보다 좋아진 거니까 만족한다.

 

 

질문 답변 속도
 

GPT-4o가 나오기 전엔 GPT-4를 사용해본 사람이라면 알 거다. 답변이 정확하지만 너무 늦은 탓에 왠만하면 GPT-3.5를 썼었던 과거..
 
GPT-4 Turbo도 나중에 나와서 써봤는데 여전히 너무 답답했었다.
 
GPT-4는 GPT-4 Turbo보다 속도가 2배 이상 빠르다. 내가 체감하기엔 GPT-3.5랑 속도가 비슷한 거 같다.
 

언어 Tokenization 압축 성능

 
아래 표는 새로운 토크나이저의 다양한 언어 집합에서의 압축 성능을 보여준다.
 

더보기
언어별 압축률 대상 문장
Gujarati 4.4x fewer tokens (from 145 to 33) હેલો, મારું નામ જીપીટી-4o છે. હું એક નવા પ્રકારનું ભાષા મોડલ છું. તમને મળીને સારું લાગ્યું!
Telugu 3.5x fewer tokens (from 159 to 45) నమస్కారము, నా పేరు జీపీటీ-4o. నేను ఒక్క కొత్త రకమైన భాషా మోడల్ ని. మిమ్మల్ని కలిసినందుకు సంతోషం!
Tamil 3.3x fewer tokens (from 116 to 35) வணக்கம், என் பெயர் ஜிபிடி-4o. நான் ஒரு புதிய வகை மொழி மாடல். உங்களை சந்தித்ததில் மகிழ்ச்சி!
Marathi 2.9x fewer tokens (from 96 to 33) नमस्कार, माझे नाव जीपीटी-4o आहे| मी एक नवीन प्रकारची भाषा मॉडेल आहे| तुम्हाला भेटून आनंद झाला!
Hindi 2.9x fewer tokens (from 90 to 31) नमस्ते, मेरा नाम जीपीटी-4o है। मैं एक नए प्रकार का भाषा मॉडल हूँ। आपसे मिलकर अच्छा लगा!
Urdu 2.5x fewer tokens (from 82 to 33) ہیلو، میرا نام جی پی ٹی-4o ہے۔ میں ایک نئے قسم کا زبان ماڈل ہوں، آپ سے مل کر اچھا لگا!
Arabic 2.0x fewer tokens (from 53 to 26) مرحبًا، اسمي جي بي تي-4o. أنا نوع جديد من نموذج اللغة، سررت بلقائك!
Persian 1.9x fewer tokens (from 61 to 32) سلام، اسم من جی پی تی-۴او است. من یک نوع جدیدی از مدل زبانی هستم، از ملاقات شما خوشبختم!
Russian 1.7x fewer tokens (from 39 to 23) Привет, меня зовут GPT-4o. Я — новая языковая модель, приятно познакомиться!
Korean 1.7x fewer tokens (from 45 to 27) 안녕하세요, 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어 모델입니다, 만나서 반갑습니다!
Vietnamese 1.5x fewer tokens (from 46 to 30) Xin chào, tên tôi là GPT-4o. Tôi là một loại mô hình ngôn ngữ mới, rất vui được gặp bạn!
Chinese 1.4x fewer tokens (from 34 to 24) 你好,我的名字是GPT-4o。我是一种新型的语言模型,很高兴见到你!
Japanese 1.4x fewer tokens (from 37 to 26) こんにちは、私の名前はGPT-4oです。私は新しいタイプの言語モデルです。初めまして!
Turkish 1.3x fewer tokens (from 39 to 30) Merhaba, benim adım GPT-4o. Ben yeni bir dil modeli türüyüm, tanıştığımıza memnun oldum!
Italian 1.2x fewer tokens (from 34 to 28) Ciao, mi chiamo GPT-4o. Sono un nuovo tipo di modello linguistico, piacere di conoscerti!
German 1.2x fewer tokens (from 34 to 29) Hallo, mein Name is GPT-4o. Ich bin ein neues KI-Sprachmodell. Es ist schön, dich kennenzulernen.
Spanish 1.1x fewer tokens (from 29 to 26) Hola, me llamo GPT-4o. Soy un nuevo tipo de modelo de lenguaje, ¡es un placer conocerte!
Portuguese 1.1x fewer tokens (from 30 to 27) Olá, meu nome é GPT-4o. Sou um novo tipo de modelo de linguagem, é um prazer conhecê-lo!
French 1.1x fewer tokens (from 31 to 28) Bonjour, je m'appelle GPT-4o. Je suis un nouveau type de modèle de langage, c'est un plaisir de vous rencontrer!
English 1.1x fewer tokens (from 27 to 24) Hello, my name is GPT-4o. I'm a new type of language model, it's nice to meet you!

 

GPT-4o를 사용해 보자

 
ChatGPT에서 GPT-4o를 사용할 수 있다. Plus 유저가 아니어도 사용할 수 있다는 점.
 
아직 voice mode는 사용할 수 없다. 비전 분석, 파일 분석, 이미지 생성은 가능하다.

 

 

앱으로 voice mode를 들어가니 위와 같이 나온다.

 

운좋게 선택받은 Plus 유저들은 GPT-4o voice mode를 사용할 수 있는 걸로 보인다.

 

기다리고 있다. 빨리 좀 나오자!

 

Free Tier

 
자동으로 GPT-4o를 사용하며, 16개의 질문을 하면 GPT-4o mini로 전환된다. (약 5시간마다 16개 질문 가능, 그 중 이미지 생성은 하루 2번만 가능 -_-)
(GPT-4o mini는 GPT-4o보다 약간 성능이 안 좋은 모델, 당연히 GPT-3.5 Turbo보단 좋음)
 
GPT-4o 사용 가능한 질문 수를 넘어서면 아래와 같이 프롬프트 입력창 위에 알림창이 나온다.
 

 

Plus, Team

 

  • GPT-4o: 3시간마다 80개 질문 가능
  • GPT-4: 3시간마다 40개 질문 가능 (GPT-4o가 있는데 굳이 이걸 왜 쓰지)

 

 

Enterprise

 
GPT-4o, GPT-4 무제한

반응형

댓글