OpenAI GPT-4o 출시

OpenAI GPT-4o 출시

GPT-4o openai

최근 OpenAI에서 GPT-4o라는 ChatGPT의 새로운 모델을 출시했습니다. GPT-4o에서 o의 의미는  = omni ‘모든’이라는 뜻이라고 합니다. 그 만큼 이 모델은 텍스트 + 음성 + 이미지 + 영상을 기반으로 모든 영역에서 인공지능을 서비스를 아우르려고 합니다.

기존 음성모드 처리 방법

  • Transcription (받아쓰기) -> Intelligence (논리) -> Text to Speech (글자를 음성으로 변환)

기존 모델과 확연하게 다른 점은 처리 단계를 줄였다는 것인데, 기존의 음성모드는 위와 같은 순서로 모델이 음성을 텍스트로 변환, 텍스트 해석, 답변을 내용을 음성으로 다시 변환시키는 과정이 필요합니다. 하지만, 새로운 모델은 단계를 줄임으로써 속도를 높였습니다.

새로운 모델의 특징

  • (처리방법) 기존 처리방법과 달리 한번에 내부적 수행
  • (성능) 2배 정도 빨라진 속도
  • (기능) 감정을 이해하며, 중간에 말 끼어들기가 가능
  • (비용) Input $5 | Output $15*로 GPT-4 Turbo 보다 50%가 저렴
  • (언어) 50개 언어 인구의 97% 외국어 기능 향상
  • (API) 개발자들이 사용가능

새로운 모델은 기존의 처리방법 단계를 줄임으로써 속도를 2배를 높였습니다. 확실히 사용해보면 다른 것 몰라도 속도가 빨라진 것을 체감할 수 있습니다. 음성을 통해 감정을 이해할 수 있으며, 중간에 말을 끼여들기도 할 수 있습니다. 비용 또한, 저렴해졌는데요. 기존의 GPT4-4 Turbo 보다 50%가 저렴해짐으로써 인풋 $5달러정도 된다고 합니다. 무료 사용자는 새로운 멀티모달 AI를 사용할 수 있게 풀고 시간당 질문을 할 수 있는 횟수에 제한을 둘 예정이라고 합니다.

타 경쟁모델과 비교

타 경쟁모델과 비교해서도 가장 뛰어나다고 볼 수 있습니다. 텍스트 평가, 오디오, 비젼 등 모든 부분에서 이번에 출시한 새로운 모델이 뛰어난 성능을 자랑하고 있습니다.

Audio translation audio text vision

이번 모델이 출시되면서 인공지능 서비스에 대한 발전이 확실히 빠르게 진행되고 있다는 것을 체감하게 되었고, Gemini와 Claude Opus, LAMMA 등 타기관의 LLM 경쟁 모델들이 어떠한 무기를 들고 나올 지 관심이 가게 되는 시점입니다.

더 많은 콘텐츠 -> 구글 비즈 Google Vids 소개

Leave a Comment