OpenAI Dev Day: ChatGPT의 새 기능

AI 스타트업에게 충격을 준 개발자 컨퍼런스

Nov 07, 2023

OpenAI의 첫 번째 개발자의 날(Dev Day)이 성공적으로 막을 내렸습니다. 이 행사는 참석자들에게 엄청난 인상을 남겼으며, 몇몇 AI 스타트업들은 행사 후 자신들의 사업 방향을 전환(피봇)해야 할 필요성을 느낄 정도로 충격적인 업데이트를 목격했습니다. 이러한 업데이트는 참가자들에게 큰 영감을 주었고, 다음과 같은 중요한 사항들이 업데이트되었습니다:

Part1 개발 관련

OpenAI announces GPT-4 Turbo model that supports 128K tokens and more - MSPoweruser

1. GPT-4 Turbo + 128K 토큰

개발과 관련하여 OpenAI의 Dev Day에서는 GPT-4의 새로운 버전인 GPT-4 Turbo와 함께 놀라운 업데이트가 발표되었습니다. GPT-4는 지난 3월에 처음 출시되었고, 7월경에 플러스 사용자들에게 공개되었습니다. 최신 모델인 GPT-4 Turbo는 이번 컨퍼런스 콜에서 소개되었으며, 아래와 같은 주요 업데이트가 포함되었습니다:

GPT-4 모델은 2023년 4월까지의 정보를 반영하고 있습니다.
이 모델은 최대 128K 토큰 길이의 응답을 할 수 있으며, 이는 대략 300 페이지 분량에 해당합니다.
최적화 작업을 통해 기존 GPT-4 API의 가격에 비해 입력 비용은 3배 저렴하고, 출력 비용은 2배 저렴해졌습니다.
'gpt-4-1106-preview'라는 이름으로 이번 주 내에 개발자들에게 먼저 공개될 예정입니다.
GPT-4 Turbo Vision이라는 새로운 API도 출시되어 이미지 분석 기능을 API를 통해 사용할 수 있게 되었습니다. 이는 1080x1080 크기의 이미지를 분석하는 데 단지 $0.00765, 한국 돈으로 10원도 안 되는 매우 저렴한 비용으로 제공됩니다.

2. Function 콜 업데이트

개발자의 날에서 발표된 또 다른 중요한 업데이트는 function 콜의 개선입니다. 이전에는 외부 API를 내부 모델로 가져오는 기능이 있었으나, 한 번에 하나의 명령만 실행할 수 있었습니다. 예를 들어, '차창을 열고 에어컨을 끄세요'라는 명령을 실행하기 위해서는 두 개의 별도의 function 콜이 필요했습니다. 하지만 최신 업데이트를 통해 이제는 여러 기능을 동시에 호출하는 것이 가능해졌습니다. 즉, 위 예시에서와 같이 차창을 여는 동작과 에어컨을 끄는 동작을 단일 function 콜로 처리할 수 있게 되었습니다.

더욱이, function 콜이 명령어를 더욱 상세하게 따르도록 개선되었습니다. 예를 들어, 사용자가 '날씨 정보를 Json 형식으로 줘'라고 요청하면, 모델은 'response_format'을 명시하여 아래와 같은 형식으로 정보를 제공합니다:

{
  "city": "서울",
  "temperature": "16도",
  "condition": "맑음"
}

3. 재현 가능한 답변과 로그 추력

OpenAI Dev Day에서 발표된 세 번째 주요 업데이트는 '재현 가능한 답변과 로그 추출' 기능입니다. GPT-4 모델에 추가된 '시드(seed)' 기능은 마인크래프트의 시드 기능과 유사하게 작동하여, 특정 시드 값을 설정함으로써 모델이 동일한 입력에 대해 일관된 결과를 생성하도록 합니다. 이는 개발자가 디버깅이나 단위 테스트를 수행할 때 예측 가능한 결과를 얻을 수 있게 해, 프로그래밍 과정의 일관성과 효율성을 크게 향상시킵니다.

또한, GPT-4 Turbo와 GPT-3.5 Turbo 모델은 몇 주 안에 가장 가능성 높은 출력 토큰들의 로그로 반환하는 새로운 기능을 출시할 예정입니다. 이 기능은 사용자가 검색창에 입력하는 동안 자동완성과 같은 기능을 구현할 때 매우 유용하게 사용될 수 있으며, 개발자가 더 나은 사용자 경험을 제공할 수 있도록 도울 것입니다.

4. API 업데이트

API 업데이트에는 다음과 같은 중요한 사항들이 포함됩니다:

DALL-E 3가 API로 사용 가능해졌으며, 이미지 한 장을 생성하는 비용은 약 50원 또는 0.04달러입니다.
새로운 TTS(텍스트-음성 변환) 모델이 공개되어, 매 1000개 문자당 약 0.015달러 또는 19.6원의 비용으로 사용할 수 있으며, 6가지 다른 목소리로 음성을 생성할 수 있습니다.
GPT-4 모델은 이제 파인튜닝이 가능하게 되어, 사용자가 특정 용도에 맞게 모델을 조정할 수 있게 되었습니다.
GPT-3.5 Turbo. 16K 토큰 컨텍스트 윈도우 지원 및 개선된 지시 사항 이해, JSON 모드 및 병렬 함수 호출 기능, 'gpt-3.5-turbo-1106' API를 통한 접근이 가능해졌으며, 올해 12월 11일 자동 업그레이드되며 기존 모델은 내년 6월 13일 까지 사용 가능해집니다.
전반적으로 2-3배 수준으로 가격이 인하되었고, 최적화 작업 덕분에 작업량을 늘리고 속도를 향상시킬 수 있게 되었습니다. 구체적인 가격 정보는 아래와 같습니다.

5. 기관용 커스텀 모델

OpenAI가 특별 맞춤형 모델 프로그램을 시작합니다. 이 프로그램은 특히 대규모 자체 데이터셋을 보유한 기관에 적합하며, 해당 기관의 전문 분야에 특화된 GPT-4 모델을 훈련할 수 있는 기회를 제공합니다. 프로그램은 도메인별 사전 훈련부터 맞춤형 강화 학습 후처리 과정까지, 모델 훈련의 모든 단계를 맞춤화합니다. 참여하는 기관은 자체 맞춤 모델에 대한 독점적인 접근 권한을 갖게 되며, 이 모델은 다른 고객과 공유되지 않고 다른 모델 훈련에도 사용되지 않습니다. 프로그램은 기업의 개인정보 보호 정책을 준수하며, 제공된 독점 데이터는 다른 맥락에서 재사용되지 않습니다. 이 고비용의 매우 제한적인 프로그램에 대해 관심이 있는 기관은 신청할 수 있습니다.

6. Assistants API & 검색 & 코드 작업

OpenAI의 Dev Day에서는 혁신적인 Assistant API의 출시가 발표되었습니다. 이 API는 개발자들이 자신의 애플리케이션에 대화형 에이전트를 통합할 수 있게 해주는 첫 걸음입니다. 이 AI는 목적 지향적으로 설계되어 특정 지시사항에 따라 추가 지식을 활용하고 필요한 작업을 위해 모델과 도구를 호출할 수 있습니다. 새로운 기능으로는 코드 인터프리터, 정보 검색, 함수 호출이 있으며, 이를 통해 개발자들은 고품질의 AI 애플리케이션을 더욱 쉽게 구축할 수 있습니다.

다양한 사용 사례가 가능해지는데, 예를 들어 자연어 기반의 데이터 분석 앱, 코딩 보조 도구, AI를 이용한 휴가 계획기, 음성으로 제어하는 DJ, 스마트 비주얼 캔버스 등이 있습니다. 또한, 개발자들은 장기적이고 복잡한 대화 스레드를 관리할 수 있게 되며, 이를 통해 컨텍스트 윈도우의 제약을 극복할 수 있습니다. 데이터 보호 측면에서도 OpenAI API를 통해 전달된 모든 데이터는 모델 학습에 사용되지 않으며, 개발자가 원할 때 언제든지 삭제할 수 있는 옵션이 제공됩니다. Assistant API는 베타 버전으로, 코드를 작성하지 않고도 Assistants playground에서 직접 체험해볼 수 있습니다.

7. Copyright 보호막

OpenAI Dev Day에서는 저작권 보호와 관련된 새로운 조치인 Copyright Shield를 발표했습니다. 이는 저작권 데이터와 관련된 논란에 대응하는 것으로, Enterprise 플랜을 구독하는 사용자가 GPT를 사용하면서 저작권 침해 소송에 직면할 경우 OpenAI가 법적 방어를 지원하고 발생하는 비용을 전액 지불하겠다고 약속합니다. 이는 ChatGPT Enterprise와 개발자 플랫폼의 일반적으로 이용 가능한 기능에 적용되며, 시스템 내에 내장된 저작권 보호 장치를 통해 고객을 보호하겠다는 OpenAI의 의지를 나타냅니다. 이러한 발표는 사용자들이 기술을 사용함에 있어 법적 리스크에 대한 우려를 덜고, 더욱 안심하고 서비스를 이용할 수 있도록 하는 중요한 발전입니다.

8. 오픈소스 업데이트: Whisper V3 와 Consitency Decoder

Whisper의 세 번째 버전인 Whisper V3는 언어 인식 모델로, 더 많은 언어를 인식할 수 있으며, API의 인식률을 향상시킨 것이 특징입니다. 이 업그레이드로 Whisper 모델은 다양한 언어 환경에서 더욱 강력한 성능을 발휘할 수 있게 되었습니다.

'Consistency Decoder'는 확산 모델을 기반으로 한 새로운 기술입니다. 이 기술은 기존의 확산 모델이 가진 고해상도의 결과물을 생성하는 능력은 유지하면서, 처리 시간을 크게 단축시켰습니다. 사용자는 이 모델을 사용하여 빠르게 고품질의 이미지나 소리, 비디오를 생성할 수 있고, 필요에 따라 추가적인 단계로 더욱 세밀하게 작업을 진행할 수 있습니다. 또한, 별도의 복잡한 훈련 과정 없이도 콘텐츠를 편집할 수 있는 간편함을 제공합니다. 초기 테스트에서는 기존 모델보다 우수한 성능을 보이며, 독립적 학습 능력도 갖추고 있습니다.

Part 2: GPT Economy: GPTs

OpenAI Dev Day의 발표에 따르면, 이제 개인이나 기업이 자신만의 GPT 모델을 맞춤화하여 생성하고, 이를 애플리케이션화 해서 발매할 수 있게 되었습니다. 이러한 변화는 GPT의 활용성을 대폭 확장시키는데, 이전에는 GPT 모델의 범용성 때문에 특정 목적에 맞게 사용하는 데 한계가 있었습니다. 새로운 플랜은 사용자가 특정 설정을 미리 정의하면, 그 설정에 맞춰 작동하는 맞춤형 'GPT' 모델을 생성할 수 있게 해줍니다.

이러한 맞춤형 모델은 개인 사용 뿐만 아니라 링크를 통해 다른 사용자와 공유하거나, OpenAI가 제공하는 '스토어'를 통해 발매가 가능하며, 스토어를 통해 발매할 경우 금전적인 수익 창출도 가능해집니다. 이는 기존의 프롬프트 엔지니어링이 필요 없이 사용자의 필요에 맞는 AI 도구를 제공하며, 개발자와 비즈니스가 자신만의 AI 솔루션을 시장에 출시할 수 있는 새로운 기회를 열어줍니다.

1. Data Privacy

OpenAI는 데이터 프라이버시와 안전성을 최우선으로 하는 방향으로 GPT를 개발해왔습니다. 사용자는 자신의 데이터를 완전히 통제할 수 있으며, GPT와의 대화는 제작자와 공유되지 않습니다. 또한, GPT가 외부 API를 사용할 때 사용자는 자신의 데이터가 전송될지 여부를 스스로 결정할 수 있는 권리를 가지고 있습니다. 제작자는 사용자의 대화 데이터를 모델의 개선과 훈련에 활용할지 선택할 수 있지만, 이는 사용자가 자신의 계정을 모델 훈련에서 제외할 수 있는 기존의 프라이버시 옵션에 기초합니다.

새로운 시스템은 GPT가 사용 정책을 준수하고 있음을 검토하며, 해로운 GPT의 공유를 방지하기 위한 조치를 취하고 있습니다. 이는 사용자의 신뢰를 구축하고, 제작자의 신원 확인과 같은 추가적인 보안 조치를 포함합니다. GPT는 지속적으로 발전하고 있으며, 실제 세계에서 유용한 작업을 수행할 수 있는 능력을 향상시키고 있습니다. OpenAI는 이러한 AI 시스템이 사회에 미치는 영향에 대해 심도 깊게 고민하고 있으며, 향후 이에 대한 더 많은 분석을 공유할 계획입니다.

2. 실제 세계와 연결

개발자들에게 제공되는 새로운 기능으로 GPT를 실제 세계의 데이터와 연결할 수 있는 능력이 강조되었습니다. 이를 통해 개발자들은 내장된 기능을 넘어서서 하나 이상의 API를 GPT에 연결하여 맞춤형 동작을 설정할 수 있게 되었습니다. 이런 동작은 GPT가 마치 플러그인처럼 외부 데이터와 상호작용하거나 실제 세계의 데이터와 연동하도록 만듭니다.

예를 들어, 개발자들은 여행 목록 데이터베이스를 통합하거나, 사용자의 이메일 받은편지함에 연결하거나, 전자상거래 주문을 처리하는 등의 기능을 GPT에 추가할 수 있습니다. 이러한 기능은 플러그인 베타를 통해 얻은 통찰력을 바탕으로 개발되었으며, 개발자들이 모델을 보다 잘 제어하고 API 호출 방식을 정의할 수 있도록 해줍니다. 기존 플러그인 매니페스트를 사용하면 GPT를 위한 동작을 쉽게 정의하고 적용할 수 있습니다. 이 모든 것은 GPT의 기능성을 확장하여 실제 세계의 문제를 해결하는 데 도움이 될 것입니다.

3. 기업용 GPT

ChatGPT Enterprise의 출시로 기업 고객들은 이제 자신들의 비즈니스에 맞춘 특화된 ChatGPT, 즉 내부 전용 GPT를 구축하여 배포할 수 있게 되었습니다. 기업들은 자신들의 운영, 부서 또는 독점 데이터셋에 맞춤화된 기능을 요구해왔고, 이를 통해 마케팅 자료 제작, 고객 서비스 지원, 신규 직원 온보딩 등 다양한 내부 프로세스를 지원하고 있습니다.

기업들은 수요일부터 자체 GPT를 시작할 수 있으며, 코딩 없이도 회사 내부에서만 사용할 수 있는 GPT를 설계하고, 워크스페이스에 안전하게 배포할 수 있습니다. 관리 콘솔을 통해 GPT의 공유 방식을 선택하고, 외부에 배포할 수 있는지 여부를 결정할 수 있습니다. ChatGPT Enterprise를 사용하는 과정에서의 모든 대화는 모델 개선 목적으로 사용되지 않으므로, 기업 데이터의 프라이버시가 유지됩니다.

OpenAI는 GPT의 개발을 통해 AI의 행동과 능력을 형성하는 데 있어 더 많은 사람들의 참여를 가능하게 하고자 합니다. 이러한 참여는 안전하고 인류에게 이득이 되는 인공 일반 지능(AGI)을 만드는 미션에 중요하며, 다양하고 유용한 GPT를 통해 미래에 대한 구체적인 이해를 돕습니다. 기술 접근성의 장벽을 없애고 더 많은 사람들이 '무엇을 만들 것인가'에 대한 결정을 할 수 있게 함으로써, 더 안전하고 잘 조정된 AI가 탄생할 수 있습니다.

이러한 비전은 OpenAI API의 출시와 AI 행동에 민주적인 입력을 통합하기 위한 연구로 이어졌으며, OpenAI는 이 분야에서의 진전을 곧 공유할 예정입니다. ChatGPT Plus는 현재 2023년 4월까지의 최신 정보를 반영하고 있으며 사용자 경험도 개선되었습니다. 이제 사용자들은 DALL·E, 탐색, 데이터 분석 등 다양한 기능을 모델 간 전환 없이 통합된 환경에서 사용할 수 있고, ChatGPT는 PDF를 포함한 다양한 문서 유형을 검색할 수 있는 파일 첨부 기능도 지원합니다. 이 모든 기능은 chatgpt.com 웹사이트에서 확인하고 사용할 수 있습니다.

BetaAI’s Substack

Discussion about this post