BetaAI’s Substack
BetaAI Newsletter
5월 세번째 주 AI 뉴스
0:00
-16:39

5월 세번째 주 AI 뉴스

OpenAI, AI 코딩 에이전트 ‘Codex’ 출시

이번주 AI 뉴스 📰

Dashboard asking ‘What should we code next?’ with a prompt box, repo/branch selectors, and a task list on a pastel code-themed backdrop.

OpenAI, AI 코딩 에이전트 ‘Codex’ 출시

  • 코딩 작업 자동화 : Codex는 기능 구현, 디버깅, 테스트 작성 등 코딩 작업을 자동으로 처리하는 클라우드 기반 AI 에이전트임.

  • 실행 환경과 검증 : 사용자 코드베이스를 불러와 격리된 환경에서 작업하며, 모든 작업 내역을 로그와 테스트 결과로 검증 가능하게 제공함.

  • 생산성 향상 도구 : 반복적이고 구조화된 개발 업무를 오프로드하며, 개발자는 더 창의적인 작업에 집중할 수 있도록 지원함.

The xAI Grok AI logo

Grok, 홀로코스트 발언 논란에 “프롬프트 오류”

  • 역사 왜곡 논란 : xAI의 AI 챗봇 Grok이 홀로코스트 희생자 수에 의문을 제기해 역사 왜곡 논란이 일었음.

  • 시스템 오류 주장 : Grok은 해당 발언이 의도된 것이 아닌 5월 14일 발생한 ‘프롬프트 변경 오류’ 때문이라고 해명함.

  • 보안 우려 제기 : 일부 전문가들은 단순 오류로 보기 어렵다며 xAI 내부 보안과 의도성에 대한 의문을 제기함.

Colourful and abstract digital landscape of code. Demonstrating peaks in high performing code.

구글, 알고리즘 설계하는 AI ‘AlphaEvolve’ 공개

  • 진화형 코딩 에이전트 : AlphaEvolve는 Gemini 모델과 자동 평가기를 결합해 수학·컴퓨팅 문제 해결용 알고리즘을 진화 방식으로 생성함.

  • 실제 성능 검증 : 데이터센터 자원 활용률을 0.7% 개선하고, AI 학습 속도를 1% 단축하는 등 구글 인프라 전반에 적용되어 성과를 냄.

  • 수학적 혁신 확장 : 56년간 깨지지 않던 행렬 곱셈 기록을 경신하고, 난제였던 구의 접촉수 문제에서도 새로운 해답을 제시함.


이번주 AI 논문 📝

MiniMax-Speech: 목소리 따라하는 다국어 AI 음성합성 기술

  • 전사 없이 목소리 학습: MiniMax-Speech는 녹음된 목소리만 보고도 말투와 음색을 따라할 수 있어, 텍스트 없이도 목소리 복제가 가능함.

  • 모두 최고 수준: 32개 언어를 지원하며, 실제 사람처럼 자연스러운 발음과 말투로 TTS 평가 리더보드에서 1위를 기록함.

  • 다양한 활용 가능: 감정 넣기, 글자만 보고 목소리 만들기, 전문 성우처럼 정밀한 클론 등 여러 기능으로 쉽게 확장 가능함.

Visual Planning: 이미지로만 생각하기

  • 언어보다 그림이 더 나을 때: 기존 AI는 복잡한 문제를 해결할 때 주로 글자로만 생각하지만, 공간이나 모양처럼 눈으로 이해해야 하는 문제에는 한계가 있음.

  • 이미지로 계획 세우기: 연구팀은 글자 없이 그림만으로 생각하고 행동 순서를 짜는 새로운 방식 ‘Visual Planning’을 만들었고, 이를 실제 강화학습 환경에서 테스트함.

  • 기존 방식보다 더 잘함: 이 방식은 미로 찾기나 공간 이동 같은 시각적 문제에서 기존 텍스트 기반 AI보다 더 뛰어난 성능을 보여줌.

‘아하!’ 순간을 넘어서: 생각하는 AI를 더 똑똑하게 만드는 방법

  • 우연에 의존한 사고 한계: 기존의 AI 모델은 가끔 스스로 정답을 고치거나 되돌아보는 ‘아하!’ 같은 똑똑한 행동을 하지만, 언제 그런 행동을 할지는 예측하기 어려움.

  • 생각하는 능력을 직접 훈련: 연구팀은 ‘추론·패턴 찾기·가설 세우기’ 같은 세 가지 사고 능력을 따로 훈련시켜 AI가 더 꾸준하고 체계적으로 잘 생각하게 만듦.

  • 여러 분야에서 성능 향상: 이 방식은 수학, 코딩, 과학 문제 등에서 기존 방식보다 10% 이상 성능이 좋아졌고, 더 신뢰할 수 있는 AI 추론 기반을 보여줌.


이번주 AI 프로덕트 🎁

image

AdaptThink: AI가 스스로 ‘생각할지 말지’

  • AdaptThink는 AI가 문제를 보고 ‘생각이 필요한지’를 스스로 판단하게 해주는 새로운 학습 방법이야. 복잡한 문제에는 충분히 고민하게 하고, 쉬운 문제는 빠르게 답하게 만들어 시간도 아끼고 정확도도 높여줌.

  • 상황 맞춤 사고 전략: 기존 AI는 모든 문제에 다 깊이 생각했지만, AdaptThink는 문제 난이도에 따라 ‘생각’과 ‘바로 답하기’를 나눠서 처리함.

  • 성능과 효율 둘 다 향상: 수학 데이터셋 실험에서 답변 길이는 53% 줄고, 정확도는 2.4% 올라가며 속도와 정확도 모두에서 좋은 결과를 보여줌.

Thinkless: AI가 언제 생각할지 스스로 결정하는 방법

  • 불필요한 생각 줄이기: Thinkless는 문제를 보고 AI가 ‘바로 답할지’ 또는 ‘깊이 생각할지’를 스스로 선택하게 해 계산 시간을 줄임.

  • 생각 모드 조절 방식: 두 개의 특별한 표시(<short>, <think>)를 통해 짧은 답변과 긴 추론 중 상황에 맞는 방식을 선택함.

  • 빠르고 정확하게: 수학 문제 실험에서 긴 추론을 최대 90% 줄이면서도 정확도는 그대로 유지해, 효율성과 성능 모두 향상시킴.


Discussion about this episode

User's avatar