11월 네번째 주 AI 뉴스

BetaAI Newsletter

11월 네번째 주 AI 뉴스

0:00

-15:32

오픈 소스 이미지 AI 최강자 ‘FLUX.2’ 출시… “실무 완벽 대응”

Nov 26, 2025

이번주 AI 뉴스 📰

실무 기능 강화 : 최대 400만 화소 편집 지원 및 복잡한 타이포그래피 구현, 캐릭터 일관성 유지 등 현업 워크플로우에 최적화된 기능을 제공함
정교한 제어 : 최대 10장의 이미지를 동시에 참조하는 멀티 레퍼런스 기능과 미스트랄-3 기반의 강력한 문맥 이해 능력을 갖춤
라인업 다각화 : 최고 사양의 ‘프로’, 유연한 ‘플렉스’와 함께 320억 파라미터 규모의 오픈 웨이트 모델 ‘데브’를 공개해 선택의 폭을 넓힘

제2의 맨해튼 프로젝트 : 트럼프 대통령이 AI를 통한 과학 혁신과 기술 패권 확보를 목표로 하는 국가적 총력전인 ‘제네시스 미션’ 행정명령에 서명함
AI 통합 플랫폼 구축 : 에너지부 주도로 연방 정부의 방대한 데이터와 슈퍼컴퓨팅 자원을 결합한 ‘미국 과학 안보 플랫폼’을 구축해 연구 속도를 획기적으로 높일 계획임
6대 핵심 분야 집중 : 반도체, 생명공학, 양자 과학 등 국가 안보와 직결된 주요 과학 기술 난제들을 AI를 활용해 해결하고 글로벌 리더십을 강화함

Anthropic, 코딩 최강 모델 ‘Claude Opus 4.5’ 전격 출시
‘Gemini 3’ 공세에 샘 알트만 “경제적 역풍 직면” 경고
엔비디아 “우린 제2의 엔론 아냐”… 회계 조작설 정면 반박

잠재적 과잉 사고 발견 : 기존 순환 트랜스포머가 쉬운 토큰까지 불필요하게 재검토하여 정답을 오히려 오답으로 바꾸는 ‘잠재적 과잉 사고’ 현상을 규명함.
선택적 추론 기술 제안 : 오답 가능성이 높은 ‘어려운 토큰’만 선별해 심층 연산하는 Think-at-Hard기법과 효율적인 정보 흐름을 위한 Duo-Causal Attention을 도입함.
연산 효율과 성능 입증 : 94%의 토큰에 대한 추가 연산을 생략하면서도 모든 토큰을 반복 계산하는 방식 대비 최대 11.3%의 정확도 향상을 달성함

과정 중심 모델링 : 비디오 이해를 인지(Perception)와 추론(Reasoning)의 별도 과정으로 분리해 기존 강화 학습 미세조정(RFT)의 한계를 극복함.
CoT 데이터 구축 : 인지와 추론을 명확히 구분한 고품질 데이터셋(VIDEOP2R-CoT-162K)을 생성해 지도 미세조정(SFT) 단계에 적용함.
SOTA 성능 달성 : 각 과정에 개별 보상을 주는 PA-GRPO 알고리즘을 도입해 7개 중 6개 벤치마크에서 최고 성능(SOTA)을 기록함.

제로 데이터 진화 : 외부 데이터 의존 없이 도구 활용과 다단계 상호 작용을 통해 고성능 에이전트를 스스로 육성하는 완전 자율 프레임워크를 제안함.
선순환 학습 구조 : 문제를 내는 에이전트와 푸는 에이전트가 도구를 활용해 경쟁하며, 과제 난이도와 해결 능력을 함께 높이는 선순환 사이클을 형성함.
획기적 성능 향상 : 수학 및 일반 추론 벤치마크에서 Qwen3-8B 베이스 모델 대비 각각 18%, 24%의 성능 향상을 기록하며 추론 능력을 대폭 강화함.

다중 모델 협업 : OpenRouter를 통해 GPT, Gemini 등 여러 LLM에 동시 질의하여 다양한 초기 의견을 수집하는 로컬 웹 앱 시스템임.
익명 상호 검증 : 각 모델이 타 모델의 답변을 익명 상태에서 검토하고 정확도와 통찰력을 평가하여 순위를 매기는 상호 검증 과정을 수행함.
최종 답변 통합 : 지정된 의장(Chairman) 모델이 모든 개별 응답과 상호 평가 결과를 종합하여 사용자에게 최적화된 최종 답변을 도출함.

압도적 성능 : 블라인드 테스트 결과 Sora, Veo 등 최고 수준의 모델보다 비디오 화질과 모션 역동성에서 더 뛰어난 평가를 받음
기술 혁신 : 독자적인 NABLA 어텐션 메커니즘을 개발해 긴 비디오 생성 시 발생하는 병목을 해결하고 속도를 2.7배 가속화함
초고속 생성 : 추론 단계를 100회에서 16회로 줄인 Flash 모델(Distillation)을 통해 품질 저하 없이 압도적으로 빠른 생성 속도를 구현함