이번주 AI 뉴스 📰
오픈 소스 이미지 AI 최강자 ‘FLUX.2’ 출시… “실무 완벽 대응”
실무 기능 강화 : 최대 400만 화소 편집 지원 및 복잡한 타이포그래피 구현, 캐릭터 일관성 유지 등 현업 워크플로우에 최적화된 기능을 제공함
정교한 제어 : 최대 10장의 이미지를 동시에 참조하는 멀티 레퍼런스 기능과 미스트랄-3 기반의 강력한 문맥 이해 능력을 갖춤
라인업 다각화 : 최고 사양의 ‘프로’, 유연한 ‘플렉스’와 함께 320억 파라미터 규모의 오픈 웨이트 모델 ‘데브’를 공개해 선택의 폭을 넓힘
트럼프, 제2의 맨해튼 프로젝트 ‘Genesis Mission’ 가동… AI로 과학 혁명 주도
제2의 맨해튼 프로젝트 : 트럼프 대통령이 AI를 통한 과학 혁신과 기술 패권 확보를 목표로 하는 국가적 총력전인 ‘제네시스 미션’ 행정명령에 서명함
AI 통합 플랫폼 구축 : 에너지부 주도로 연방 정부의 방대한 데이터와 슈퍼컴퓨팅 자원을 결합한 ‘미국 과학 안보 플랫폼’을 구축해 연구 속도를 획기적으로 높일 계획임
6대 핵심 분야 집중 : 반도체, 생명공학, 양자 과학 등 국가 안보와 직결된 주요 과학 기술 난제들을 AI를 활용해 해결하고 글로벌 리더십을 강화함
샘 알트만·조니 아이브 “AI 하드웨어 시제품 완성, 2년 내 출시”
시제품 제작 중 : 알트만과 아이브가 협력한 AI 기기의 디자인이 확정되어 현재 프로토타입 단계이며 2년 이내에 출시될 예정임
단순미 강조 : 스크린 없는 스마트폰 크기로 추정되며, 알트만은 “한 입 베어 물고 싶을 만큼” 단순하고 아름다운 디자인이라 묘사함
직관적 사용성 : 아이브는 사용자가 위화감 없이 무심코 사용할 수 있을 정도로 직관적이고 도구 본연에 충실한 제품을 지향한다고 밝힘
이번주 AI 논문 📝
Think-at-Hard: 추론 LLM 성능 향상을 위한 선택적 잠재 반복 기법
잠재적 과잉 사고 발견 : 기존 순환 트랜스포머가 쉬운 토큰까지 불필요하게 재검토하여 정답을 오히려 오답으로 바꾸는 ‘잠재적 과잉 사고’ 현상을 규명함.
선택적 추론 기술 제안 : 오답 가능성이 높은 ‘어려운 토큰’만 선별해 심층 연산하는 Think-at-Hard기법과 효율적인 정보 흐름을 위한 Duo-Causal Attention을 도입함.
연산 효율과 성능 입증 : 94%의 토큰에 대한 추가 연산을 생략하면서도 모든 토큰을 반복 계산하는 방식 대비 최대 11.3%의 정확도 향상을 달성함
VIDEOP2R: 인지와 추론 과정을 분리한 비디오 이해 프레임워크
과정 중심 모델링 : 비디오 이해를 인지(Perception)와 추론(Reasoning)의 별도 과정으로 분리해 기존 강화 학습 미세조정(RFT)의 한계를 극복함.
CoT 데이터 구축 : 인지와 추론을 명확히 구분한 고품질 데이터셋(VIDEOP2R-CoT-162K)을 생성해 지도 미세조정(SFT) 단계에 적용함.
SOTA 성능 달성 : 각 과정에 개별 보상을 주는 PA-GRPO 알고리즘을 도입해 7개 중 6개 벤치마크에서 최고 성능(SOTA)을 기록함.
Agent0: 도구 통합 추론을 통한 제로 데이터 기반의 자가 진화 에이전트
제로 데이터 진화 : 외부 데이터 의존 없이 도구 활용과 다단계 상호 작용을 통해 고성능 에이전트를 스스로 육성하는 완전 자율 프레임워크를 제안함.
선순환 학습 구조 : 문제를 내는 에이전트와 푸는 에이전트가 도구를 활용해 경쟁하며, 과제 난이도와 해결 능력을 함께 높이는 선순환 사이클을 형성함.
획기적 성능 향상 : 수학 및 일반 추론 벤치마크에서 Qwen3-8B 베이스 모델 대비 각각 18%, 24%의 성능 향상을 기록하며 추론 능력을 대폭 강화함.
이번주 AI 프로덕트 🎁
LLM 위원회: 다중 모델 상호 검증 기반의 답변 통합 시스템
다중 모델 협업 : OpenRouter를 통해 GPT, Gemini 등 여러 LLM에 동시 질의하여 다양한 초기 의견을 수집하는 로컬 웹 앱 시스템임.
익명 상호 검증 : 각 모델이 타 모델의 답변을 익명 상태에서 검토하고 정확도와 통찰력을 평가하여 순위를 매기는 상호 검증 과정을 수행함.
최종 답변 통합 : 지정된 의장(Chairman) 모델이 모든 개별 응답과 상호 평가 결과를 종합하여 사용자에게 최적화된 최종 답변을 도출함.
Kandinsky 5.0: Sora를 능가하는 화질과 2.7배 빨라진 고효율 비디오 생성 모델
압도적 성능 : 블라인드 테스트 결과 Sora, Veo 등 최고 수준의 모델보다 비디오 화질과 모션 역동성에서 더 뛰어난 평가를 받음
기술 혁신 : 독자적인 NABLA 어텐션 메커니즘을 개발해 긴 비디오 생성 시 발생하는 병목을 해결하고 속도를 2.7배 가속화함
초고속 생성 : 추론 단계를 100회에서 16회로 줄인 Flash 모델(Distillation)을 통해 품질 저하 없이 압도적으로 빠른 생성 속도를 구현함


















