이번주 AI 뉴스 📰
OpenAI, 텍스트-비디오 AI 모델 'Sora' 출시
혁신적 AI 모델 출시: OpenAI는 텍스트를 비디오로 변환하는 AI 모델 'Sora'를 공식 출시.
다양한 기능 제공: Sora는 텍스트 기반 비디오 생성, 이미지 애니메이션, 비디오 리믹스 등의 기능을 제공하며, ChatGPT Plus 및 Pro 구독자에게 각각 월 $20와 $200에 제공됨.
유럽 출시 지연: 유럽 지역에서는 출시가 지연될 예정.
구글, 105큐비트 양자 컴퓨팅 칩 'Willow' 공개
양자 오류 수정 돌파구: 구글은 105큐비트로 구성된 새로운 양자 컴퓨팅 칩 '윌로우'를 발표하며, 큐비트 수가 증가할수록 오류율이 감소하는 오류 수정 기술을 적용했다고 밝힘.
슈퍼컴퓨터 능가하는 성능: '윌로우'는 현재 가장 빠른 슈퍼컴퓨터로 10자년(10의 25승)이 걸리는 계산을 단 5분 이내에 수행할 수 있는 성능을 보유하고 있음.
양자컴퓨터 상용화 기대: 이러한 기술 발전으로 양자컴퓨터의 상용화 가능성이 높아졌으며, 인공지능, 의학, 에너지 등 다양한 분야에서의 응용이 기대됨.
AI 기반 자동차 설계: MIT 연구팀은 AI를 활용하여 8,000개의 3D 자동차 디자인을 분석, 공기역학적으로 최적화된 자동차를 설계함.
효율적인 디자인 프로세스: DrivAerNet++ 소프트웨어를 통해 물리적 프로토타입 없이도 성능 평가와 디자인 생성이 가능해짐.
지속 가능한 차량 개발 촉진: 이 접근법은 연구 개발 비용 절감과 더불어 연료 소비 감소 및 전기차의 주행 거리 향상에 기여할 것으로 기대됨.
이번주 AI 논문 📝
모델 업그레이드: PaliGemma 2는 기존 PaliGemma 모델을 개선하여, SigLIP-So400m 비전 인코더와 Gemma 2 언어 모델(2B부터 27B까지)을 결합한 새로운 비전-언어 모델(VLM).
다양한 해상도 지원: 이 모델은 224px, 448px, 896px의 세 가지 해상도로 학습되어, 다양한 전이 학습 작업에 최적화된 성능을 제공함.
광범위한 작업 적용: PaliGemma 2는 테이블 구조 인식, 분자 구조 인식, 악보 인식, 세밀한 캡션 생성, 방사선 보고서 생성 등 다양한 OCR 관련 작업에서 최첨단 성능을 달성.
안정성 향상: SNOOPI는 기존 모델의 불안정 문제를 해결하기 위해 새로운 가이던스 기술을 적용, 다양한 조건에서도 안정적이고 일관된 성능을 제공함.
부정적 요소 제거 가능: 부정 프롬프트를 지원하는 새로운 기술(NASA)을 통해, 원하는 요소를 더 잘 반영하고 불필요한 요소는 억제할 수 있음.
최고 성능 달성: SNOOPI는 새로운 평가 지표에서 최고 점수를 기록하며 단일 단계 이미지 생성 모델의 새로운 기준을 제시.
VideoGen-of-Thought: 멀티샷 영상 생성의 프레임워크
단계별 영상 생성: 스크립트 생성부터 샷 생성과 스무딩 메커니즘까지 단계적으로 설계하여 논리적이고 일관된 멀티샷 영상을 제작함.
스토리와 일관성 강화: 스토리 흐름과 캐릭터 정체성을 유지하는 기술(IP 임베딩)을 통해 시각적 일관성을 확보함.
최고 품질 달성: VGoT는 기존 영상 생성 기술을 능가하는 품질과 논리성을 입증하며, 코드는 공개될 예정.
이번주 AI 프로덕트 📦
VisionZip: 효율성을 높인 비전-언어 모델 혁신
효율성 향상: VisionZip은 비전-언어 모델에서 불필요한 비주얼 토큰을 줄여 계산 비용을 낮추면서도 성능을 유지하는 기술.
다양한 작업에 활용 가능: 이미지, 비디오 이해 작업과 실시간 대화 등에서 뛰어난 성능을 보여, 기존 기술 대비 최소 5% 이상 성능 향상을 달성함.
속도와 성능 개선: 기존 모델보다 8배 빠른 추론 속도를 제공하며, 더 작은 모델보다도 높은 성능을 발휘함.
ScoreLiDAR: 빠르고 정확한 3D LiDAR 장면 완성 기술
효율성 강화: ScoreLiDAR는 3D LiDAR 장면 완성에 특화된 새로운 증류 방법으로, 추론 시간을 30.55초에서 5.37초로 단축(5배 이상)하며 자율주행 환경에서 효율성을 극대화함.
구조적 손실 도입: 장면의 전체 구조와 주요 랜드마크의 상대적 배치를 정확히 학습하도록 돕는 구조적 손실을 통해 모델의 완성 품질을 향상시킴.
최신 성능 달성: ScoreLiDAR는 SemanticKITTI 데이터셋에서 기존 모델보다 우수한 성능을 보여, 자율주행 분야에서 새로운 기준을 세움.