이번주 AI 뉴스 📰
Anthropic, 새로운 AI 모델 Claude 3 발표
AI 모델의 진화 : Anthropic는 Claude 3 AI 모델이 Google과 OpenAI의 주요 모델과 같거나 그보다 더 나은 성능을 발휘한다고 발표.
다기능성 및 접근성 : Claude 3은 텍스트와 사진 입력을 이해할 수 있는 다기능 모델로, Claude 2 보다 엄청난 발전을 보여줌.
성능 향상과 벤치마킹 : Claude 3 모델은 높은 수준의 이해와 처리 능력을 바탕으로 여러 벤치마킹 테스트에서 우수한 성과를 보임.
Elon Musk, OpenAI 및 CEO Sam Altman 고소
소송 제기: 일론 머스크는 OpenAI와 CEO Sam Altman을 고소하며, ChatGPT의 제작사가 Microsoft와의 130억 달러 파트너십을 맺고 최신 AI 제품의 코드를 비공개로 함으로써 원래의 비영리 목적에서 벗어났다고 주장.
비영리 목적 포기: OpenAI가 Microsoft와의 파트너십과 함께 비영리 임무를 '돌이킬 수 없게' 포기하고 수익 추구로 방향을 전환했다는 비난이 제기됨.
리더십 위기: 고소장에 따르면, OpenAI의 리더십 위기와 이와 관련된 사건들, 특히 Sam Altman의 일시적 해임 사건과 Microsoft가 OpenAI에 미치는 영향이 소송의 주요 내용 중 하나로 언급됨.
소송 일부 기각 요청: OpenAI는 뉴욕타임스사가 제기한 소송의 핵심 요소들을 기각해달라고 연방 법원에 요청함.
저작권 침해 주장: 뉴욕타임스는 OpenAI와 파트너인 Microsoft가 자사의 수백만 기사를 사용하여 ChatGPT와 같은 AI 기술을 훈련시키며 저작권을 침해했다고 지난 12월 27일 소송을 제기함.
법적 논리 부재: OpenAI의 변호사들은 뉴욕타임스가 3년 이전에 발생한 복제 행위에 대해 소송을 제기할 수 없으며, 디지털 밀레니엄 저작권법 위반 주장이 법적으로 타당하지 않다고 주장.
이번주 AI 논문 📝
Starcoder 2 & The Stack V2: 619개 프로그래밍 언어 LLM
데이터 확장: 일명 ‘BigCode’ 프로젝트는 코딩 언어 모델(Code LLMs) 개발을 위해 소프트웨어 헤리티지(SWH)와 협력하여 619개 프로그래밍 언어를 아우르는 SWH 저장소를 기반으로 Stack v2를 구축.
성능 비교: 스타코더2 모델은 3B, 7B, 15B 파라미터로 훈련되어 비슷한 크기의 다른 코드 LLM보다 우수한 성능을 보이며, 일부 저자원 언어에서도 뛰어난 결과를 제시.
투명성 보장: 모델 가중치를 OpenRAIL 라이선스로 공개하고, 훈련 데이터에 대한 완전한 투명성을 위해 소프트웨어 헤리티지 영구 식별자(SWHIDs)를 공개함.
이미지 처리 : VisionLLaMA는 텍스트를 다루는 기술에서 발전하여, 사진 같은 이미지도 처리할 수 있는 새로운 방법을 소개
다재다능한 사용 : 다양한 사진 작업을 할 수 있도록 만들어진 이 기술은 사진을 이해하고 새로운 이미지를 만드는 데 큰 발전을 제공.
성능 향상 : 기존 방식보다 더 좋은 결과를 내는 VisionLLaMA는 사진 분야에서 중요한 발전을 이룸
모델 혁신: RNN과 현지 주의 (Local Attention) 기법을 혼합한 하이브리드 모델로, 뛰어난 성능과 효율을 제공.
성능 및 확장성: 그리핀은 6배 적은 토큰으로 훈련되었음에도 Llama-2의 성능에 맞먹고, 훈련 중 트랜스포머의 하드웨어 효율성을 달성함과 동시에, 추론 시 더 낮은 지연시간과 높은 처리량을 보임.
분산 훈련 최적화: 효율적인 분산 훈련을 가능하게 하는 모델 샤딩 방법을 통해, 14B 파라미터 규모로 확장.
이번주 AI 프로덕트 📦
투명 이미지 레이어 생성의 혁신: Latent Transparency 활용
투명도 학습: LayerDiffuse는 사전 훈련된 잠재적 확산 모델을 이용하여 투명 이미지를 생성할 수 있는 방법을 제시.
확장 가능성: 이 방법은 잠재적 공간을 조정하여 모든 잠재적 확산 모델을 투명 이미지 생성기로 변환할 수 있게 함.
사용자 선호도: 사용자 연구 결과, 대부분의 경우(97%) 사용자들이 기존의 임시 방편보다 본 연구로 생성된 투명 콘텐츠를 선호함.
TripoSR: 단일 이미지에서의 빠른 3D 객체 재구성
빠른 변환 : TripoSR은 변환기 아키텍처를 활용해 단 0.5초 이내에 단일 이미지로부터 3D 메시를 생성하는 빠른 3D 생성 모델입니다.
기술 혁신 : 데이터 처리, 모델 디자인, 훈련 기술에 있어 중대한 개선을 통합하여, 공개 데이터셋에서 우수한 성능을 보여줌.
개방형 라이선스 : MIT 라이선스 하에 공개된 TripoSR은 연구자, 개발자, 창작자에게 최신 3D 생성 AI의 진보를 제공.