Sora
덤프버전 :
1. 개요[편집]
OpenAI가 개발하여 2024년 2월 15일 공개한 동영상 생성 인공지능. 하늘을 뜻하는 일본어 소라(
GPT와 마찬가지로 트랜스포머 아키텍처를 사용한다. 비디오와 이미지를 패치(Patch)라고 하는 작은 데이터 단위의 모음으로 표현하며, 각 패치는 GPT의 토큰과 유사하다고 한다. #
2024년 2월 기준 일반인이 이용할 수는 없으며, 언젠가는 이용이 가능해지겠지만 당장은 아니라고 한다. 일부 전문가들만 이를 이용하고 있다고 한다. #
2. 기능[편집]
기존 동영상 생성 모델에 비해 매우 사실적인 영상을 생성하고, 자연스러운 카메라 움직임을 묘사할 수 있다. 상상 속의 장면이라도 이를 묘사하는 프롬프트를 입력하면 그 모습의 표현이 가능하다. 대상 영속성이 구현된 동영상이 생성되는데, 어떤 사물이 배경을 지나가도 사물이 배경에 특별한 영향을 끼치지 않으면 그 배경이 변하지 않는다.
- 입력한 이미지와 프롬프트를 토대로 한 애니메이션 생성이 가능하다.
- 주어진 동영상의 앞뒤에 자연스럽게 이어지는 새로운 동영상을 생성할 수 있다. 사람이 그림을 그리는 동영상에는 그 그림이 더 그려지는 모습도 생성할 수 있다. 여러 개의 다른 동영상이 똑같은 장면으로 끝나게 할 수 있다.
- 끊기지 않는 무한 루프가 이어지는 동영상 생성이 가능하다.
- 주어진 동영상의 배경만을 바꿀 수 있다.
- 두 개의 아예 다른 동영상 사이에 완벽히 이어지는 동영상을 생성할 수 있다.
- 이미지 생성이 가능하다.
3. 한계[편집]
- 유리가 깨지는 식의 일부 물리적 현상을 제대로 묘사하지 못한다.
- 복잡한 상호작용 묘사가 필요한 동영상 생성을 제대로 하지 못한다.
이 문서의 내용 중 전체 또는 일부는 2024-02-17 22:09:29에 나무위키 Sora 문서에서 가져왔습니다.