티스토리 뷰

오픈 ai에서  챗GPT5가 조만간 나온다는 소식에 유저들의 관심이 집중되고 있습니다. 몇 주 전에 오픈 AI 동영상 소라의 샘플영상공개로 관심이 뜨거웠습니다. 소라를 공개한 날 샘알트먼이 개발한 월드코인까지 떡상하면서 영향력을 입증하고 있습니다. 일반인들에게 공개가 임박한 오픈 AI 동영상 소라에 대한 특징과 장단점에 대해 알아보겠습니다.

 

오픈AI 소라 sora 특징과 사용시기

 

오픈 AI 소라 

소라 AI는 사용자가 입력한 텍스트나 이미지를 동영상으로 만들어주는 혁신적인 서비스입니다. 오픈AI가 이전에 선보인 이미지에 특화된 서비스인 DALL-E와 비교하면, 소라 AI는 동영상 생성에 엄청난 디테일이 있는 서비스입니다.

 

소라AI의 성능 

사용자가 입력한 텍스트를 기반으로 최대 1분 길이의 영상을 생성하는 AI입니다. 언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있습니다. 생성된 단일 비디오 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 샷을 만들 수 있습니다.

 

소라AI의 작동 원리 

우리가 말하거나 그린 것을 동영상으로 만들어주는 인공지능입니다. '트랜스포머’라는 기술을 기반으로 하는데요. 트랜스포머는 말 그대로 '변환자’로, 우리의 말이나 그림을 컴퓨터가 이해할 수 있는 언어로 변환하는 역할을 합니다.

그럼 어떻게 동영상을 만들어낼까요? 소라 AI는 우리의 말이나 그림을 '패치’라는 작은 조각으로 나눕니다. 이 패치들은 우리의 말이나 그림의 각 부분을 대표하게 됩니다. 이렇게 나눠진 패치들은 소라 AI가 동영상을 만드는 데 사용됩니다.

 

그럼 소라AI는 어떤 것을 동영상으로 만들 수 있을까요? 소라 AI는 우리가 말로 설명한 것만으로도 동영상을 만들 수 있습니다. 또한, 이미 그려진 그림을 가져와서 동영상으로 만들 수도 있습니다. 심지어는 이미 만들어진 동영상을 가져와서 더 길게 만들거나, 빠진 부분을 채울 수도 있습니다.

이렇게 소라AI는 우리의 말이나 그림을 기반으로 동영상을 만들어내며, 이는 여러 분야에서 활용될 수 있습니다. 예를 들어, 교육, 엔터테인먼트, 디자인 등 다양한 분야에서 소라 AI의 동영상 생성 기능이 활용될 수 있습니다. 

 

소라AI 사용가능시기 

일부 출처에 따르면 소라AI는 2024년 하반기부터 일반인들도 무료로 이용할 수 있을 전망이라고 합니다. 하지만 다른 출처에서는 소라 AI의 공개 출시 시기는 2024년 또는 2025년 이후로 예상하는 것이 합리적이라고 제안하고 있습니다. 정확한 시기는 아직 확정되지 않은 것으로 보입니다.

 

오픈AI 소라의 특징 

다양한 대상을 동영상으로 만들어내는 기술

소라 AI는 우리가 말하는 것을 동영상으로 만들어내는 인공지능인데요. 이게 어떻게 가능할까요? 그 비밀은 소라 AI가 다양한 '대상’을 동영상으로 만들어낼 수 있다는 능력에 있습니다.

오픈AI 소라 영상캡쳐 실사강아지
오픈AI 소라 영상캡쳐 실사강아지

사람, 동물, 풍경

우리가 말하는 '대상’이란 무엇일까요? '대상’은 우리가 이야기하거나 그림으로 표현하려는 것을 말합니다. 예를 들어, 사람, 동물, 풍경 등이 될 수 있습니다. 소라 AI는 이런 대상들을 동영상으로 만들어낼 수 있습니다.

예를 들어, "행복한 개가 공원에서 뛰어놀고 있다"라는 문장을 소라AI에게 주면, 소라 AI는 이 문장을 듣고 개가 공원에서 뛰어놀고 있는 장면을 동영상으로 만들어냅니다. 마치 마법 같죠? 즉, 간단한 문장으로 디테일한 묘사를 스스로 만들어서 고퀄의 영상을 낼 수 있습니다.

 

추상적인 개념

소라AI는 사람이나 동물, 풍경과 같은 구체적인 대상뿐만 아니라 '추상적인 개념’까지도 동영상으로 만들어낼 수 있습니다. '추상적인 개념’이란 ‘행복’, ‘사랑’, '우정’과 같이 눈에 보이지 않는 것들을 말합니다.

예를 들어, "사랑이 가득한 장면"이라는 문장을 소라 AI에게 주면, 소라 AI는 '사랑’이라는 추상적인 개념을 동영상으로 표현합니다. 사람들이 서로를 바라보며 웃는 장면이나, 손을 잡고 함께 걷는 장면 등으로 '사랑’을 표현할 수 있겠죠.

.

원하는 스타일로 동영상을 만들어내는 기술

이 기술의 놀라운 점은, 우리가 원하는 '스타일’로 동영상을 만들어낼 수 있다는 것입니다.

 

다양한 스타일의 동영상

'스타일’이란 무엇일까요? '스타일’은 동영상이 어떤 느낌을 주는지, 어떤 분위기를 가지는지를 말합니다. 예를 들어, 영화는 드라마틱하고 감동적인 느낌을 줄 수 있고, 애니메이션은 상상력을 자극하는 화려한 색채와 독특한 캐릭터를 가질 수 있습니다. 다큐멘터리는 사실적이고 정보를 제공하는 느낌을 줄 수 있습니다.

소라AI는소라 AI는 이런 다양한 스타일의 동영상을 만들어낼 수 있습니다. 즉, 우리가 "드라마틱한 영화 스타일로 사랑에 빠진 두 사람의 이야기를 만들어줘"라고 말하면, 소라 AI는 드라마틱한 영화 스타일의 동영상을 만들어냅니다.

오픈AI소라에서 만든 영상 서핑하는 동물
소라에서 만든 영상 캡쳐

원하는 스타일로 동영상 만들기

어떻게 원하는 스타일로 동영상을 만들 수 있을까요? 그 비밀은 소라AI가 우리의 말을 정확하게 이해하고, 그 말을 바탕으로 동영상을 만들어내는 능력에 있습니다.

예를 들어, "애니메이션 스타일로 행복한 개가 공원에서 뛰어놀고 있다"라는 문장을 소라 AI에게 주면, 소라 AI는 이 문장을 듣고 디테일한 프롬프트가 없어도 애니메이션 스타일의 동영상을 만들어냅니다. 

 

 

실제 세계의 물리적 법칙을 이해하는 기술 

이 기술의 놀라운 점은, 소라AI가 '실제 세계에 사물이 어떻게 존재하는지’를 이해한다는 것입니다.

 

물리적 법칙 이해

'물리적 법칙 이해’란 무엇일까요? 이는 소라 AI가 우리가 살아가는 세상의 물리적인 규칙을 이해한다는 것을 의미합니다. 예를 들어, 사과가 나무에서 떨어질 때 아래로 떨어지는 것, 물이 위로 올라가지 않는 것 등의 물리적인 법칙을 소라 AI는 이해하고 있습니다.

 

복잡한 시각적 내용 이해

그럼 이 '물리적 법칙 이해’는 어떻게 동영상을 만드는 데 도움이 될까요? 이는 소라AI가 '복잡한 시각적 내용’을 이해하는 데 큰 도움이 됩니다. '복잡한 시각적 내용’이란 우리가 보는 세상의 모든 것을 말합니다. 사람의 움직임, 물체의 위치, 빛과 그림자 등의 복잡한 요소들을 소라 AI는 이해하고, 이를 바탕으로 동영상을 만들어냅니다.

예를 들어, "사람이 공을 차서 골을 넣는 장면"이라는 문장을 소라AI에게 주면, 소라 AI는 이 문장을 듣고 사람의 움직임, 공의 움직임, 골대의 위치 등의 복잡한 시각적 요소를 이해하고, 이를 바탕으로 동영상을 만들어냅니다.

챗 GPT의 거대 언어 모델을 기반으로 한 동영상 제작

소라AI는 우리가 말하는 것을 동영상으로 만들어내는 인공지능입니다. 그런데 이 기술의 놀라운 점은, 소라 AI가 '챗 GPT의 거대 언어 모델’을 기반으로 한다는 것입니다.

 

챗 GPT의 거대 언어 모델

인공지능이 사람들이 어떻게 말하는지, 어떤 단어를 어떤 상황에서 사용하는지 등을 학습한 모델을 의미합니다. 즉, 인공지능이 사람처럼 말하고 생각하는 방법을 배운다고 생각하면 됩니다.

 

텍스트, 이미지, 동영상 모두 활용 가능 

텍스트를 동영상으로 만들기

이미지를 동영상으로 만들기

우리가 그린 그림을 소라AI에게 주면, 소라 AI는 이 그림을 보고 그림 속의 장면을 동영상으로 만들어냅니다. 마치 그림이 살아 움직이는 것처럼요!

 

동영상을 더 길게 만들기

이미 만들어진 '동영상’을 더 길게 만들거나, 빠진 부분을 채울 수도 있습니다. 예를 들어, 우리가 가지고 있는 동영상의 일부분이 빠져있다면, 소라 AI는 그 빠진 부분을 채워 넣어 동영상을 완성시켜 줍니다.

 

 

오픈 AI 소라에 대한 우려 

소라 AI는 텍스트를 동영상으로 변환하는 놀라운 기술을 보여주고 있지만, 이러한 기술의 발전은 동시에 여러 가지 우려를 불러일으키고 있습니다.

 

딥페이크 악용 

소라 AI의 가장 큰 우려 중 하나는 '딥페이크’의 악용입니다. 딥페이크는 AI 기술을 사용하여 가상의 영상이나 음성을 생성하는 기술을 말합니다. 소라 AI가 고화질의 동영상을 쉽게 생성할 수 있다는 점은, 이 기술이 잘못된 손에 들어가면 심각한 문제를 야기할 수 있다는 우려를 불러일으킵니다.

 

가짜 정보 유통

딥페이크와 관련하여, 소라 AI는 가짜 정보의 유통을 촉진할 수 있다는 우려도 있습니다. 소라 AI가 생성하는 동영상이 현실적이고 세밀하게 만들어지므로, 이를 이용해 가짜 뉴스나 오해를 증폭시키는 데 악용될 수 있다는 우려가 있습니다. 그래서 워터마크가 있는 영상이 만들어집니다. 

 

기술적 단점

또한, 소라AI 자체의 기술적인 한계도 우려의 대상입니다. 복잡한 장면의 물리적 구성을 정확하게 도출하는 데 어려움을 겪을 수 있습니다. 예를 들어, 누군가 쿠키를 한 입 베어 물었지만 쿠키에 물린 자국이 없을 수도 있다고 설명되었습니다. 시간이 지나면서 보완될 것 같습니다.