이번에는 생성형 AI 동영상 도구 중 Veo 2에 대해 살펴볼게요. Google Veo 2는 Gemini Advanced 이상의 유료 구독을 하면 사용할 수 있어요. 챗GPT도 SORA라는 동영상 생성 툴을 제공하지만, 따로 가입해야 하는데에 반해, Veo 2는 Gemini에 가입하면 바로 사용이 가능합니다.
Veo 2 특징
솔직히 AI가 동영상 만든다고 하면 '그냥 사진 여러 장 이어 붙인 거 아니야?' 하고 생각하실 수도 있어요. 하지만 Veo 2는 조금 다르더라고요. 직접 사용해 보면서 느낀 Veo 2의 특징을 다음과 같이 정리해 볼 수 있을 것 같습니다.
- 자연스러운 '움직임': 단순히 정적인 사물들이 움직이는 게 아니라, 물이 자연스럽게 흐르고, 사람이 뛰어가면 옷자락이 휘날리는 등 현실 세계의 물리 법칙을 꽤나 잘 이해하고 반영합니다. 덕분에 어설프지 않고 '진짜 영상' 같은 느낌을 줍니다.
- 1080p 고화질: 스마트폰이나 PC 화면으로 볼 때 답답함 없이 선명한 고화질(1080p) 영상을 만들어줘요. 개인적인 용도로 쓰기엔 충분한 품질입니다.
- 짧지만 괜찮은 8초 클립: 한 번에 만들 수 있는 영상 길이는 최대 8초예요. '에게, 고작 8초?'라고 생각할 수 있지만, 인스타그램 릴스나 유튜브 쇼츠 같은 짧은 영상 플랫폼에서는 8초도 짧지 않은 시간이고, 임팩트 있는 장면을 만들기엔 충분합니다. 여러 클립을 이어 붙이면 더 긴 스토리도 가능하죠.
- 말하는 대로 '그려내는' 능력: 제가 입력한 텍스트를 정말 잘 시각화합니다. "안개 낀 새벽 숲속을 걷는 사슴 한 마리"라고 쓰면, 정말로 그런 느낌의 영상이 나옵니다. 단순한 키워드 매칭이 아니라, 문맥과 분위기를 이해하려는 모습이 보입니다.
동영상 생성 도구는 이미 여러가지가 있어요. OpenAI의 SORA나 Pika 등 보다 개인적으로 Google의 Veo 2가 더 쉽고 높은 품질의 동영상 생성 도구라고 생각됩니다. 최근에는 Veo 3도 출시됐다고 합니다.
자, 그럼 동영상을 만들어 볼게요
구글 Gemini 페이지에서 보면 프롬프트란에 "동영상" 버튼이 있어요. 이것을 선택한 후, 프롬프트 창에 텍스트로 원하는 동영상에 대해 묘사를 해줍니다. 이번에 프롬프트는 아주 간단하게 비키니 입은 금발이라는 표현을 사용했어요. 물론 몸매를 묘사한 단어를 사용했지만, 비속어 같아서 아래 그림에서는 지웠어요.
중요한 것은 별다른 구체적인 묘사를 안 했다는 거예요. 그럼에도 위 그림의 동영상은 8초짜리로 인물의 움직임이나 배경이 되는 파도의 움직임이 매우 자연스러웠어요. Gemini에서는 생성된 동영상 링크를 공유할 수 있으나, 티스토리 모바일 접속 속도가 빠르지 못하니 동영상 링크는 제외합니다.
어떻게 하면 멋진 영상을 만들 수 있을까?
그러면, 그냥 단순하게 해도 위와 같은 결과물을 얻을 수 있는데, 특정 목적이나 더 높은 퀄리티의 결과를 얻으려면 당연하게도 구체적인 프롬프트를 작성해야 합니다. 이 프롬프트를 어떻게 쓰느냐에 따라 영상의 퀄리티가 크게 차이가 납니다. 다음과 같이 고려해 보죠.
가장 중요한 원칙: '나는 이 장면을 카메라로 어떻게 찍고 싶은가?'를 상상하며 묘사하기
- 메인 '주체'와 '행동'을 명확히:
- 누가/무엇이: '골든 리트리버', '은하계 우주선', '여자/남자/나무'.
- 무엇을 하는가: '초원을 달린다', '하늘을 가로지른다', '햇살 아래 반짝인다'.
- '배경'과 '환경'을 구체적으로: 주체가 어떤 환경에 있는지 상세하게 설명합니다. 시간, 날씨, 장소 등을 추가하면 좋습니다.
- '분위기'와 '감성'을 담기: 영상에서 느껴졌으면 하는 감정이나 분위기를 형용사로 표현합니다.
- '카메라 워크'를 상상해서 지시: 이 부분이 가장 큰 차이를 만듭니다. 마치 내가 감독이 되어 카메라맨에게 지시하듯 설명합니다.
- 움직임: "천천히 팬(Pan)하며", "부드럽게 줌인(Zoom In)되는", "흔들림 없는 스테디캠 움직임".
- 렌즈 느낌: "광각 렌즈 효과", "얕은 피사계 심도 (배경 흐림)".
위 사항들을 고려해서 다음과 같은 프롬프트를 구성했어요.
An ethereal ancient female warrior, adorned in gleaming, minimalist enchanted armor, brandishes a glowing runic sword. She fearlessly charges through a swirling mist towards an endless legion of monstrous, shadowy figures. Dynamic slow-motion shot, magical aura, high fantasy art style.
- 비현실적이고 신비로운 고대 여전사: ethereal ancient female warrior
- 빛나는 미니멀한 마법 갑옷: adorned in gleaming, minimalist enchanted armor
- 룬 문자가 새겨진 빛나는 검을 휘두르는 모습: brandishes a glowing runic sword
- 끝없는 괴물 같고 그림자 같은 군단과, 소용돌이치는 안개: charges through a swirling mist towards an endless legion of monstrous, shadowy figures
- 역동적인 슬로우 모션 샷, 마법 오라, 하이 판타지 아트 스타일: Dynamic slow-motion shot, magical aura, high fantasy art style
동영상 결과는 프롬프트에 묘사했던 대로 비교적 잘 생성되었어요. 물론, 처음부터 마음에 드는 건 아니겠지만, 뭔가 좀 부족한 느낌적인 느낌은 없지 않아요. 프롬프트는 몇 차례 수정해야 가장 마음에 드는 결과가 만들어질 듯한데요.
월 29,000원 정액, Gemini Advanced 에서는 Veo2 동영상 생성은 하루 5~6개 정도로 보입니다. 추가 생성은 내일까지 대기해야 한다고 안내가 나옵니다.
개인적으로는 현재까지 이정도 비용으로 가장 높은 품질의 동영상 생성이 아닌가 싶습니다. 무엇보다, 위에서 말했지만, 인물이 자연스럽습니다. Pika나 다른 생성 도구를 통해 만든 동영상 보다 실사 동영상에 더 가까운 듯합니다.
하지만, 생성형 AI를 통한 이런 동영상 또는 이미지 생성 도구의 가장 큰 단점은 캐릭터 일관성(Character Consistency)이 없다는 거죠. 미드저니 같은 일부 이미지 생성 도구는 이런 부분에 대해 여러 가지 대응 방법을 제시하고 있지만, 동영상 생성 도구는 아직 연속된 영상 클립에서 일관된 캐릭터를 유지할 수 없죠.
이번에 새로 출시됐다는 Veo 3을 사용하려면 상당히 높은 비용을 지불해야 하던데, 이 버전에는 캐릭터 일관성이 적용됐을까요?
2025.05.12 - [기술 트랜드] - 챗GPT Plus vs Gemini Advanced AI 챗봇 기능, 가격 등을 비교해 보자
챗GPT Plus vs Gemini Advanced AI 챗봇 기능, 가격 등을 비교해 보자
오늘은 생성형 AI로 유명한 OpenAI의 챗GPT와 구글의 Gemini를 비교해 보죠. 그중 무료 버전은 제외하고 유료버전에서 ChatGPT Plus와 Gemini Advanced를 중심으로 비교해 보도록 하겠습니다. 챗GPT Plus vs Gemini
majeongs.tistory.com