DALL·E 2, 인공지능으로 그림 그리는 방법

DALL-E 2가 오픈 베타 서비스를 시작했습니다. 사용법을 정리해보았습니다.
DALL·E 2, 인공지능으로 그림 그리는 방법
A Dall-E 2 Generated image, titled with “Crowded subway station in Seoul full of various animals from safari”

달리(DALL·E)는 2015년 설립된 인공지능 연구재단 OpenAI가 만든 이미지 생성 AI다. 작년 2021년 1월 초에 첫 버전을 공개했고, 올해에는 화질이 개선되고 아웃페인팅이 가능한  달리2를 발표했다.

그리고 현지 시간으로 9월 28일, 그러니까 우리 시각으로 오늘 오픈 베타 서비스를 시작했다. 수백만 명이 베타테스터 대기리스트에 올라 있었던 것으로 알려져 있었는데, 오늘부터는 가입만 하면 누구나 곧바로 사용할 수 있다.

A Dall-e 2 generated image titled with “Gryffindor students sitting around a Hogwarts fireplace”

달리를 이용하면 완전히 새로운 이미지를 생성하거나, 기존 이미지를 편집하는 것이 가능하다. 직접 사용해보면서 간단하게 정리해보았다.

달리 사용해보기

0. 회원가입

먼저 이곳으로 이동해서 회원가입을 한다. 메일 주소를 입력하거나, 지메일 또는 마이크로소프트 계정을 이용해서 이메일 인증을 하고 나면, 이름을 입력하는 창이 나타난다. 이름 입력 후 휴대전화번호 인증을 하면 가입이 완료된다.

가입하면 50크레딧을 받는데, 새로운 이미지를 만들거나 아웃페인팅으로 편집/확장하기 위해 'Generate'(생성) 버튼을 누를 때마다 1크레딧이 차감된다.

벌써 다 썼다고 너무 걱정하지 말자. 매달 50크레딧이 새로 채워진다. 크레딧 구매를 할 수도 있다. 115크레딧 사는 데에 15달러, 그러니까 2만원 정도가 든다. 그림 생성 버튼 한 번 쓰는 데에 200원 꼴이다. 크레딧 구매는 신용카드로 할 수 있다.

1. 새로운 이미지 생성

새로운 이미지를 만드는 방법은 어렵지 않다. 메인화면의 세부 설명 입력창에 자신이 원하는 그림을 설명하는 단어나 문장을 영어로 쓰고, 마우스로 입력창 오른쪽 끝에 있는 생성(Generate)를 누르거나 엔터키를 치면 된다.

이미지 생성 시 주의할 점이 몇 가지 있다.

첫 번째는 반드시 영어를 써야 한다는 점이다. 아래는 실수로 한국어 "3d 렌더링, 파도를 형상화한 바다의 비정형 컨템포러리 워터프론트 건축물, 주변에 철새가 서식하는 습지 있음"을 입력했더니 나온 결과물이다. (한국어를 들은 미국 사람들 머릿속에 떠오르는 이미지일까?)  

A Dall-E generated image titled with “3d 렌더링, 파도를 형상화한 바다의 비정형 컨템포러리 워터프론트 건축물, 주변에 철새가 서식하는 습지 있음”

원래 입력하려고 했던 "3d rendering, atypical contemporary waterfront architecture of the sea in the form of waves, with a wetland inhabited by migratory birds" 영어 문구를 입력했더니 아래와 같이 나왔다.

A Dall-e 2 generated image titled with "3d rendering, atypical contemporary waterfront architecture of the sea in the form of waves, with a wetland inhabited by migratory birds"

앞선 이미지가 한국어를 번역해서 뭔가 이미지를 생성했다고 보기에는 간극이 너무 크다. 아마도 OpenAI가 알고리즘 훈련을 위해 사용하는 데이터셋이 영어로 되어 있기 때문일 것으로 추정된다.

두 번째 주의할 점은 명확하면서도 구체적인 지시를 해야 한다는 것이다. 물론 명확성과 구체성이라는 말 자체가 불명확하고 구체적이지 않을 수 있다. 예를 들면 "by Vincent Van Gogh"나 "Oil painting" 같이 스타일에 관한 직접적인 설명을 넣을 수 있고, 'animal'보다는 'cat'이나 'dog' 같은 단어를 쓰는 것이 좋다.

달리 메인 화면에 있는 그림들을 클릭하면 이미지 생성에 사용된 문구들을 볼 수 있다. 이것들을 참고해서 느낌적인 느낌을 스스로 탐색해보자. 그 외에도 달리 관련 OpenAI의 블로그인스타그램을 통해서 힌트를 얻을 수 있다.

영어작문이 어렵다면 구글 번역기네이버 파파고를 써서 한국어를 영어로 번역한 다음 달리 입력창에 복사 붙여넣기를 하는 것도 좋은 방법.

2. 아웃페인팅: 기존 이미지 편집 또는 확장

달리로 그림을 그리는 두 번째 방법은 달리로 생성한 이미지나, 아니면 내가 원래 갖고 있던 이미지를 확장하는 아웃페인팅 기능을 활용하는 것이다.

인터페이스는 복잡하지 않기 때문에 몇 번 사용해보면 금방 익힐 수 있다. 아웃페인팅을 할 때에도 문장을 입력해야 하는데, 기존 이미지와 관련된 것을 입력해도 좋고 그렇지 않아도 괜찮다.

화면 하단의 돋보기 버튼을 누르면 프레임 크기를 더 넓게 잡을 수 있다. 기존 이미지와 거리를 둔 반대편에서 새로운 그림을 만든 다음, 가운데를 채워나갈 수도 있다. 물론 이런 식의 작업을 위해서는 상당히 많은 크레딧이 필요할 것 같다.

사용소감

매우 신기하다. 그런데 생각보다 만족스런 그림을 만드는 것이 어렵다. 그러니까, 인공지능이 이해할 수 있으면서도 내가 기대하는 방향의 그림을 언어로 설명하는 것이 쉽지가 않다.

예를 들어서 아래는 '별이 쏟아지는 한밤 중 타지마할의 대리석 위에서 춤을 추는 여성 케이팝 댄서'라고 입력한 결과물이다.

A Dall-E 2 Generated image, titled with “Female Kpop dancer dancing on the marble floor of the Taj Mahal in the middle of a starry night”

이미지의 스타일을 특정하지 않았기 때문에 사진도 아니고 그림도 아닌, 다소 기괴한 형상이 나왔다. 전체적인 느낌은 내가 실제로 갖고 있는 케이팝의 이미지와는 거리가 있다.

반면 아래는 "빈센트 반 고흐가 그린 카우치 포테이토"(소파에 늘어져서 아무 일도 안 하는 게으른 사람)라는 이름으로 만든 이미지다.

A Dall-E 2 Generated image, titled with "a couch potato by Vincent Van Gogh"

달리로 만드는 이미지는 추측컨대 서울 근교에서 살고 있는 30대 한국어 화자인 나의 문화와는 다소 거리가 있는 것 같다. 데이터셋을 관리하고 훈련시키는 미국 샌프란시스코 거주 기술자들, 그들이 접근할 수 있는 북미-영어 문화권의 내용이 아무래도 중심이 될 수밖에 없다.

영어로 미술사나 컨템포러리 아트를 배웠거나, 영어가 제1언어인 사람들이 달리 이미지셋을 사용하는 데에 조금 더 수월할 것 같다.

물론, 번역기와 기존 이미지 타이틀을 연구하면서 달리를 사용하면 그러한 장벽은 쉽게 뛰어넘을 수 있을지도 모른다. 하지만 한 시간도 채 되지 않아 50 크레딧 중 벌써 절반을 써 버렸다.

샌프란시스코 영어사용자와 서울 사는 한국어 사용자 사이의 거리란 현질로 메우기엔 너무 큰 간극이 아닐까.


* 이 포스트에 사용된 모든 그림은 DALL·E 크레딧을 이용해서 제가 생성한 그림들입니다. 저작권은... 글쎄요, 잘 모르겠네요.

주간 김정현 뉴스레터, 무료로 구독하세요.

기술에 관심 있으세요? 매주 새로운 이야기를 듣고 싶으신가요?
어렵지 않게 설명해드릴게요. 당신도 테크 인사이더가 될 수 있습니다.

구독하기