스테이블 디퓨전으로 AI 이미지 손쉽게 무료로 만드는 방법(CPU 만으로만 AI 이미지 만들기)
목차
오픈소스 AI로 이미지를 직접 만들어 보자
IT 기술의 발전속도를 정말 빠른거 같습니다. 머신러닝 기반의 “알파고” 의 충격이 일어난게 엊그제 같은데 벌써 8년이랑 시간이 흘렀네요.
이세돌 9단과 알파고의 세기의 바둑대결은 예상과는 다르게 알파고의 4승 1패로 끝이 났습니다. “바둑” 만큼은 인간이 우위를 점할꺼라는 예측에도 불구하고 알파고는 이세돌 9단에게 여유있게 승리를 했었지요. 이세돌 9단이 1승을 거뒀지만 대국은 알파고의 승리로 끝이 났습니다.(이세돌 9단의 1승은 알파고를 상대로 인간이 거든 유일한 1승 이라고 합니다)
이후로 “AI” 는 IT 기술에서 빼놓을 수 없는 한 분야로 자리잡았습니다. 특히 “이미지 관련” AI 기술은 정말 진일보한 발전을 이뤄낸거 같네요. 또한 현재까지도 계속 발전하고 있는 중입니다.
최근에 ChatGPT 를 써보고 생각보다 뛰어난 기능에 놀란적이 있었습니다. 그만큼 AI는 우리의 주변에 점점 생활화 되어 가고 있습니다.
저도 그래서 “AI” 쪽에 관심을 가지려고 하고 있는 찰나에 간혹가다 SNS 에서 “실사 이미지”를 보게 되었습니다. 생각보다 이미지의 품질이 꽤나 좋더군요. 그런데 이 이미지들이 “AI”로 만들어졌다고 해서 저도 직접 만들어 보고 싶어졌습니다.
그럼 AI 이미지를 만들려면 어떻게 해야 할까요? 크게 2가지 방법이 있을거 같습니다.
- 미드저니(Midjourney), 달리(DALL-E), 빙 이미지 크리에이터 같은 AI 이미지 서비스를 이용하여 AI 이미지를 생성
- 스테이블 디퓨전(Stable Diffusion)을 사용하여 내 PC 에서 직접 AI 이미지를 생성
최근에 미드저니와 달리등의 AI 이미지 생성 서비스가 이미 등장하여 많은 이들이 이들 서비스를 이용하여 AI 이미지를 생성하고 있습니다. 그런데 이들 서비스는 무료로 사용하기에는 제약이 어느정도 존재합니다.
따라서 AI 이미지 서비스 중에서는 “빙 이미지 크리에이터” 정도가 무료로 제약없이 사용이 가능합니다. 빙 이미지 크리에이터는 이번 글에서는 다루지 않고 이 다음 글에서 다루도록 하겠습니다.
그렇다면 “스테이블 디퓨전”으로 직접 AI 이미지를 생성하는 법은 어떨까요? 최근에 오픈소스 형태로 제공되는 AI 이미지 크리에이터인 “스테이블 디퓨전”은 매우 뛰어난 기능으로 누구나 손쉽게 무료로 AI 이미지를 생성하는게 가능합니다.
이번 시간에는 “스테이블 디퓨전”을 사용하여 AI 이미지를 생성하는 법에 대해 알아보겠습니다.
스테이블 디퓨전(Stable Diffusion) 소개
2022년 8월 Stability AI 에서 출시한 text-to-image AI 이미지 생성 솔루션입니다. 현재까지는 유일하게 AI 이미지를 PC 등의 로컬에서 생성할 수 있는 오픈소스라고 볼 수 있습니다.
2024년 3월에 3.0 버전을 출시하고 있으며 누구나 자신의 PC에 설치하여 AI 이미지를 생성하는게 가능합니다. text-to-image 생성 방식이기 때문에 내가 생성하려는 이미지를 “프롬프트” 형태로 묘사해 주면 사용자가 원하는 이미지를 생성해 줍니다.
현재 출시된 AI 이미지 생성기 중에서는 단연 최고의 성능과 기능을 보유하고 있어서 많은 사람들이 스테이블 디퓨전을 통해 AI 이미지를 생성하여 사용하고 있습니다. 저도 이번에 처음 스테이블 디퓨전을 알게 되어서 제 PC에서 AI 이미지를 생성해 보려고 하고 있습니다.
대신에 스테이블 디퓨전을 사용하려면 어느정도 성능과 사양 그리고 “엔비디아(Nvidia)” 기반의 GPU가 달린 그래픽 카드가 필요합니다.
따라서 이 부분은 스테이블 디퓨전을 사용할 때 약간의 제약이 따른다고 보시면 되겠습니다.
스테이를 디퓨전을 사용하려면 어떤 PC를 사용해야 할까?
스테이블 디퓨전으로 AI 이미지를 생성하려면 아무래도 “성능이 좋은 PC” 를 사용하는걸 추천하는거 같습니다.
코드도사에서는 이전에 “개발용 PC” 에 대하여 소개를 해드린 적이 있었습니다. 개발용 PC는 생각보다 고사양을 요구하진 않습니다. 대신에 메모리 용량이나 하드디스크 용량만 충분하다면 크게 문제는 없는게 개발용 PC 입니다.
하지만 “스테이블 디퓨전”을 사용하기 위한 PC는 약간 다릅니다. PC에 탑재된 CPU와 메모리 하드디스크 모두 “다다익선” 입니다. CPU 같은 경우에는 인텔 CPU를 추천하고, 메모리는 최소 16 GB 이상, 하드디스크는 많으면 많을수록 좋습니다.(특히 NVME M.2 SSD 를 추천하는 편입니다)
그중에서 가장 중요한 사양은 “그래픽 카드” 입니다. 특히 스테이블 디퓨전의 경우에는 “엔비디아 그래픽 카드”를 사용하길 권장하고 있습니다.
AI 이미지 생성시 엔비디아 그래픽 카드의 GPU를 통해 이미지를 생성하기 때문에 아무래도 PC에서 엔비디아 그래픽 카드가 필수적입니다.
위의 도표를 보면 엔비디아 그래픽카드 모델별로 스테이블 디퓨전에서 AI 이미지 생성 시간을 나타난 겁니다. 엔비디아 그래픽 카드가 필수이기도 하지만 모델별로도 생성 시간의 차이가 있다는 걸 보여 주기도 합니다. (위 링크의 tom’s hardware 홈페이지에 가시면 좀더 자세한 내용을 확인할 수 있습니다)
역시나 “엔비디아”라는 회사의 주가가 지속적으로 오르는 이유가 다 있었군요ㅋ 요즘 AI 관련 솔루션들이 엔비디아의 GPU 를 사용하여 연산을 한다고 하니 엔비디아의 그래픽 카드는 그야말로 엄청난 수요가 있는걸로 보입니다.
어쨌거나 스테이블 디퓨전을 사용하기 위해선 PC 사양이 어느정도 높아야 하고 그래픽 카드는 필수요소라고 봐야 합니다. 물론 “타사의 그래픽 카드”도 사용이 가능하지만 약간의 제약이 따르는 거 같아 보입니다.
레노버 리전 2024 E-스포츠 게이밍 노트북, 14 번째 인텔 코어 i9-14900HX, RTX4060, 2.5K, 240Hz, 16 인치 게임 노트북 PC, Y9000P
위의 PC/노트북은 스테이블 디퓨전을 사용하기에 괜찮은 사양을 한번 선택해 본겁니다. Intel Core i9 프로세서 + 엔비디아 GeForce RTX 그래픽 카드 조합으로 선택해 봤습니다. 여기에 메모리는 최소 16 GB 이상 32 GB 정도를 권장하는거 같네요.
저도 이번 스테이블 디퓨전 사용 계기로 “AI 이미지 제작”용 PC를 별도로 구입할지 고민하는 중입니다. 참 어쨌거나 AI 관련 솔루션을 사용하려면 GPU가 있는 그래픽 카드가 필수인거 같긴 하군요.
Intel PC 에서 그래픽 카드(GPU) 없이 Stable Diffusion 설치하는 방법
스테이블 디퓨전을 실제로 사용하기 위해선 스테이블 디퓨전의 소스 파일을 다운로드하여 설치하는 과정이 필요합니다. 따라서 이번에는 스테이블 디퓨전 소스 파일을 설치하고 실제로 AI 이미지를 생성하는 방법에 대해 알아보도록 하지요.
Stable Diffusion 을 Intel CPU 만으로 사용하는 방법은?
설치하기 전에 한가지 알아둬야 할 사실이 있습니다. 위에서도 언급을 했지만 스테이블 디퓨전은 “엔비디아” 그래픽 카드가 필요합니다. 따라서 엔비디아 그래픽 카드가 없는 PC 에서는 스테이블 디퓨전을 사용하는데 제약이 따릅니다.
그러면 엔비디아 그래픽 카드가 없다고 해서 아예 사용할 수 없느냐?는 아닙니다. 저도 현재 주로 쓰고 있는 PC에는 엔비디아 그래픽 카드가 탑재되어 있지 않습니다.
최근에 제 메인 PC 에 메모리와 SSD를 추가로 장착하면서 메모리는 32 GB, 하드디스크는 1 TB 로 늘어났지만 스테이블 디퓨전을 사용하기 위해 필수인 “엔비디아 그래픽 카드” 가 장착이 되어 있지 않습니다.
CPU는 Intel Core i3 인데요, 이 PC 에서는 스테이블 디퓨전을 과연 사용할 수 없을까요?
다행이도 찾아보니 방법이 있었습니다. 인텔 CPU 만으로 스테이블 디퓨전을 사용할 수는 있습니다.
스테이블 디퓨전 패치 버전에는 “OpenVINO” 라는 패치 버전이 있습니다. 이 버전을 설치하여 사용하면 다소 시간이 걸리더라도 스테이블 디퓨전으로 AI 이미지를 생성하는게 가능합니다.
Stable Diffusion OpenVINO 버전 설치
먼저 스테이블 디퓨전을 설치하기 위해 내 PC에 “파이썬”을 설치해야 합니다. 그런데 스테이블 디퓨전은 반드시 파이썬 “3.10.6” 버전을 설치해야 합니다.
파이썬 3.10.6 버전을 설치하려면 위의 링크에서 다운로드 받아서 설치하면 됩니다.
특히 설치할 때 “PATH(환경변수)” 에 추가를 꼭 해줘야만 합니다. 설치가 된 후에는 위와 같이 파이썬을 실행하여 사용하면 되겠습니다.
다음으로 스테이블 디퓨전 OpenVINO 버전을 설치합니다.
git clone 으로 설치 파일들을 내려받거나 ZIP 파일을 다운로드 받아서 압축을 해제해도 됩니다. 저는 git clone 으로 파일들을 내려받았습니다.
그런 다음에 “터미널” 창을 실행시켜서 git clone 으로 내려받은 폴더로 이동합니다.
여기서 “webui-user.bat” 파일을 실행시키면 됩니다. 실행을 하면 터미널 창에서 이것저것 파일들을 설치하게 됩니다. 시간이 꽤 걸리므로 여유를 가지고 기다려 봅니다.
설치 중간에 특정 파이썬 라이브러리가 필요하다고 하면 “pip” 명령어로 추가로 설치도 직접 해주셔야 합니다.
파일 설치가 마무리가 되면 스테이블 디퓨전의 메인 웹 UI 가 실행이 됩니다. 터미널 창 외에 웹 브라우저로 스테이블 디퓨전의 웹 UI 를 볼 수 있습니다.
짠! 여기까지 나타났다면 내 PC 에서 스테이블 디퓨전의 설치가 완료되었다고 볼 수 있겠습니다. 설치는 그리 어렵지 않네요.
Stable Diffusion OpenVINO 버전으로 AI 이미지 생성해보기
자 이제 설치가 끝났으니 AI 이미지를 생성해 볼까요? 먼저 스테이블 디퓨전의 웹 UI 를 봅니다.
웹 UI 에서 하단으로 내려보면 위와 같이 “Script” 가 있습니다. 여기서 “Accelerate with OepnVINO” 를 선택해 줍니다. 이걸 선택해야 CPU 로 가속 기능을 사용할 수 있습니다. (참고로 제 PC는 가속 기능을 사용하면 에러가 발생하여 이미지 생성이 중단됩니다. CPU는 Intel Core i3 입니다. CPU마다 차이가 있을거 같네요)
그런 다음, 맨 위의 탭에서 “txt2img” 를 선택한 다음에 이미지를 생성할 “프롬프트(Prompt)” 를 입력합니다. 프롬프트는 AI 이미지 생성에 필요한 일종의 “명령어” 인듯 합니다.
위의 프롬프트는 검색을 통해 구한 프롬프트입니다. 입력을 했으면 “Generate” 를 눌러서 이미지를 생성을 진행합니다.
터미널 창을 보면 AI 이미지 생성 진행 상태와 시간이 표시가 됩니다. 제 PC 에서는 대략 3분 40초 정도 소요가 되는군요. ( Intel Core i3, 메모리 32 GB )
웹 UI 에서 완성된 이미지의 모습입니다. 음 그런데 프롬프트에서 소개된 이미지와는 약간 다른(?) 거 같군요 ㅋ
이미지 파일들의 경로는 위와 같습니다. 날짜별로 폴더가 생성이 되어 있습니다.
위 이미지가 제 PC 에서 생성한 AI 이미지 입니다. 소개해 준 프롬프트 사이트에서와의 이미지와는 차이가 꽤나 있군요. 이 부분에 대해서는 좀 분석을 해봐야 할걸로 보입니다.
이상으로 스테이블 디퓨전을 사용한 AI 이미지 생성 과정에 대해 알아봤습니다. 엔비디아 그래픽 카드가 없이도 AI 이미지는 생성이 일단 가능하지만 아무래도 제약은 있어 보입니다. 관련하여 엔비디아 그래픽 카드가 달린 PC 를 새로 구매하는 것도 고려해봐야 겠군요.
스테이블 디퓨전 관련하여 최근에 제가 구입한 책이 있는데 아래 링크에서도 구입이 가능합니다.
AI 이미지를 활용하실 분들에게 도움이 될거 같습니다.