최근 몇 년 동안 AI(인공지능) 분야는 빠른 속도로 발전하고 있으며, 그 중심에는 이미지 및 텍스트 생성 기술이 있습니다. 이미지 생성 영역에서는 Midjourney, leonardo.ai, Adobe Firefly와 같은 다양한 플랫폼들이 등장하며 경쟁이 치열해지고 있는데, 이러한 배경 속에서 OpenAI는 이미지 생성 AI 분야의 리더로서의 위치를 더욱 강화하기 위해 DALL·E의 업그레이드 버전인 'DALL·E 3'을 공개했습니다. 기존의 DALL·E 시스템의 성능을 크게 향상하는 동시에, ChatGPT와의 통합을 통해 사용자는 다양한 경험을 할 수 있습니다. 나아가서 사용자는 더욱 간편하게 고품질의 이미지를 생성할 수 있게 만들며, 이미지 생성 기술의 접근성과 활용도를 높이는 중요한 발판이 될 것입니다.

DALL·E 3

DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.

openai.com

DALL·E 3는 10월 초에 ChatGPT Plus 및 Enterprise 사용자는 이용 가능할 것으로 보입니다. DALL·E 2와 마찬가지로, DALL·E 3로 생성한 이미지는 상업적으로 이용이 가능합니다.


DALL·E 3의 주요 특징

DALL·E 3의 문맥 파악과 ChatGPT 연동

DALL·E 3는 사용자가 입력한 텍스트에 맞는 이미지로 생성하는 능력이 크게 발전했습니다. 특히, ChatGPT와의 연결을 통해서 프롬프트 작성의 수고를 혁신적으로 줄여줍니다. 사용자는 DALL·E 3을 최대한의 효율로 사용하기 위한 프롬프트를 직접 작성할 필요 없이, ChatGPT가 이를 자동으로 유틸라이즈 하여 DALL·E 3에게 제공합니다. 이를 통해 사용자는 더욱 정확하고 다양한 이미지 결과물을 얻을 수 있습니다.

고품질 이미지 생성

DALL·E 3는 사용자가 제공하는 프롬프트에 대해 더욱 정확하고 섬세한 이미지를 생성하는 능력을 보여줍니다. 예를 들어, 동일한 프롬프트인 “An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”를 기반으로 왼쪽에는 DALL·E 2가 생성한 그림이 있고, 오른쪽에는 DALL·E 3가 생성한 그림이 있습니다. 이를 통해 DALL·E 3의 성능 향상을 명확하게 확인할 수 있습니다. 또한, 텍스트나 사람의 손과 같이 기존 이미지 생성 모델에서 문제가 되었던 콘텐츠도 DALL·E 3는 훨씬 더 정확하게 처리하며, 사용자의 요구를 더욱 충실히 반영한 이미지를 제공합니다.

DALL·E 2 (왼쪽) /DALL·E 3 (오른쪽)

안전성 및 창작자의 권리 강화

DALL·E 3는 사용자의 요구와 사회적 책임을 동시에 충족시키기 위해 다양한 안전성 및 창작자의 권리 보호 메커니즘을 도입하였습니다. 이 모델에는 알고리즘 편향을 줄이고 혐오 콘텐츠의 생성을 방지하기 위한 새로운 메커니즘이 탑재되어 있습니다. 특히, DALL·E 3는 현재 활동 중인 아티스트의 스타일로 이미지를 요청하거나 유명 인물을 묘사하는 요청을 거부하는 기능을 포함하고 있습니다.

또한, OpenAI는 과거 일부 경쟁업체와의 저작권 문제로 소송을 당한 경험이 있습니다. 이러한 배경을 고려하여, DALL·E 3는 창작자의 권리를 더욱 존중하고 보호하기 위한 새로운 정책을 도입하였습니다. 현재 활동 중인 아티스트의 스타일로 이미지 생성을 요청하면 거부하도록 설계되었고 자신이 생성한 이미지가 이후 OpenAI 모델 학습에 사용되지 않도록 제외시킬 수 있습니다. 이러한 조치는 AI 기술의 발전과 창작자의 권리 사이의 균형을 찾아가는 OpenAI의 노력을 반영하고 있습니다.

반응형

DALL·E 3 in ChatGPT

아이디어를 제시하면, ChatGPT는 자동으로 DALL·E 3을 위한 맞춤형, 상세한 프롬프트를 생성하여 아이디어를 생동감 있게 만들어줍니다. 특정 이미지가 마음에 들지만 완벽하지 않다면, 몇 마디만으로 ChatGPT에게 수정을 요청할 수 있습니다.


OpenAI의 DALL·E 3 발표와 ChatGPT와의 통합은 이미지 생성 AI 기술의 미래에 큰 영향을 미칠 것으로 예상됩니다. 단순히 기술적 발전을 넘어서 창작자의 권리와 사용자의 안전성에 대한 중요성을 강조하며, AI 산업의 표준을 재정립하는 계기가 될 것입니다. DALL·E 3의 성능 향상과 안전성 강화는 AI 기술의 접근성과 활용도를 높이는 동시에, 사회적 책임과 윤리적 고려를 통한 기술 발전의 중요성을 강조하고 있습니다. 이러한 노력은 AI와 인간 사이의 상호 작용을 더욱 풍부하고 의미 있게 만들며, 다양한 분야에서의 활용 가능성을 열어놓을 것입니다.

앞으로 OpenAI는 ChatGPT, DALL·E 3와 같은 혁신적인 기술을 계속해서 발전시켜 나갈 것이며, 이를 통해 AI 기술이 우리 일상생활의 다양한 부분에서 더욱 중요한 역할을 하게 될 것입니다.


DALL·E2 사용기 (사용법)

DALL·E와 DALL·E 2는 입력된 텍스트로부터 이미지를 생성해 주는 기계 학습 모델이며 OpenAI에서 개발하였습니다. 이미지 생성을 위해서 ChatCPT와 같이 GPT모델을 사용하였으며 현재 소스 코드를 공개

yunwoong.tistory.com

반응형