구글이 '제미나이 2.5 플래시' 모델 기반의 새로운 이미지 편집 기능을 공개했습니다. 이 기능은 사용자의 자연어 요청으로 사진 속 인물이나 사물의 특징을 유지하며 정밀한 편집을 지원하며, 멀티 턴 편집 방식을 통해 반복적인 수정이 가능합니다. 일반 소비자 및 개발자 모두 활용할 수 있으며, AI 이미지 생성 시장 경쟁 속에서 구글의 경쟁력 강화에 기여할 것으로 전망됩니다.
구글, '제미나이 2.5 플래시' 기반 혁신적 이미지 편집 기능 공개
AI 기술을 활용한 이미지 편집 분야에 새로운 기준 제시
AI 기반 편집 기능, '나노바나나' 입소문 타고 기대감 증폭 🚀
구글이 지난 26일(현지시간), '제미나이 2.5 플래시(Gemini 2.5 Flash)' 모델을 기반으로 한 새로운 이미지 편집 기능을 공식 발표했습니다. 이 모델은 최근 '나노바나나(nanobanana)'라는 이름으로 소셜 미디어와 IT 커뮤니티에서 입소문을 타며 사용자들 사이에서 큰 기대를 모아왔습니다.
이번에 공개된 '제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)' 기능은 우선 제미나이 앱 사용자 및 개발자를 대상으로 단계적으로 적용될 예정입니다. 개발자들은 제미나이 API, 구글 AI 스튜디오, 그리고 구글 클라우드의 버텍스 AI 플랫폼을 통해 이 강력한 이미지 편집 기능을 자신의 서비스에 통합하고 활용할 수 있습니다.
자연어 요청으로 구현되는 정밀하고 일관성 있는 편집
이 새로운 이미지 편집 기능의 가장 큰 특징은 사용자의 자연어 요청만으로 매우 정밀한 편집을 지원한다는 점입니다. 기존 앱에 내장되었던 이미지 편집 기능에서 한 단계 더 나아가, 사진 속 인물이나 동물의 고유한 특징을 그대로 유지하면서도 더욱 일관성 있는 편집 결과를 제공하는 데 초점을 맞추었습니다.
구체적인 예시로, 사용자가 반려동물의 사진을 업로드한 후 "배경을 바꿔줘" 또는 "강아지에게 모자를 씌워줘"와 같이 간단한 지시를 내리면, 모델은 피사체의 모습과 특징은 변형 없이 그대로 보존한 채 사용자가 원하는 효과를 정확하게 적용할 수 있습니다.
또한, 멀티 턴(Multi-turn) 방식을 적용하여 동일한 이미지에 대해 사용자가 연속적으로 수정 및 편집 요청을 할 수 있도록 함으로써, 더욱 직관적이고 효율적인 작업 흐름을 가능하게 했습니다. 이는 사용자가 하나의 컨셉을 다양한 방식으로 발전시켜 나가는 데 큰 도움을 줄 것으로 기대됩니다.
일반 사용자부터 전문가까지, 폭넓은 활용 가능성 제시 🎨
구글은 이번 이미지 편집 기능이 특히 일반 소비자층을 중심으로 설계되었다고 밝혔습니다. 인테리어나 정원 프로젝트를 구상할 때, 혹은 다양한 색상 조합을 시뮬레이션해보고 싶을 때 이 기능을 활용하여 결과물을 미리 예측해 볼 수 있습니다. 예를 들어, 제공된 색상 샘플을 이용해 거실 공간을 '누보 앤티크 아트 데코' 스타일로 리모델링하는 과정을 시각화하는 것이 가능합니다.
뿐만 아니라, 참조 이미지 여러 장을 결합하여 통합된 렌더링을 생성하는 기능도 제공합니다. 이는 복잡한 디자인 프로젝트나 아이디어 구체화 과정에서 여러 요소를 하나의 결과물로 융합해야 할 때 유용하게 활용될 수 있습니다.
더 나아가, 구글은 창의적인 스토리텔링을 위한 이미지 생성 기능까지 확장했습니다. 사용자는 구체적인 시나리오와 등장인물, 그리고 이야기의 전개 방식까지 상세하게 묘사하는 프롬프트를 입력하여, 최대 12부작의 이야기와 이에 해당하는 12개의 이미지를 생성할 수 있습니다. 이러한 기능은 잃어버린 보물을 찾는 탐정 이야기와 같이, 플롯의 감정적 고저, 긴장감, 반전 및 감동적인 결말까지 고려한 복합적인 콘텐츠 제작에 활용될 수 있습니다. 특히, 이미지에 텍스트를 포함하지 않고 순수하게 시각적 요소만으로 스토리를 전달하도록 하여 완성도를 높였습니다.
안전장치 강화 및 AI 이미지 생성 시장 내 경쟁 가속화 🛡️
이미지 생성 AI 모델의 오용 가능성에 대한 우려가 높아지는 가운데, 구글은 이번 업데이트를 통해 이미지 생성의 남용을 방지하기 위한 안전장치를 대폭 강화했다고 밝혔습니다. 과거 역사적으로 부정확한 인물 이미지를 생성하여 논란을 빚었던 사례를 교훈 삼아, 이번에는 정확성과 윤리적 균형점을 찾기 위한 노력을 기울였습니다.
구체적으로, 음란물이나 유해 콘텐츠 생성을 엄격히 금지하는 것은 물론, 생성된 모든 AI 이미지에는 시각적 워터마크와 메타데이터 식별자를 삽입하여 출처를 명확히 하고 추적성을 확보했습니다. 이는 AI 생성 콘텐츠에 대한 투명성과 신뢰도를 높이는 데 기여할 것으로 보입니다.
AI 이미지 생성 기술은 현재 챗봇 서비스의 인기를 견인하는 핵심 요소 중 하나로 자리 잡고 있습니다. 지브리 스타일의 이미지 생성으로 유명한 오픈AI의 네이티브 이미지 생성 기능에 이어, 최근 일론 머스크 CEO는 자신의 AI 챗봇 '그록(Grok)'의 이미지 생성 기능인 '그록 이매진(Grok Imagine)'을 적극적으로 홍보하고 있습니다. 또한, 메타(Meta) 역시 지난주 미드저니(Midjourney)와의 라이선스 계약을 발표하며 AI 이미지 생성 분야에서의 경쟁 대열에 합류했습니다.
구글의 새로운 제미나이 2.5 플래시 기반 이미지 편집 기능이 '비오 3(Vídeo 3)'와 같은 혁신적인 기술과 함께 제미나이 앱의 전반적인 인기를 얼마나 견인할 수 있을지 귀추가 주목됩니다. AI 이미지 생성 기술의 발전은 콘텐츠 제작 방식을 근본적으로 변화시킬 잠재력을 지니고 있으나, 동시에 저작권, 초상권, 그리고 허위 정보 확산과 같은 윤리적, 법적 문제에 대한 심도 깊은 논의와 사회적 합의가 지속적으로 요구될 것입니다.
이번 구글의 발표는 AI 기반 이미지 편집 및 생성 시장에 새로운 지평을 열 것으로 기대되며, 경쟁사들 역시 유사한 기술 개발에 더욱 박차를 가할 것으로 전망됩니다.