더지엠뉴스 송종환 기자 | 중국과 미국의 인공지능 주도권 경쟁이 이미지 생성 영역으로 확전됐다. 알리바바와 바이트댄스가 같은 날 차세대 이미지 생성 모델을 공개하며 구글의 나노 바나나 프로를 직접 겨냥했다.
12일 중국 정보기술 업계 발표에 따르면, 알리바바는 새로운 이미지 생성·편집 통합 모델 ‘Qwen-Image-2.0’을 선보였고, 바이트댄스는 ‘Seedream 5.0 Preview’를 자사 플랫폼을 통해 공개했다.
알리바바는 Qwen-Image-2.0이 최대 1K 토큰 길이의 텍스트 입력과 2K 고해상도 출력을 지원한다고 밝혔다. 복잡하고 긴 지시문을 정밀하게 해석해 전문 프레젠테이션 자료와 인포그래픽 제작까지 가능하도록 설계됐으며, 기존 생성 모델과 편집 모델을 하나로 통합한 경량 구조를 적용해 이미지 생성과 수정 성능을 동시에 끌어올렸다고 설명했다.
바이트댄스의 Seedream 5.0 Preview는 검색 기반 이미지 생성과 세밀한 제어 기능을 전면에 내세웠다. 프롬프트 이해 정확도를 높이고 질감 표현과 세부 조정 기능을 강화했으며, 2K와 4K 해상도 출력이 가능하다. 현재 일부 플랫폼에서는 2K 해상도를 무료로 체험할 수 있다.
업계에서는 이미지 생성 모델의 기술적 한계로 지적돼온 문자 표현 문제도 개선의 초점이 됐다고 전했다. 변분 자동인코더 기술 특성상 작은 글씨나 복잡한 텍스트가 포함된 이미지에서 왜곡이 발생하는 사례가 있었으나, 모델링 능력 향상과 구조 개선을 통해 재현 정확도를 높이는 방향으로 진화하고 있다는 설명이다.
이 같은 고도화는 이커머스와 디지털 콘텐츠 제작 시장에서 즉각적인 수요와 맞물려 있다. 전날 복수의 연산 자원 운영사 관계자들은 전자상거래 영역에서 디지털 휴먼과 이미지 생성 서비스가 토큰 사용량을 빠르게 늘리고 있다고 전했다.
알리바바 측은 전자상거래 상품 상세 페이지 이미지, 모델 착용 컷, 제품 설명 그래픽 제작 등 실제 판매 환경에 최적화하도록 모델을 개선했다고 밝혔다. 기존에는 생성 후 별도 편집 과정을 거쳐야 했던 작업을 단일 모델 안에서 처리할 수 있도록 설계해 판매자 효율을 높였다는 설명이다.
한편, 이미지 생성 기술은 웹툰·애니메이션 제작에도 빠르게 확산되고 있다. 시장 조사기관 아이미디어 리서치에 따르면 사용자 51.2%는 제작 비용 절감 효과를, 47.7%는 지식재산권 전환 속도 향상에 긍정적으로 응답했다. 다만 화풍 통일성이나 음성 표현 완성도 측면에서 개선 요구도 동시에 제기됐다.
증권사 보고서에서는 인공지능을 활용할 경우 디지털 만화·영상 제작 비용을 최대 90%까지 줄일 수 있다고 분석했다. 전통적인 다단계 제작 공정을 대폭 축소해 시나리오 작성, 이미지 생성, 영상 변환, 후반 편집 중심 구조로 재편하는 흐름도 나타나고 있다.
이미지 생성 인공지능은 단순 시각 창작을 넘어 기업 업무 자동화와 대규모 상업 활용 단계로 이동하고 있으며, 전자상거래와 콘텐츠 산업에서의 도입 속도는 더욱 빨라지고 있다.







