더지엠뉴스 박소영 기자 | 구글이 생성형 인공지능을 음악 영역으로 확장하며 창작 도구의 범위를 넓혔다. 한 줄 문장이나 사진 한 장으로 곡을 만드는 기능이 상용화 단계에 진입하면서 디지털 음악 제작 방식이 빠르게 변화하고 있다. 19일 구글 공식 블로그에 따르면, 제미나이(Gemini, 双子座) 애플리케이션에는 최신 음악 생성 모델 리리아3(Lyria3)가 탑재됐으며 사용자는 텍스트 설명이나 이미지를 입력해 30초 분량의 음악을 제작할 수 있다. 구글(Google, 谷歌)은 아이디어를 문장으로 적거나 사진을 올리면 몇 초 안에 완성된 곡을 생성할 수 있도록 설계했다고 설명했다. 시스템은 입력된 내용에서 분위기와 장르적 요소를 추출해 멜로디와 리듬, 편곡 구조를 자동으로 구성한다. 사진이나 영상 업로드 기능도 지원된다. 사용자가 특정 장면이나 감성을 제시하면 그에 어울리는 음악을 생성하며, 결과물에는 맞춤형 커버 이미지가 함께 제공된다. 유튜브(YouTube, 优兔) 내 ‘드림 트랙’ 기능에도 리리아3가 적용된다. 쇼츠 제작자는 별도의 편집 과정 없이 배경음악을 제작해 즉시 활용할 수 있으며, 해당 기능은 미국에서 먼저 출시된 뒤 순차적으로 확대되고 있다. 구
더지엠뉴스 송종환 기자 | 중국과 미국의 인공지능 주도권 경쟁이 이미지 생성 영역으로 확전됐다. 알리바바와 바이트댄스가 같은 날 차세대 이미지 생성 모델을 공개하며 구글의 나노 바나나 프로를 직접 겨냥했다. 12일 중국 정보기술 업계 발표에 따르면, 알리바바는 새로운 이미지 생성·편집 통합 모델 ‘Qwen-Image-2.0’을 선보였고, 바이트댄스는 ‘Seedream 5.0 Preview’를 자사 플랫폼을 통해 공개했다. 알리바바는 Qwen-Image-2.0이 최대 1K 토큰 길이의 텍스트 입력과 2K 고해상도 출력을 지원한다고 밝혔다. 복잡하고 긴 지시문을 정밀하게 해석해 전문 프레젠테이션 자료와 인포그래픽 제작까지 가능하도록 설계됐으며, 기존 생성 모델과 편집 모델을 하나로 통합한 경량 구조를 적용해 이미지 생성과 수정 성능을 동시에 끌어올렸다고 설명했다. 바이트댄스의 Seedream 5.0 Preview는 검색 기반 이미지 생성과 세밀한 제어 기능을 전면에 내세웠다. 프롬프트 이해 정확도를 높이고 질감 표현과 세부 조정 기능을 강화했으며, 2K와 4K 해상도 출력이 가능하다. 현재 일부 플랫폼에서는 2K 해상도를 무료로 체험할 수 있다. 업계에서는 이미
더지엠뉴스 김평화 기자 | AI 제작 도구 확산과 플랫폼 지원이 맞물리며 만극 산업이 단순 양적 팽창을 넘어 구조적 전환 국면에 들어섰다는 신호가 뚜렷해지고 있다. 만극은 만화의 정적인 컷을 애니메이션, 성우 음성, 효과음 등을 결합해 짧은 영상 콘텐츠로 재구성한 형식이다. 18일 증권가와 콘텐츠 산업 자료를 종합하면 2025년 만극 연간 유통액은 실사형 숏드라마 시장의 약 3분의 1 수준까지 확대될 것으로 추산되며, 전체 시장 규모는 200억 위안을 넘어설 가능성이 거론되고 있다. 시장 확장과 함께 인력 구조도 빠르게 바뀌고 있다. 항저우의 한 만극 제작사에는 최근 반년 사이 비전공자 출신 애니메이터가 대거 유입됐다. 과거에는 드로잉 능력과 전문 소프트웨어 숙련이 필수였지만, 현재는 문장 입력만으로 이미지와 영상의 기초 골격을 구현할 수 있는 AI 도구가 제작 공정 전반에 적용되고 있다. 이로 인해 언어·문과 계열 인력도 비교적 짧은 교육 과정을 거쳐 현장에 투입되는 흐름이 형성됐다. 제작 현장에서는 생산성 변화가 수치로 확인되고 있다. 항저우의 한 애니메이션 제작사는 여름철 월 1편 수준이던 제작량이 가을 들어 수십 편으로 늘어났으며, 연말에는 월 50~