더지엠뉴스 구태경 기자 | 알리바바가 음성과 영상까지 동시에 처리하는 차세대 인공지능 모델을 공개하며 기술 경쟁의 중심을 다시 끌어올렸다. 텍스트 중심에서 벗어나 실시간 상호작용과 영상 이해까지 결합된 구조가 실제 서비스 환경으로 확장되기 시작했다. 31일 중국 기술 매체에 따르면, 알리바바는 지난 30일 새로운 전면 멀티모달 모델 큐원3.5-옴니(Qwen3.5-Omni)를 공개했다. 해당 모델은 음성, 영상, 텍스트를 동시에 이해하고 처리하는 통합 구조로 설계됐다. 콘텐츠를 단순 인식하는 단계를 넘어 의미를 분석하고 구조화된 형태로 출력하는 기능이 포함됐다. 200개가 넘는 평가 과제에서 최고 수준 성능을 기록하며 글로벌 주요 모델을 넘어서는 결과가 확인됐다. 영상 속 상황을 실시간으로 해석하고 설명을 생성하는 능력이 핵심으로 제시됐다. 언어 처리 범위도 크게 확대됐다. 총 113개 언어와 방언을 식별할 수 있으며 다양한 환경에서 사용자와 자연스럽게 상호작용이 가능하도록 설계됐다. 음성과 영상 흐름을 기반으로 코드 생성까지 이어지는 기능도 포함됐다. 이른바 ‘바이브 코딩’ 방식이 구현되며 개발 환경 활용 가능성이 함께 제시됐다. 알리바바 클라우드에서는 세
더지엠뉴스 김평화 기자 | 중국 인공지능 기업 미니맥스가 멀티모달 대형모델을 기반으로 글로벌 AI 플랫폼 시장에서 빠르게 존재감을 확대하고 있다. 설립 3년 만에 200개국 이상에서 수억 명 사용자를 확보하며 범용 인공지능 기술 경쟁의 핵심 기업으로 떠올랐다. 7일 KIC중국에 따르면 이 기업은 텍스트·음성·영상·음악까지 통합하는 범용 인공지능 기술을 기반으로 글로벌 AI 생태계 구축을 추진하고 있다. 미니맥스(稀宇科技, MiniMax)는 2022년 초 설립된 범용 인공지능 연구개발 기업으로 AGI 구현을 목표로 대형 멀티모달 모델을 지속적으로 개발해왔다. 이 회사는 MiniMax M2.1, Hailuo 2.3, Speech 2.6, Music 2.0 등 다양한 범용 AI 모델을 자체 구축했으며 텍스트·음성·이미지·영상·음악 데이터를 동시에 이해하고 생성하는 멀티모달 능력을 갖춘 것이 특징이다. 이를 기반으로 MiniMax Agent, 하이뤄 AI, MiniMax Audio, 싱예 등 여러 AI 네이티브 제품을 출시했고 기업과 개발자를 위한 개방형 플랫폼도 운영하고 있다. 미니맥스는 이러한 기술을 통해 생산성 향상과 AI 서비스 확대를 동시에 추진한다는 방향
더지엠뉴스 김완석 기자 | 중국의 인공지능 산업이 연간 20% 이상 성장세를 이어가며 135조원 규모에 도달했다. 생성형 AI 서비스만 수백 개를 돌파한 가운데, 인터넷 이용자 수도 11억 명을 넘기며 디지털 인프라 확장도 가속화되고 있다. 22일 중국인터넷네트워크정보센터(CNNIC) 보고서에 따르면, 2024년 기준 중국의 AI 산업 규모는 7천억위안(약 135조원)으로 집계됐다. 보고서는 국산 AI 기술이 1천억개급 파라미터와 멀티모달 기능을 갖추며 사무, 교육, 콘텐츠, 산업 설계 등 다양한 영역에서 응용되고 있다고 평가했다. 올해 3월 기준 중국 사이버당국에 등록된 생성형 AI 서비스는 총 346개로 나타났다. CNNIC는 이들 서비스가 중국의 스마트 생태계 전반을 뒷받침하고 있다고 분석했다. 또한 보고서는 중국의 인터넷 사용자 수가 11억2천300만명에 달하며, 인터넷 보급률은 79.7%로 집계됐다고 밝혔다. 이 중 만 60세 이상 이용자는 1억6천100만명, 농촌 거주 이용자는 3억2천200만명으로, 각각 52.0%, 69.2%의 보급률을 기록했다. 6월 말 기준으로 중국의 5세대 이동통신(5G) 기지국 수는 455만개에 이르며, 전체 행정촌의 9
[더지엠뉴스] 중국 최대 포털 사이트인 바이두가 올해 하반기 차세대 인공지능(AI) 모델인 '어니 5.0'을 출시할 계획이다. 미 CNBC 방송은 12일(현지시간) 정통한 소식통을 인용해 이 소식을 전하며, 어니 5.0이 멀티모달(multimodal) 기능을 대폭 강화할 것이라고 보도했다. 멀티모달 AI는 텍스트, 이미지, 비디오, 오디오 등 다양한 데이터 유형을 이해하고 생성할 수 있는 시스템을 의미한다. 이번 발표는 중국 스타트업 딥시크(DeepSeek)가 저비용·고성능의 AI 모델을 선보이며 글로벌 AI 업계에 충격을 준 직후 나온 것으로, 바이두의 기술 경쟁 의지를 드러낸다. 리옌훙(로빈 리) 바이두 최고경영자(CEO)는 두바이 세계정부정상회의에서 “기초 모델 추론 비용을 12개월 내 90% 이상 절감할 수 있다”며 “비용 절감은 생산성 향상으로 이어진다”고 말했다. 어니 5.0은 이러한 기초 모델로 분류되며, 언어 이해, 텍스트 및 이미지 생성, 자연어 처리 등 다양한 작업 수행이 가능할 것으로 기대된다. 바이두는 이미 2023년 3월, 중국 기술기업 중 최초로 챗GPT와 유사한 챗봇 '어니봇'을 출시했다. 이후 알리바바, 바이트댄스(틱톡 모회사)