알리바바, 바이두와 쿠아이쇼는 로봇공학부터 영화용 비디오 콘텐츠 생성까지 다양한 새로운 AI 모델을 출시했습니다
중국 IT 거대 기업들이 새로운 AI 알고리즘을 선보입니다
컨텍스트
지난 주 미국 인공지능 시장은 Anthropic과 Altruist 모델의 가능성에 대한 논의로 바빴습니다. 이 모델들은 프로그래밍 및 금융 서비스에 영향을 미칩니다. 동시에 중국 기술 대기업인 알리바바, 바이두(틱톡 소유자)와 쿠아이쇼우는 자체 AI 모델을 발표하며 로봇 공학과 비디오 생성에서 성능 향상을 보여 주었습니다. 이 개발은 중국이 서구 경쟁자를 따라잡고 있음을 확인시켜 줍니다.
배경
새로운 알고리즘에 대한 발표는 최근 구글 딥마인드 창립자 데미스 하사비스가 중국 AI 모델이 서구보다 몇 달 뒤처진다고 언급한 직후 나왔습니다. 그럼에도 올해 소개된 도구들은 OpenAI(Sora), Nvidia, Google의 비디오 생성 및 로봇 공학 제품과 직접 경쟁할 수 있습니다.
1. RynnBrain – 알리바바의 ‘스마트’ 로보틱 보조자
* 무엇인가?
연구 부서인 알리바바 DAMO가 RynnBrain 모델을 발표했으며, 이는 로봇이 주변 세계를 더 잘 인식하고 물체와 상호작용하도록 설계되었습니다.
* 시연
영상에서는 손 대신 발톱이 달린 로봇이 오렌지를 수확해 바구니에 넣고, 냉장고에서 우유를 꺼내는 장면을 보여줍니다.
* 기술적 특징
- 일상 물체 인식을 위해 광범위한 학습이 필요합니다.
- RynnBrain은 시간과 공간 인식 기능을 내장하고 있어 로봇이 사건이 발생하는 위치와 시점을 기억하고, 작업 진행 상황을 추적하며 여러 단계에서 작업을 이어갈 수 있습니다.
- 이는 실제 환경에서 신뢰성과 일관성을 높입니다.
* 포지셔닝
알리바바는 로보틱스 분야에서 Nvidia 및 Google과 경쟁하기 위해 ‘기본 지능 수준’을 구축하려고 합니다.
2. Seedance 2.0 – 바이두의 비디오 생성
* 기능
이 모델은 간단한 텍스트 설명으로 사실적인 동영상을 만들 수 있습니다. 알고리즘은 기존 영상과 이미지를 처리해 새로운 구성을 만들어냅니다.
* 장점
- 이전 버전보다 향상된 제어성, 속도 및 효율성을 제공합니다.
- Hugging Face 연구원 아디나 야케프의 긍정적 평가: 모델이 ‘균형 잡힌’ 성능을 보여 주었으며 첫 실행에서도 고품질 결과를 냅니다.
* 기술 세부 사항
Seedance 2.0은 시각화, 음향 보조 및 촬영 작업을 하나의 흐름으로 결합해 실험적 프로토타입이 아닌 완성된 제품을 만듭니다.
* 문제와 한계
- 개인정보 보호 이슈로 바이두는 업로드된 사진 기반 사람 음성 생성 기능을 일시적으로 비활성화했습니다.
- 이는 블로거가 무단 음성 합성에 대한 우려를 표명한 뒤 결정되었습니다.
3. Kling 3.0 – 쿠아이쇼우의 경쟁 모델
* 개요
Kling 3.0은 비디오 생성을 목표로 하며 Seedance 2.0과 직접적인 경쟁자로 포지셔닝됩니다.
* 주요 개선점
- 일관성이 향상되었습니다(텍스트에 구체적 내용은 없지만 품질이 크게 상승한 것으로 추정).
결론
- 중국 기업들은 로봇 공학 및 비디오 생성용 AI 알고리즘을 적극 개발하며 경쟁력 있는 솔루션을 선보입니다.
- 알리바바는 시간과 공간 인식을 갖춘 ‘스마트’ 로봇에 집중합니다.
- 바이두는 고급 동영상 제작 모델을 제공하지만 음성 합성 윤리 문제에 직면해 있습니다.
- 쿠아이쇼우는 비디오 생성 포트폴리오를 확장하며 바이두와 경쟁하고 있습니다.
이러한 개발은 중국이 서구 혁신을 따르는 것뿐만 아니라 AI 제품 시장을 적극적으로 형성하고 있음을 입증합니다
댓글 (0)
의견을 남겨 주세요. 예의를 지키고 주제에서 벗어나지 말아 주세요.
댓글을 남기려면 로그인