마이크로소프트는 텍스트, 음성 및 그래픽 생성을 위한 세 가지 새로운 내부 인공지능 모델을 출시했습니다

마이크로소프트는 텍스트, 음성 및 그래픽 생성을 위한 세 가지 새로운 내부 인공지능 모델을 출시했습니다

5 hardware

마이크로소프트 AI가 세 가지 새로운 멀티모달 모델을 출시합니다

인공지능(AI) 분야에서 입지를 강화하기 위한 노력의 일환으로, 마이크로소프트 AI 연구 부서는 텍스트, 음성 및 이미지를 생성할 수 있는 자체 모델 세 개를 발표했습니다. 이 결정은 선도적인 AI 연구소와의 경쟁에 대한 대응이었습니다.

모델용도주요 성능
MAI‑Transcribe‑1음성을 텍스트로 변환25개 언어, Azure Fast보다 2.5배 빠름
MAI‑Voice‑1오디오 트랙 생성1초에 한 번씩 음성 설정 가능
MAI‑Image‑2텍스트 기반 이미지 생성

프로젝트는 고급 AI 시스템 연구를 담당하는 부서인 MAI Superintelligence 팀이 개발했으며, 2025년 11월에 이사인 무스타파 수레이만(Mustafa Suleyman)이 팀에 합류했습니다.

경제적 효율성
개발자들은 구글 및 OpenAI의 유사 모델과 비교해 계산 비용을 크게 낮추는 데 중점을 두었습니다:

서비스가격
텍스트 해독$0.36/시간
음성 합성100만 문자당 $22
이미지 처리입력 토큰 100만 개당 $5; 출력 토큰 100만 개 생성 시 $33

모델은 이미 마이크로소프트 Foundry 플랫폼에 배포되었으며, MAI Playground에서 전사 및 음성 합성이 가능합니다.

OpenAI와의 파트너십
자체 솔루션 개발이 활발히 진행되는 가운데 무스타파 수레이만은 OpenAI와의 협력 의지를 확인했습니다. 마이크로소프트는 이미 130억 달러 이상을 투자했으며, 장기 계약에 따라 제품에 OpenAI 모델을 계속 활용하고, 반도체와 유사한 다각화 전략을 적용할 예정입니다.

이처럼 마이크로소프트 AI는 빠르고 경제적인 멀티모달 솔루션을 제공하면서 핵심 파트너와의 긴밀한 관계를 유지하며 AI 시장에서 입지를 강화하고 있습니다

댓글 (0)

의견을 남겨 주세요. 예의를 지키고 주제에서 벗어나지 말아 주세요.

아직 댓글이 없습니다. 댓글을 남기고 의견을 공유해 주세요!

댓글을 남기려면 로그인해 주세요.

댓글을 남기려면 로그인