微软推出其首款自研AI模型:MAI-Voice-1 秒级生成音频

qingdou2025-08-29 09:40:43IT之家

8 月 29 日消息,周四,微软人工智能部门正式推出其首批两款自研 AI 模型 ——MAI-Voice-1 语音模型与 MAI-1-preview 通用模型。据微软介绍,全新的 MAI-Voice-1 语音模型仅需单块 GPU,就能在 1 秒内生成时长 1 分钟的音频;而 MAI-1-preview 模型则“让用户提前窥见 Copilot 未来功能的发展方向”。

目前,微软已将 MAI-Voice-1 应用于多项功能中:例如在“Copilot Daily”功能里,AI 主持人会通过该模型播报当日热点新闻;同时,它还能生成播客风格的对话内容,帮助用户理解各类话题。

普通用户可在 Copilot Labs 平台亲自体验 MAI-Voice-1:不仅能输入希望 AI 表达的内容,还可自定义语音音色与说话风格。除这款语音模型外,微软此次同步推出的 MAI-1-preview 模型,训练过程动用了约 1.5 万块英伟达 H100 GPU。该模型专为特定需求用户设计,具备遵循指令的能力,可“为日常咨询提供实用回应”。

微软 AI 负责人穆斯塔法・苏莱曼去年在《Decoder》播客某期节目中表示,公司内部研发的 AI 模型并未将企业级应用场景作为核心方向,他解释道:“我的思路是,我们必须打造一款对消费者而言体验极佳的产品,并针对自身应用场景进行深度优化。在广告业务、消费者行为数据等领域,我们拥有海量高预测性、高实用性的数据,因此我的工作重点是构建真正适配‘消费者伙伴’定位的模型。”

据悉,微软 AI 计划将 MAI-1-preview 模型应用于 Copilot 助手的特定文本使用场景(目前 Copilot 主要依赖 OpenAI 的大型语言模型)。同时,该模型已开始在 AI 基准测试平台 LMArena 上进行公开测试。

注意到,微软 AI 团队在博客文章中写道:“我们对未来发展有着宏大规划。接下来,我们不仅会持续推进技术突破,更相信通过整合一系列针对不同用户需求与应用场景的专业模型,将释放出巨大价值。”(远洋)

腾讯混元大模型升级:部分中文能力已追平GPT-4 支持16s视频生成

5月17日消息,今日,腾讯集团副总裁蒋杰对外宣布,腾讯混元大模型通过持续迭代,目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。针对备受关注的生视频能力,腾讯混元支持文生视频、图生视频、图文生视频、...

OpenAI董事会一致否决马斯克收购提议:要确保AGI造福全人类

2月15日消息,今日凌晨,OpenAI董事会一致否决了回应埃隆・马斯克提出的收购提议。在X平台上的声明中,OpenAI董事会主席布雷特・泰勒表示:“OpenAI并不出售,董事会已一致拒绝马斯克先生试图破坏竞争的最新提案。任...

“智境·星升”极星品牌之夜举办 极星4双星互联版携Polestar Phone上市

•首款极星设计的AI旗舰手机PolestarPhone发布,售价7388元•极星4双星互联版上市,限时包含PolestarPhone,售价33.99万-39.99万元起•国民演员周迅、陈坤携手成为极星汽车代言人•单座电动超级跑车概念车“极星Syne...

阿尔特曼退出,OpenAI 安全与安保委员会改为独立的董事会监督委员会

OpenAI于今年5月29日宣布董事会成立安全与安保委员会,负责就OpenAI项目和运营的关键安全与保障决策提出建议。OpenAI今日发布公告,称其安全与安保委员会将改组为一个独立的董事会监督委员会,由卡内基梅隆大学计算...

地瓜机器人宣布完成1亿美元A轮融资,超10家国内外资本共同参投

5月28日消息,地平线机器人旗下地瓜机器人宣布完成1亿美元A轮融资。本轮融资获得海内外众多投资机构青睐,由高瓴创投、五源资本、线性资本、和暄资本、九合创投、VertexGrowth、砺思资本、敦鸿资产、沸点资本、梅花...

TAG:微软 AI
上一篇:OpenAI推出gpt-realtime语音对话模型:支持情感感知、多语言无缝切换
下一篇:阿里巴巴:2026财年第一财季实现营收2476.52亿元,集团收入增长10%