微软人工智能部门在近日宣布了两项重要进展,推出了两款自主研发的AI模型:MAI-Voice-1语音模型和MAI-1-preview通用模型。据悉,这两款模型标志着微软在AI技术领域的又一里程碑。
其中,MAI-Voice-1语音模型展现了强大的生成能力。微软表示,该模型仅需单块GPU支持,就能在极短时间内生成长达一分钟的音频内容。这一特性使得MAI-Voice-1在多项功能中得以应用,例如在“Copilot Daily”功能中,AI主持人能实时播报热点新闻,还能生成播客风格的对话,帮助用户深入理解不同话题。
普通用户也有机会亲身体验MAI-Voice-1的魅力。微软在Copilot Labs平台上开放了该功能,用户不仅可以输入希望AI表达的内容,还能自由选择语音音色和说话风格,实现个性化的AI交互体验。
与此同时,微软还推出了另一款重量级模型——MAI-1-preview。这款模型的训练过程极为复杂,动用了约1.5万块英伟达H100 GPU。MAI-1-preview专为有特定需求的用户设计,具备出色的指令遵循能力,能够为日常咨询提供实用且精准的回应。微软AI负责人穆斯塔法·苏莱曼曾表示,公司内部的AI研发并非以企业级应用场景为核心,而是更注重打造对消费者体验极佳的产品。
值得注意的是,微软计划将MAI-1-preview模型应用于Copilot助手的特定文本使用场景。目前,Copilot主要依赖OpenAI的大型语言模型,而MAI-1-preview的加入将进一步提升其功能和性能。该模型还已在AI基准测试平台LMArena上开始公开测试,接受行业内的检验和挑战。
微软AI团队在官方博客中透露,他们对未来的发展有着宏伟的规划。团队相信,通过整合一系列针对不同用户需求和应用场景的专业模型,将能够释放出巨大的价值,为用户带来更加智能、便捷的体验。