苹果公司近期在其2025年WWDC全球开发者大会上推出的Speech API,在科技媒体macstories的实际测试中展现出了惊人的性能。这一技术被用于转录一段长达34分钟、文件大小达到7GB的4K视频,仅用时45秒便完成了整个转录过程,速度之快超乎想象。
在WWDC大会上,苹果公司宣布了Speech API的两个核心模块:SpeechAnalyzer和SpeechTranscriber。macstories团队利用这两个模块开发的Yap应用工具,对Speech API的转录性能进行了深入测试。测试结果显示,Yap在处理大型视频文件时,其速度远超当前市场上的其他主流转录工具。
在与市场上其他竞争对手的对比测试中,Yap的优势尤为明显。在同样的测试条件下,Yap完成转录所需的时间仅为45秒,而OpenAI的Whisper(MacWhisper V3Turbo版本)则需要101秒,速度慢了近56%。其他工具如VidCap和MacWhisper V2的转录时间分别为1分55秒和3分55秒,进一步凸显了Yap在转录速度上的领先地位。
尽管在专有名词识别方面,所有工具都存在一定的误差,例如将“AppStories”识别错误,但Yap凭借其强大的本地化运算能力,在处理速度上展现出了无可匹敌的优势。这意味着,对于需要频繁处理视频文件的用户来说,使用Yap将能够显著提升工作效率,节省大量时间。
苹果的这一创新不仅提升了转录技术的效率,更为创作者、教育工作者和内容制作者带来了极大的便利。随着Speech API技术的不断普及和应用,我们有理由相信,未来将有更多的企业在视频处理和内容生成方面受益于这一技术。苹果的这一新技术无疑为语音转录领域带来了一次革命性的突破。