近日,阿里上线了独立的千问输入法macOS版,主打AI语音。官方宣称“说完即成稿”。语音输入最快每分钟300字,说完自动去掉语气词、润色成工整书面语,支持9种方言,还承诺全程无广告。安卓、iOS和Windows版本也已经在路上。至此,国内几大互联网巨头算是正式在AI输入法这个赛道上聚齐了。按理说,输入法是个成熟到不能再成熟的市场,搜狗、百度、讯飞这些老玩家早就把地盘分得差不多了。AI巨头们为什么不好好专心做大模型,又全都回过头来盯上输入法这块 “老蛋糕”?实测体验
符合基本期待
先说下使用体验。首先,千问输入法的响应速度很快,实际体验不错,几乎就是语音和文字同步出,感觉不到明显延迟。其次,它还支持方言,官方宣称支持9种。小编用河南方言实际测了一下,识别还挺准确的。另外一个比较有用的功能是,它会自动识别并优化你所说的语句。比如,它会去掉我们常说的各种语气词,啊、嗯这些,还会把你那些口语化的表达整理得更加通顺、更加书面化。你想记录一下今天想要做什么,随口说了一段话,它就会按照 1、2、3、4给你主动列出来,这样看起来就非常清晰。大模型抢的不是输入法而是AI超级入口AI巨头都盯上输入法,原因可能很简单:AI超级入口。输入法有个其他应用都比不了的优势,天然覆盖了社交、办公、购物、搜索等几乎所有的使用场景。不管你打开的是微信、浏览器还是Word,只要需要打字,输入法就在那里。以前用户想用AI改个文案、整理个纪要,得特意打开大模型APP,复制粘贴过去,改完再粘回来,挺麻烦。现在把AI塞进输入法,你在聊天框里就能直接让AI帮你润色话术、在文档里就能直接整理要点、扩写内容,不用来回切换,调用成本几乎为零。说白了,各家抢的不是输入法那点市场份额,是AI时代人机交互的第一入口。谁占了你的键盘,谁就能最先接住你的需求。更深一层的账在数据上。输入法能拿到的,是用户最真实、最原生的表达数据。你平时的说话习惯、用词偏好、不同场景下的真实需求,这些都是训练个性化大模型最核心的燃料。用户用得越多,模型越懂表达习惯,体验就越好,反过来又能吸引更多用户,形成正向的数据飞轮。值得一提的是,智谱此前也推出了AI输入法,主打“说话成文”,把语音转写、AI润色、扩写、翻译等能力放进PC端输入场景,并宣布永久免费。不过,语音输入并不是什么新鲜事儿,十多年前就有了。现在,AI巨头们又来“卷”这个。这背后,到底是用户真有需求,还是厂商自嗨?用户真有需求?还是厂商在造风口?从用户角度看,需求是真实存在的。打字本身是反直觉的,说话才是人类最自然的沟通方式。以前语音输入之所以小众,纯粹是因为不好用。说一句话错好几个字,碰到不标准的普通话、专有名词或中英文混说,结果更容易跑偏。嘴上省下来的力气,最后全得花在盯着屏幕逐字修改上。这种体验,确实劝退。但这两年大模型的爆发彻底改变了局面,语音识别准确率大幅提升。更重要的是,AI能理解上下文了。它能自动过滤掉“嗯、啊、那个”等口语化的语气词,还能自动纠错、智能加标点和分段。可以说,技术瓶颈的突破,让“用嘴打字”从概念变成了现实。现在这一波围绕语音输入的竞争,更像是回到了“输入”方式本身,用AI把输入法重新做一遍。需要注意的是,用户要的是 “轻量辅助”,不是 “把整个大模型塞进键盘”。如果AI输入法走了另一个极端,问答、翻译、搜索、写作、甚至表情包生成全都往里面堆,把这个打字工具弄得臃肿不堪,反而本末倒置。隐私和数据问题仍是用户最大担忧AI产品还有一个绕不开的话题,那就是数据和隐私。输入法天天都在“听”用户说话,可以说是“知情”的应用。你的聊天记录、银行卡密码、身份证号、工作机密,所有输入的内容都要经过它。传统输入法还只是收集个词库,现在AI要理解上下文、做个性化优化,必然要涉及输入内容的上传和处理,用户不可能不警惕。有人担心输入的内容会不会被存储下来,用来训练大模型?有人担心这些数据会不会被拿去做精准广告推荐?还有人担心密码、支付信息这类敏感内容会不会有泄露风险?毕竟有多款输入法曾因为违规收集个人信息被整改过,用户的不信任是有历史原因的。(AI普瑞斯)













