12 月 22 日消息,阿里巴巴達(dá)摩院今日發(fā)布了新一代語音識(shí)別模型 Paraformer,適用于語音輸入法、智能客服、車載導(dǎo)航、會(huì)議紀(jì)要等場(chǎng)景。
據(jù)介紹,這是業(yè)界首個(gè)應(yīng)用落地的非自回歸端到端語音識(shí)別模型,在推理效率上最高可較傳統(tǒng)模型提升 10 倍,且識(shí)別準(zhǔn)確率在多個(gè)權(quán)威數(shù)據(jù)集上名列第一。目前,該模型于魔搭社區(qū)面向全社會(huì)開源。
數(shù)據(jù)顯示,配合 GPU 推理,不同版本的 Paraformer 可將推理效率提升 5-10 倍。同時(shí),Paraformer 使用了 6 倍下采樣的低幀率建模方案,可將計(jì)算量大幅降低,支持大模型的高效推理。
IT之家了解到,阿里達(dá)摩院方面表示,Paraformer 是阿里巴巴研發(fā)的下一代“殺手锏”級(jí)別的語音識(shí)別基礎(chǔ)模型,未來將廣泛應(yīng)用于會(huì)議紀(jì)要產(chǎn)品“聽悟”、釘釘語音轉(zhuǎn)文字、高德導(dǎo)航等場(chǎng)景。