飛象網訊 近日,科大訊飛董事長劉慶峰在公司成立 25 周年司慶活動上透露,訊飛星火 V4.0 發(fā)布時將展示最新的端到端智能語音落地成果,同時公司的端到端的語音技術建模方案也排在計劃中,預計三季度推向市場。
除此之外,科大訊飛還將提供GPT-4o沒有的一句話復刻、高噪音場景語音識別、多方言多語種免切換功能。
在劉慶峰看來,OpeanAI 發(fā)布 GPT-4o 對萬物互聯時代語音浪潮的推動,類似于當年 Siri 對語音應用的推動。它備受關注的原因有幾個點:超擬人合成,使得說話不再是朗讀腔調,而是真的像人一樣自由對話;全雙工交互,可以同時(瞬時)進行信號的雙向傳輸,人機對話可以隨時打斷和繼續(xù);通過語音到語音的端到端建模,實現快速反應的極致交互體驗。
劉慶峰透露,下一步,科大訊飛將發(fā)力遠場高噪音多人說話場景、高表現力個性化場景、云邊端一體化、軟硬件一體化,從技術優(yōu)勢、市場先機、落地成效構建全方位持續(xù)領先優(yōu)勢。據他介紹,在5月底上線的訊飛星火V3.5 Max版本,已在文本生成、知識問答、邏輯推理、數學能力上超越GPT-4 Turbo 0429的最新版本。