8 月 13 日,阿里通义宣布,Qwen2 系列开源家族新增音频语言模型 Qwen2-Audio。
据介绍,Qwen2-Audio 可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。
阿里通义表示,Qwen2-Audio 是通义团队在音频理解模型上的新一步探索,相比前一代模型 Qwen-Audio,新版模型有了更强的声音理解能力和更好的指令跟随能力。
此外,通义团队还同步开源了基础模型 Qwen2-Audio-7B 及其指令跟随版本Qwen2-Audio-7B-Instruct 。