基于SF32LB52的语音关键词机器学习

Kws_for_sf32lb525: 基于MCU的语音关键词识别,可以运行在思澈处理器(SF32LB52 ),模型见dnn_weights.h或ds_cnn_weights.h,用户也可以自行训练生成单片机可以识别的模型文件 编译需要sdk提供的arm神经网络库nn和dsp库 训练方法及步骤 https://github.com/ARM-software/ML-KWS-for-MCU,本例子只提供了特定的CPU来进行推理。

6 个赞

可以运行,有时候会误触发,可能是关键词太短了,比如on/go都只有一个音节,假如训练成更长的关键词应该效果更好。
我们尝试过对8bit的cmsis_nn进行加速,在55x,56x芯片上有硬件加速功能。

对,需要一些中文语音样本重新训练一些的命令,如“小智,小智”,“调高音量”等。还有语音推理前应该还有些前处理,如去噪,去回声,增益调整等。现在搜集中文语音样本还比较困难。