通过这个控件可以获得声音句子的纹理,并将特征库中吻合的程度按高低的顺序排列。让软件设计者根据识别的结果控制各种设备或操纵软件执行相应的功能。本控件需要用户自己建立特征库,优点是可以让用户建立属于自己方言或特征的声纹库。
软件介绍:
户可以将不同的特征文件与数据库一一对应保存,然后通过对比函数从数据库取出不同的特征文件与当前的录音结果对比,从而知道当前的声纹与数据库内的哪一个声纹最吻合。我们还为掌上电脑,或学习机提供DLL评分插件。通过它,可以获得学生跟读老师句子的吻合程度。该控件还附带一个精美的可变色按钮控件,利用它可以美化程序的界面。
使用说明;
在软件的“工程”菜单下的“部件”选中“HLYYPF_9”【要注意新旧版本或注册路径的不同,可能会出现两个或多个HLYYPF_9】
确定后,在工具板块上会出现一批新的图标:
然后将黄色的星星图标拖放到窗体中则可,其他是精美的界面图标,可以用于美化界面。
主要配件《宏乐句子剪裁器》:
为了高版本的编程软件能正常加载本控件,录音功能已经分离出来,录音是下图的句子剪裁器完成的。选择控件的“显示录音窗”可以看到这个平时不显示的窗体。如果录音总是不符合要求可以按下图的提示设置。
[录音设备尽可能选择立体声混音,这样自动电平才起作用,否则要适当的调整麦克风的灵敏度]
测试方法:
测试的技巧主要是先调整好麦克风的灵敏度,然后点击“录音”,发音停顿则结束录音并评分。此时会看到一条亮青色的变化曲线;之后点击“保存特征”,记录到特征库中,同时会看到亮青色的曲线变为灰色。
如果只是单独对比两个声音特征请将“批量”复选框设为不选,然后在特征列表中选中要对比的内容,这是会看到灰色的曲线对应特征而变化,点击“录音”按钮,录入一个句子,则可看到评分的结果。
V9以上的版本默认录音结束后对比当前特征库的所有特征,并将对比结果从高分到低分顺序排列。
这些过程完全可以用软件通过相应的函数来控制;具体请参阅函数说明。
录音时麦克风不能正对准口中央,你会发现用于语音识别的耳麦麦克风都是偏离嘴巴的。同时不易远距离录音,当有效的声音与环境噪音达不到5倍以上,识别将不理想;最重要的是如何获得连续的频率曲线,如果破碎,要分析原因。对于一个词组或句子来说,曲线断续是正常的,因为一些语音成分没有频率特征,比如声母T、F等,对应它的部分是一个缺口,这里指的破碎是指对应一个字中的曲线是否连续。
峰值曲线的切割是自动的,但要注意录音时是否有干扰的噪音,请留意曲线的头尾是否正常切割,再将它保存到特征库中。
特征库是需要长期训练的,合理的方法是设为对比以后,重录一次,看看分数是否足够高,不高的要重录。
(如果特征曲线总是出不来,请尝试“反向”功能,通常在面板插入的麦克风插孔需要“反向”)
为了提高识别率,不同时出现的特征库要尽可能的分类。假设正在操控一个窗体,而窗体上只有几个按钮,这种情况下应该为该窗体单独建立一个小特征库,库内只有相应的几个按钮的特征,这样识别起来就会很准。
当库内特征较多时,不可避免会出现识别结果不止一个或需要的结果不排在第一位的现象,这时应该类似拼音输入法,让同音字或词组有个选择的机会。
欢迎下载!