声振论坛

 找回密码
 我要加入

QQ登录

只需一步,快速开始

查看: 3665|回复: 19

[综合] 【求助】关于环境噪音信号特征提取及识别

[复制链接]
发表于 2016-3-22 11:12 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?我要加入

x



本人目前研究环境声音遇到了一些瓶颈,目前只是略微掌握MFCC(梅尔倒谱)方法去识别不同类别信号;


求问还有其他方法可以分析出信号特征并进行识别不同信号吗?

本帖被以下淘专辑推荐:

回复
分享到:

使用道具 举报

发表于 2016-3-22 11:57 | 显示全部楼层
经典的特征提取方法主要有LPCC(线性预测倒谱系数)、MFCC(美尔频率倒谱系数)、HMM(隐马尔科夫模型)、DTW(动态时间规整)等。

评分

1

查看全部评分

 楼主| 发表于 2016-3-22 14:08 | 显示全部楼层
suffer 发表于 2016-3-22 11:57
经典的特征提取方法主要有LPCC(线性预测倒谱系数)、MFCC(美尔频率倒谱系数)、HMM(隐马尔科夫模型)、D ...

非常感谢,目前只略微掌握了MFCC,不知道其他3中是否可以也区分出想要的结果

点评

这个不好说,都有局限性,和数据本身有关  详情 回复 发表于 2016-3-22 16:11
发表于 2016-3-22 16:11 | 显示全部楼层
yderek 发表于 2016-3-22 14:08
非常感谢,目前只略微掌握了MFCC,不知道其他3中是否可以也区分出想要的结果

这个不好说,都有局限性,和数据本身有关
 楼主| 发表于 2016-3-22 16:17 | 显示全部楼层
suffer 发表于 2016-3-22 16:11
这个不好说,都有局限性,和数据本身有关

那就好,目前用MFCC的方法还是取得了比较高的识别正确率,哪怕其他方法识别正确率不高,也能横向对比哪一个方法更佳

敢问您这边是否有上述几个方法(除了MFCC)的程序代码吗?

点评

代码你可以到http://download.csdn.net/找 一般都能找到  详情 回复 发表于 2016-3-22 16:25
发表于 2016-3-22 16:25 | 显示全部楼层
yderek 发表于 2016-3-22 16:17
那就好,目前用MFCC的方法还是取得了比较高的识别正确率,哪怕其他方法识别正确率不高,也能横向对比哪一 ...

代码你可以到http://download.csdn.net/
一般都能找到

评分

1

查看全部评分

发表于 2016-3-23 19:04 | 显示全部楼层
MFCC是一种经典、有效的方法。这样的经典方法可用于工程,若用于造文章恐怕就困难了。

评分

1

查看全部评分

 楼主| 发表于 2016-3-23 19:35 | 显示全部楼层
dsp2008 发表于 2016-3-23 19:04
MFCC是一种经典、有效的方法。这样的经典方法可用于工程,若用于造文章恐怕就困难了。

MFCC现在已经基本掌握了,求其他方法
 楼主| 发表于 2016-3-23 19:40 | 显示全部楼层
suffer 发表于 2016-3-22 16:25
代码你可以到http://download.csdn.net/找
一般都能找到

刚刚查到,HTK工具包适用于HMM方法提取声音特征并进行辨识;DSP上编写的语音识别程序也可以采用DTW(动态时间规整)的方法来实现声音识别;
无奈前者目前还找不到安装程序。后者应该是单片机吧?是否还需用其他变成语言来实现?

点评

HTK是一个开源工具包,可以在http://htk.eng.cam.ac.uk/进行免费下载  详情 回复 发表于 2016-3-25 12:47
发表于 2016-3-25 09:35 | 显示全部楼层
MFCC识别也有很多参数可细调,曾用MFCC开发过有多路声音匹配软件,可自己录制样本。

评分

1

查看全部评分

发表于 2016-3-25 12:47 | 显示全部楼层
yderek 发表于 2016-3-23 19:40
刚刚查到,HTK工具包适用于HMM方法提取声音特征并进行辨识;DSP上编写的语音识别程序也可以采用DTW(动态 ...

HTK是一个开源工具包,可以在http://htk.eng.cam.ac.uk/进行免费下载
发表于 2016-3-25 12:50 | 显示全部楼层
HTK工具使用:

1. 模型建立及训练的官方式过程:HTK手册_第三章_中文版
http://wenku.baidu.com/view/80f961b9d0d233d4b14e699a.html

2. 3个孤立词模型建立及训练的详细过程:基于HTK语音工具包进行孤立词识别的使用教程
http://my.oschina.net/jamesju/blog/116151

3. HTK_basic_tutorial(即基础指南):HTK_basic_tutorial
http://wenku.baidu.com/link?url= ... ezErXAI1wPwH7q6FR4O

4. HTK_basic_tutorial(中文版):HTK(v3.1)基础指南中文版
http://wenku.baidu.com/view/1c606d4fe518964bcf847c81.html

5. HTK指南:HTK指南
http://wenku.baidu.com/view/992bcd09581b6bd97f19eac7.html

代码分析:

1. HTK源代码分析:HTK源代码分析
http://www.doc88.com/p-6813727388251.html

2. 语音识别HTK代码学习手册:
语音识别HTK代码学习手册
http://www.docin.com/p-243203295.html

百度文库——HTK代码学习手册
http://wenku.baidu.com/link?url= ... 9qXVuyXzaDheo7P_bZq

评分

1

查看全部评分

 楼主| 发表于 2016-3-29 13:36 | 显示全部楼层
TestGuru 发表于 2016-3-25 09:35
MFCC识别也有很多参数可细调,曾用MFCC开发过有多路声音匹配软件,可自己录制样本。

我这边主要就是简单的分析下加窗后的视频曲线,然后求倒谱距离,不知道还有什么其他方法?

点评

大的方法前面二楼已经讲了。每个方法都有很多细节能影响对信号的识别度,就拿MFCC+DTW来讲,要不要先滤波,怎么滤波,要不要预加重,怎么预加重,窗的长度,窗的重叠比例,多少个MFCC谱组合在一起算DTW,MFCC的频带  详情 回复 发表于 2016-3-29 20:44
 楼主| 发表于 2016-3-29 13:55 | 显示全部楼层
Lorraine 发表于 2016-3-25 12:50
HTK工具使用:

1. 模型建立及训练的官方式过程:HTK手册_第三章_中文版

感谢您给提供的这些资料,其中下载地址那个之前也去研究过,但是注册的时候有提示要提交一些ID,没太搞明白。看了中文版的手册,觉得对于语言来说识别正确率还挺高的,但是对于某些机械和环境声音不知道效果怎么样,可以实现不? HTK工具包.png
 楼主| 发表于 2016-3-29 14:32 | 显示全部楼层
Lorraine 发表于 2016-3-25 12:50
HTK工具使用:

1. 模型建立及训练的官方式过程:HTK手册_第三章_中文版

刚刚把您分享的资料大致看了一下,觉得我需要的几种不同环境音和机械音的应该比语言识别要简单,现在主要有以下几个问题和疑惑:
1、那个官网下载地址能下载到的是一个.exe的安装文件吗?如果是,目前还没搞明白怎么下载
2、假设HTK工具箱是一个安装程序,那么在进行训练的时候可以识别电脑里已经存在的声音文件吗?
3、假设1和2条同时成立,在进行目的声音识别的时候,可以把其他声音当做未知声音通过已经训练好的样本声音进行识别吗,并且可以得到比较高的识别正确率?
4、HTK的变成语言是C语言吗?

点评

是C语言写的,至于是否适用于声音识别意外的就不太清楚了  详情 回复 发表于 2016-3-31 08:35
开源应该是源代码,如果你下载到的是exe的,那应该是经过别人编译的 比如http://www.pudn.com/downloads550/sourcecode/windows/detail2269387.html  详情 回复 发表于 2016-3-30 09:29
您需要登录后才可以回帖 登录 | 我要加入

本版积分规则

QQ|小黑屋|Archiver|手机版|联系我们|声振论坛

GMT+8, 2024-11-28 20:52 , Processed in 0.069796 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表