耳鼻喉头颈外科杂志类别:临床文章类型:原创

听觉障碍老年人在噪声存在下对深波段调制语音的感知

Hemanth Narayan谢蒂 1而且Suma拉 2
1听力学教授,JSS语言与听力研究所听力学系,印度卡纳塔克邦迈索尔570004
2言语语言病理学教授,JSS言语与听力研究所言语学系,印度卡纳塔克邦迈索尔570004

通讯作者(年代):
Hemanth Narayan谢蒂
听力学教授,JSS语言与听力研究所听力学系,印度卡纳塔克邦迈索尔570004
电话:+ 91 998651550,
电子邮件:hemanthn.shetty@gmail.com

收到的日期: 2021年9月7日
接受日期: 2021年9月28日
发布日期: 2021年10月13日

摘要

背景:深波段调制(DBM)是一种包络增强策略,它可以增强时间调制,并可能为患有时间处理缺陷的个体提供语音理解的线索。

摘要目的:研究深度波段调制在不同信噪比(SNRs)下对听力受损老年人短语识别得分的影响。

方法:对25名(年龄60 ~ 82岁,平均年龄71.48岁)双侧轻度至中重度倾斜感音神经性听力损失的老年人,在3个信噪比(4、5和- 4db信噪比)下的未处理和DBM短语进行短语识别评分。此外,还对研究参与者进行了间隙检测测试。

结果: DBM的识别得分明显高于未处理的短语。DBM的改善程度在所有参与者中并不相同。因此,根据参与者的时间处理能力,将他们分为好和差两类。在每个信噪比中,表现良好的学习者的未处理和DBM短语识别的平均得分高于表现较差的学习者。在高信噪比条件下,深波段调制的效果明显,且与年龄和时间处理能力有一定的相关性。

结论:从时间分辨能力和年龄两个方面预测了DBM对优等生识别得分的影响。然而,对于噪音表现较差的人来说,这种好处是微乎其微的。

简介

辅音的可听性是语音感知的关键。与年龄有关的高频听力损失降低了辅音的可听性,从而损害语音识别[2]。时间处理指的是对声波刺激随时间的处理。间隙检测阈值是衡量时间处理能力的一种测试方法。间隙检测阈值是人检测噪声中最小间隙的能力。Strouseet al.[3]在老年听者的间隙检测测试(GDT)中表现出较差的时间处理能力。间隙检测阈值与人处理与语音区分相关的快速或短时间事件的能力有关。De Filippo和Snell[5]报道,能够区分语音和非语音共轭音和语音方式的人在GTD中具有较低的阈值(以毫秒为单位),反之亦然。我们有理由认为,除了老年人的周围性听力损失外,时间处理障碍也导致了语音识别障碍。

理解低信噪比(SNR)下的语音对听障听众来说是一个重大挑战[6]。困难来自于时间处理的缺陷和更广泛的听觉过滤器[7]。有充分证据表明,有听力障碍的听者是通过信号中包络的最大振幅来理解讲话的,部分隐藏在噪声[6]中。Shannon et al.[8]通过调节噪声与语音包膜相关,使得老年听障成人在没有谱线索的情况下主要依赖于包膜线索。结果显示,年老的听障成人通过更高振幅的时间包络线索来识别语音。这归因于高信噪比[9]时掩蔽释放的时间线索。

为了改善噪声环境下的语音感知,提出了几种时间增强策略。早期的研究使用简单幂律函数[10]、包络展开非线性模式[11]和包络压缩展开方法[12]来提取语音的时间包络。使用上述算法对时间包络增强信号的语音识别评分结果在听力损失的老年人中显示出模棱两可的结果[10-12]。深波段调制(DBM)就是Nagarajan等人[13]开发的一种策略。DBM与语音包膜增强方案[14]相似,除了扩展、包膜滤波和信道配置增益的时间尺度不同。DBM的这三种修改增加了辅音与元音的比例和调制深度。在DBM中,从每个通道提取的3到30 Hz之间的时间包络带宽增强了15 dB,这显著增加了调制深度,元音对辅音的掩盖被最小化。经知觉训练后,该策略对可能发生时间处理障碍的学习障碍儿童[13]是有益的。Shetty和Mendhakar[15]在不同信噪比的老年人中使用DBM方案研究短语感知。结果表明,在不同信噪比下,老年人组的深波段调制短语感知得分与未处理的年轻人组的短语感知得分接近。 To reduce bias in the stimulus redundancy, Shetty and Kooknoor [16] had utilized deep band modulated VCV syllables on consonant identification scores and determined the transfer of features such as place, manner, and voicing. At reduced SNRs, cues from DBM enabled the listener to repeat the heard VCV syllables. DBM partly lessens aging and the combined effects of aging and hearing loss through the temporal enhancement approach. To purport, DBM compensates for temporal asynchrony in older adults and alleviates the perception problem from noise. The temporal processing impairment may not be the same in individuals with the same degree of hearing loss. Shetty and Kooknoor [16] empirically demonstrated a strong negative correlation between DBM phrase perception and gap detection threshold in older adults with hearing loss.

有证据表明,通过深波段调制放大语音包络可以提高可理解性。然而,包络增强算法与老化和听力损失的相互作用的综合评价是缺乏的。用于增强包络的深波段调制增强算法被应用于不同背景噪声条件(-4 dB SNR、0 dB SNR和4 dB SNR)下的短语级刺激,受试者为患有和没有听力损失的老年人和年轻人(Hemanth, 2020年综述)。研究结果表明,从深波段调制短语感知减轻了衰老和听力损失的综合影响。深波段调制为听力受损的老年人提供了语音理解的基本线索,他们经常遭受时间处理缺陷。现在问题来了:“从DBM得出的短语感知评分是否与时间处理障碍无关?”“我们的目标是确定在具有不同程度的理解语音的时间分辨能力的老年人中,增强的时间包膜在具有挑战性的沟通环境中的重要性。”假设听觉的时间处理能力对理解语音至关重要,深波段调制可能会受益,特别是对那些时间处理能力较差的人。本研究旨在探讨深波段调制和噪声对失聪老年人短语感知的影响。制定了下列目标:

1)比较在每个信噪比下的短语识别:a)未处理和深波段调制条件下研究参与者的短语识别;b)在DBM和UP条件下表现良好和表现较差的短语识别

2)找出DBM条件下的识别分数、间隙检测阈值与老化、老化之间的关系

3)从时态处理能力和老化程度两方面预测DBM短语识别的效益。

材料和方法

采用重复测量设计,研究在不同信噪比下,失聪老年人的深波段调制短语感知效果。

主题选择标准

本研究共招募了25名双侧轻度至中重度倾斜感音神经性听力丧失患者,年龄60 ~ 82岁(平均年龄71.48岁)。倾斜听力损失在操作上定义为250hz ~ 500hz为≥20 dB HL, 1000hz ~ 2000hz为≥40,3000 ~ 8000hz为≥65 dB HL。所有参与者的中耳状态正常,鼓室图呈“A”型。参与者的母语是印度坎纳达语(Kannada)。为了排除认知缺陷,研究人员采用了小型精神状态测试(mini mental State Examination),并招募了那些得分在24 - 30分之间的人。所有测试程序均经JSS言语与听力研究所人类伦理委员会(JSSISHA/EC/103)批准。研究中涉及的程序是非侵入性的,所有的程序都在测试前向参与者解释。在参与前,获得每位参与者或其直系亲属的书面知情同意。

差距检测阈值

间隙检测阈值是检测信号随时间的快速变化的能力,反映了听觉系统[18]的时间分辨能力。有听力损失的老年人通常表现出轻微的时间处理障碍[19]。因此,采用间隙检测阈值(GDT)检验来评估所有参与者的时间分辨率。每个刺激都由三段宽噪声组成;持续时间为500毫秒的。在一个噪声段中随机引入一个短暂的时间中心间隙。初始间隙持续时间为20 ms,并在0.5 ms的步骤中进行调整。刺激是在MATLAB 2015 b (Mathworks, Natick, Massachusetts, USA)中以22000 Hz的采样率生成的。产生的刺激通过听诊器传输到双耳耳机,频率为35 dB SL[20]。任务是检测宽带白噪声中的短暂停顿。 The detection threshold was estimated using a three alternative forced-choice method (3-AFC), a two-down one-up adaptive procedure [21]. The adaptive tracking procedure stopped after 12 reversals, and the threshold was obtained by averaging the gap-duration values of the last four reversals.

深波段调制短语的制备

Shetty和Mendhakar[22]开发的标准化短语列表用于研究短语识别。这6个相同的列表在语音上是平衡的,每个列表包含10个短语。每个短语包含两个单词,平均时长为1500毫秒。利用三种均衡短语表编制了一个深波段调制(DBM)版本列表。使用Praat软件(版本4.6.09)(荷兰阿姆斯特丹的免费计算机软件)应用Nagaraja等人[13]采用的算法。DBM算法的详细描述可以在http://www.fon.hum.uva.nl/praat/manual/Sound Deepen_band_modulation.html中找到用滤波器组的方法对每个短语进行20秒阶巴特沃斯滤波。这20个滤波器的中心频率以对数的方式间隔在100hz和10khz之间。从每个窄带信道的输出中提取一个包络线(即,使用快速傅里叶变换计算希尔伯特变换)。每个窄带信道中的包络用截止频率在3到30 Hz[23]之间的二阶巴特沃思滤波器进行滤波并进行整流。然后将处理后的希尔伯特包络与原始的时间精细结构进行重组。在对每个信道的包络求和之前,在1 - 4 kHz的频率范围内为信道提供15dB[23]的增益,以实现由此产生的深波段调制相位。

噪声的产生和衍生噪声的混合

从不同的列表中随机选择短语并连接起来。对连接的短语进行快速傅里叶变换。通过反FFT将随机短语的谱内容转换回一个“。wav”文件,得到长期平均语音谱(LTASS)。采用类似的方法从深波段调制的相位中提取噪声。使用简单的FIR滤波器生成的语音形状噪声与目标短语刺激的说话人频谱相匹配,如Versfeld[24]所给出的。

三个DBM短语列表中的每一个都嵌入了三个不同的信噪比(-4、0和4 dB信噪比)。sigmoid曲线[15]的短语刺激在- 4db信噪比下获得50%的识别分数。一个公认的事实是,数字降噪和方向性的综合效果减少了4 dB信噪比[25]的烦恼。因此,本研究考虑了-4dB、0dB和4dB的信噪比。

将DBM短语频谱形状的噪声与短语进行数字混合,以生成相对于短语的RMS值的不同信噪比(图1)。噪声在短语开始前300毫秒开始,并持续到短语结束后300毫秒。使用余弦平方函数对噪声进行斜坡,斜坡持续时间为100毫秒。噪音在短语之前出现被认为可以防止意外的开始效应。在未处理的条件下,对另外三个短语列表重复了不同信噪比下的混合噪声过程。从图1可以看出,在安静和不同信噪比的情况下,深波段调制音的辅音振幅相对于UP音要大。此外,DBM调制深度比UP调制深度更大。

图1:' o:duvakudure '的输出,显示未处理的短语在安静(a), 4 dB信噪比(b) 0 dB信噪比(c)和- 4 dB信噪比(d),在第一行。第二行分别表示quiet (e)、4db SNR (f)、0db SNR (g)和- 4db SNR (h)的深频带调制短语。

听条件

短语识别任务是在一个声学处理过的房间里进行的,那里的环境噪声水平在允许的限度内(ANSI, 1999)。在未处理和深波段调制条件下的短语识别评估从研究参与者在每三个SNRs。共6个列表[2*条件(UP和DBM)和3*信噪比(- 4,0和4db信噪比)]存储在连接到听力计辅助输入的个人笔记本电脑上。听力计的输出通过TDH-39耳机双耳传输。在刺激呈现过程中,确保体积单位(VU)仪表上的平均挠度为0 dB。每个列表中的10个短语在指定的信噪比下以最舒适的水平随机呈现。每个参与者都被要求重复听到的短语。在不同的实验条件下(2*和3*信噪比),短语的呈现在参与者之间使用一个随机数字表来控制顺序效应。研究人员为正确识别每个短语中的每个目标词手动分配了一个分数,这样每个实验条件分配的最高分数是20分。如果参与者没有重复/部分重复短语中的一个单词,则得分为零。 Participants were given sufficient breaks during the testing. The testing duration per participant was approximately 30 minutes.

结果

不同信噪比下未处理和深波段调制短语的短语识别得分均值和标准差如表1所示。从表中可以看出,在不同信噪比下,深波段调制语音的识别得分优于未处理语音。当信噪比为- 4db时,DBM条件下的识别得分低于UP条件,其次为0db信噪比和4db信噪比。为了评估不同信噪比(-4、0和4 dB信噪比)下的条件(未处理和深波段调制条件)的影响,对重复测量进行了双向方差分析(ANOVA)。条件的主要影响显著(F(1,24) = 117.00,p= 0.000)和信噪比(F(2,48) = 31.45,p= 0.000)的短语识别分数。条件与信噪比之间存在显著的交互作用(F(2,48) = 3.39,p= 0.042)。Bonferroni配对比较显示,随着信噪比的增加,平均短语识别分数显著增加(p< 0.01)。由于条件*信噪比之间存在相互作用,分别对未处理和深波段调制条件进行单向方差分析。结果显示,在不同信噪比下,未处理的(F(2,48) = 15.76,p= 0.000)和深波段调制语音(F(48) = 28.25,p= 0.000)。Scheffe对未处理语音的事后分析显示,4 dB信噪比下的平均短语识别得分与所有信噪比(0 dB信噪比和- 4 dB信噪比)显著不同(p< 0.01)。0 dB信噪比下的平均短语识别得分与-4 dB信噪比(p< 0.01)。Scheffe对深波段调制语音的事后分析显示,在4 dB信噪比和0 dB信噪比条件下获得的平均短语识别得分没有显著差异。尽管如此,其余的条件仍有显著差异(p<0.01)。

深波段调制条件

未加工的条件

- 4分贝信噪比

0数据库信噪比

4 dB信噪比

- 4 dB

——信噪比

0分贝

信噪比

4 dB

信噪比

研究参与者

N = 25

7.60

(3.26)

11.28

(4.79)

11.56

(4.85)

3.28 (1.51)

5.52

(3.38)

5.84

(2.26)

好演员N = 14

9.28 (2.30)

13.28 (3.31)

15 (2.90)

3.85

(1.46)

7.14

(2.79)

7.42

(3.27)

可怜的演员

N = 11

5.45 (3.11)

6.72 (2.34)

7.45 (1.84)

2.54 (1.29)

3.45

(0.94)

3.87

(1.24)

N =参与者人数;信噪比——信噪比

表1:每种信噪比下两种收听条件下识别分数的均值和标准差。

间隙检测阈值数据检查显示均值为12.30 ms, SD为4.88 ms。尽管所有研究参与者都有轻度到中重度倾斜传感器神经听力损失,GDT范围为15 ms,最小值为5 ms,最大值为20 ms。考虑时间处理能力对识别的影响是必要的。在未处理条件下,少数个体在4 dB信噪比下的得分已经很差了,由于底部效应,由于信噪比更低,性能恶化的幅度更小。Schneider和Pichora-Fuller[26]曾报道过老年人的时间分辨率降低的语言知觉受损。因此,为了进一步分析,我们将数据分为两组,即Good表演者(平均= 8.41 ms SD = 2.46) (GDT得分低于10 ms)和Poor表演者(平均= 17.18 SD = 1.60) (GDT得分为> 10 ms)。根据时间分辨技能对参与者进行分组有助于记录使用深波段调制算法增强测试刺激时所获得的益处的大小。观察到的改善幅度在所有参与者中并不相同。对于表现较差的人来说,那些对未经处理的语音短语识别得分非常低的人,在每个信噪比的深度波段调制下,表现出很少或没有改善。

在不同信噪比(-4、0和4 dB信噪比)下,采用双向(收听条件和信噪比)重复测量方差分析(以受试者间因素为组(时间处理能力好和时间处理能力差)来评估收听条件(未处理和深波段调制条件)对短语识别的影响。分析显示,听力状况的主要影响显著(F(1,23) = 215.06, p = 0.001)和刺激(F(46) = 39.05,p= 0.001)的短语识别分数。此外,在认知(F(23) = 27.88,p= 0.001)。研究发现,听觉条件和信噪比对识别的交互作用显著(F(2, 46) = 3.12,p= 0.001)。我们使用配对样本t检验在每个SNRs中分别分析了未处理和DBM条件下的识别分数数据。相关样本t检验结果显示,在每个信噪比下,DBM条件下的短语识别比未处理条件有显著改善(p<0.001)(表2)。

良好的表现

df = 13

可怜的演员

df = 10

信噪比

p值

t值

p值

t值

- 4分贝信噪比

-9.50

0.001

-3.95

0.003

0数据库信噪比

-9.20

0.001

-6.05

0.001

4 dB信噪比

-12.68

0.001

-4.27

0.002

DF -自由度

表2:在每个信噪比下,收听条件(UP和DBM)对语音识别进行依赖样本t检验的p值和t值

从图2可以观察到,在任何信噪比下,噪声对未处理条件下DBM识别改进幅度的影响都是不一样的,无论是好的还是差的。与未处理条件识别评分相比,在SNR为4 dB时,良好表现者在DBM识别方面的改善幅度显著高于-4 dB SNR (t (13) = 2.87, p<0.001)。在信噪比的其余比较中,DBM比未处理条件的益处在每组中几乎相同。

图2:在每个信噪比下,优秀者和劣秀者的识别得分都有所提高。

使用皮尔逊积矩相关法计算各实验条件下年龄与短语感知评分之间的相关系数(表3)。Pearson相关系数结果显示,在不同信噪比的DBM听力条件下,年龄与乐句感知得分呈显著负相关。说明短语识别得分随年龄的增加而降低(图3 a,b,c,d, e f)。

图3:表示在(a) UP和(b)深度波段调制条件下,在每个信噪比下年龄和短语感知评分之间的散点图。

年龄(年)

间隙检测阈值(毫秒)

相关的措施

# (N = 25)

显著性水平(p)

相关系数(r)

显著性水平(p)

相关系数(r)

未加工的条件

4 dB信噪比

0.164

-0.287

0.042

-0.409 *

0数据库信噪比

0.064

-0.376

0.011

-0.500 *

4 dB信噪比

0.055

-0.388

0.002

-0.596 * *

深波段调制条件

4 dB信噪比

0.047

-0.401 *

0.007

-0.527 * *

0数据库信噪比

0.023

-0.454 *

0.001

-0.659 * *

4 dB信噪比

0.001

-0.674 * *

0.001

-0.807 * * *

信噪比——信噪比

#参与人数;

*0.31至0.50或-0.31至-0.50 =弱;

**0.51至0.70或-0.51至-0.70 =中等;

***0.71至0.90或-0.71至-0.90 =强;
表3:皮尔逊积矩相关的结果。

此外,利用皮尔逊积矩相关法计算各实验条件下GDT与短语感知评分之间的相关系数(表3)。Pearson相关系数结果显示,在每个信噪比下,在未处理和DBM两种听力条件下,GDT与乐句感知分数显著负相关。它表明在短语感知得分较低的个体中GDT值较高(图4)。

图4:表示在(a) UP和(b)深度波段调制条件下,在每个信噪比下GDT和短语感知评分之间的散点图。

效益的计算方法是在每个实验条件下用未处理的评分减去DBM评分。在每个信噪比下,使用皮尔逊积矩相关性计算DBM、年龄和GDT的收益之间的相关系数。Pearson相关系数结果显示,在4 dB信噪比下,DBM的获益与年龄(N =25, r = -0.610, p= 0.001)和GDT (N =25, r = -0.593, p= 0.002)呈显著的中度负相关。多重相关系数R为0.622,预测水平较好。r2为0.386,即从DBM中获益的38.6%的差异可以用年龄和他们在GDT中反映的时间处理能力来解释。年龄和GDT显著预测了从DBM获得的好处,[F (2,22) = 6.925, p=0.005]表明模型与数据很好地拟合。用回归方程预测DBM的收益= 20.335 -0.179*(年龄)- 0.166 (GDT)。

此外,在0 dB信噪比(N =25 r = -0.487, p= 0.014)和-4 dB信噪比(N =25 r = -0.431, p= 0.032)时,受益与GDT之间存在中度负相关,但与年龄无相关性。线性回归表明,GDT反映的时间处理能力可以显著预测DBM在0 dB信噪比[F (2,22) = 7.152, p=0.014]和-4 dB信噪比[F (2,22) = 5.238, p=0.032]时所获得的效益。预测0 dB信噪比和-4 dB信噪比的DBM识别效益,时间处理能力分别占被解释变异性的23.7%和18.5%。利用回归方程预测,对于0 dB信噪比,DBM的效益= 9.465 -0.301*(GDT评分),对于-4 dB信噪比,DBM的效益=7.101 -0.226*(GDT评分)。

讨论

无论在什么条件下,当信噪比从-4增加到4 dB时,短语识别分数显著增加。在深波段调制条件下,平均短语的识别效果优于未处理条件。可以推断,增强语音的辅音部分和压缩发声部分可能提高了听者处理短语(3 - 30 Hz)的缓慢调制包膜的能力。此外,调制深度增加15dB有利于增强时间线索的抗噪性,尽管噪声遮蔽了时间线索。在4 dB下未处理的相位识别比0 dB信噪比和-4 dB信噪比显著。此外,在0 dB信噪比下的识别得分显著优于-4 dB信噪比。而在DBM中,在4 dB信噪比下的短语识别相对优于0 dB信噪比,达到无显著差异,但发现与-4 dB信噪比和4 dB信噪比之间的识别得分显著。这可能是由于DBM条件比未处理条件更容易获得时间线索。在高信噪比下,DBM中较大的振幅调制可能导致了未被能量掩盖的瞬时波动。

当对汇总数据进行分析时,在未处理条件下,一些个体在4 dB信噪比下的得分已经很差了,性能恶化的幅度甚至更差,因为较低的信噪比产生了下限效应。此外,未处理语音的识别与参与者的年龄无关,与信噪比无关。但是,由于时间分辨能力的阈值增加,语音识别得分下降,这对信噪比是有效的。通过噪声推断地板效应,短语识别与年龄无关,而与时间分辨能力有关,从而重新对队列进行分组。因此,我们根据间隙检测阈值将数据分组为表现良好和表现较差的数据,以确认在噪声存在的情况下,DBM条件对识别得分的影响。

在每一个信噪比中,我们发现在DBM条件下短语感知得分显著优于未处理的条件,而不考虑组。这可能是由于语音的波动,通过比较听觉滤波器输出的噪声来识别语音[27]。与目标短语的频率相对应的少数听觉滤波器输出的高幅值波动的DBM与语音型噪声的调制模式不同。不同听觉滤波器之间调制模式的差异对检测导致屏蔽释放[28]的信号非常敏感。然而,在未经处理的条件下,短语和语音形状的噪声的波动可能被均匀地填充在听觉滤波器的输出中,没有留下从掩蔽中释放的明显模式。此外,短语产生的语音形状遮蔽噪声的时间和频谱变化更接近于目标短语,通过可用的dip收听的可能性更小。

此外,在每一组中,我们通过从未处理的条件中减去DBM得分来计算效益。当我们评估每组的收益作为信噪比的函数时,令人惊讶的是,在噪音存在的情况下,收益是部分的,尤其是在表现较差的情况下。一种可能的猜测可能是,在GDT的高阈值中反映出时间处理障碍较差的个体未能提取可用的高振幅包络,这部分被噪声掩盖了。而在性能良好的情况下,在4 dB SNR下的收益显著优于-4 dB SNR,但在0 dB SNR和-4 dB SNR之间的收益没有差异。DBM比UP获得的好处可以忽略不计,特别是在降低信噪比的情况下。这是因为在0 dB的信噪比和-4 dB的信噪比下,相位调制深度会显著降低。此外,噪声扭曲了时间精细结构,并消除了用于识别的包络线索。虽然好的学习者比差的学习者具有相对较好的时间处理能力,但他们不能通过提取时间包膜的瞬时波动来跟随演讲。综上所述,在有背景声音的情况下识别DBM短语时,随着调制深度的增加,传递被处理短语有用信息的时频区域在较高信噪比下相对于在较低信噪比下相对较多。在性能较差的情况下,处理过的短语的可用调制是有限的,或者隐藏在背景噪声中,由于时间分辨率降低,可能会发现识别可用调制深度具有挑战性。

建立了从时间分辨率和年龄两方面预测DBM效益的回归模型。当合成信号强度高于噪声时,我们可以预测DBM条件在识别方面有更高的效益。老年人的年龄每增加1岁,识别分数下降0.2%。如果GDT中的阈值降低1 ms,则识别增加0。15%。总的来说,当老年人年龄较小时,GDT阈值较低时,对识别分数的综合影响增加0.25%。然而,假设信号的强度等于或小于噪声。在这种情况下,DBM的识别得分取决于时间分辨能力,而不是个体的年龄。听觉时间处理能力对于理解在不利听力条件下由深波段调制处理的语音至关重要。

观察到的好处,在短语识别性能诱导提出的深波段调制发现在良好的表演者。对于调制深度随语音变化而变化的多说话者噪声,需要进一步研究DBM的优点。背景音的调制随着音段调制深度的增加而变得难以检测,特别是当其音量招募接近其内部调制深度的渐近值和波动强度[29]的接近饱和时。因此,有必要采用心理声学方法(如时间包膜检测和辨别),用同样的阈值替换来增强目标短语的深度,这可能有助于在噪声存在的情况下理解语音,特别是对表现较差的语音者。

结论

综上所述,DBM等时间增强策略已被证明可以改善听力损失老年人对短语的感知,特别是那些时间分辨率阈值相对较低的老年人。DBM通过减少老年人的时间不同步来帮助他们访问可用的时间线索。未来的研究可以研究DBM调制深度对听力损失老年人语音掩蔽的影响,这些老年人的GDT阈值较高,反映了时间分辨率受损。

研究的临床意义

DBM算法可用于压缩元音高幅值、增强辅音低幅值的助听器处理策略。这样一来,语言的可理解性就提高了;老年人经常在高频时听力受损,并减少了向上的掩蔽,他们能感知辅音。在未来的研究中,我们可能需要用这种策略来训练表现不佳的人,随着时间的推移,我们可能会从他们身上得到好处。

致谢

作者感谢语言与听力研究所主任允许进行这项研究。

信息披露

作者报告在这项工作中没有利益冲突。-没有利益冲突

资金来源-没有资金来源。

参考文献

  1. Phatak S, Allen J(2007)语音加权噪声中的辅音和元音混淆。J声学Soc Am 121: 2312-2326。
  2. Humes LE, Coughlin M(2009)帮助听力受损老年人在单话比赛中的语音识别表现。心理杂志50:485-494。
  3. 史卓斯,阿什米德,欧德RN,格兰瑟姆(1998)老化听觉系统的时间加工。J声学模块104:2385-2399。
  4. 听力受损受试者的心理物理数据与言语知觉之间的关系。2J声学Soc Am 78: 1261-1270。
  5. De Filippo CL, Snell KB(1986)正常听力和听力受损听者对低频窄带信号的时间间隔的检测。声学学报80:1354-1358。
  6. Gordon-Salant S, Fitzgibbons PJ(1993)时间因素与年轻和老年听者的语音识别表现。听36:1276-1285。
  7. 泰勒RS,伍德EJ,费尔南德斯M(1983)在正常和听力中恒定和动态音调的频率分辨和辨别?受损的听众。J声学Soc Am 74: 1190-1199。
  8. Shannon RV, Zeng FG, Kamath V, Wygonski J, Ekelid M(1995)基于时间线索的语音识别。科学270:303 - 304。
  9. Bacon SP, Opie JM, Montoya DY(1998)听力损失和噪声掩蔽对时间复杂背景下语音掩蔽释放的影响。J演讲,朗听Res 441: 549-563。
  10. Freyman RL, Nerbonne GP(1996)振幅扩展语音中的辅音混淆。J演讲,朗听Res 39: 1124-1137。
  11. Lorenzi C, Berthommier F, Apoux F, Bacri N(1999)包络扩展对语音识别的影响。请听第136:131-138条。
  12. Apoux F, Tribut N, Debruille X, Lorenzi C(2004)听力正常和听力受损听者的包络扩展句识别。听第189:13-24条。
  13. Nagarajan SS, Wang X, Merzenich MM, Schreiner CE, Johnston P,等(1998)用于训练语言学习障碍儿童的语音修改算法。电气工程学报6:257-268。
  14. Langhans T, Strube HW(1982)利用非线性多波段包络滤波增强语音。ICASSP 156 - 159。
  15. Shetty HN, Mendhakar A(2015)深波段调制和噪声效应:成年人对短语的感知。听Balanc公社13:111-117。
  16. Shetty HN, Kooknoor V(2016)有听力损失和没有听力损失的老年人在安静和噪音中识别深波段调制辅音。杂志杂志12:282-289。
  17. Reisberg B, Ferris SH, de Leon MJ, Crook T(1982)评估原发性退行性痴呆的全球恶化量表。美国精神病学杂志139:1136-1139。
  18. philip SL, Gordon-Salant S, Fitzgibbons PJ, Yeni-Komshian G(2000)单词识别好坏的老年听者的频率和时间分辨率。J演讲,朗听Res 443: 217-228。
  19. 温菲尔德,McCoy SL, Peelle JE, Tun PA, Cox LC(2006)成人年龄和听力损失对不同句法复杂性快速言语理解的影响。《中国医学杂志》第17期:487-497。
  20. Weihing JA, Musiek FE, Shinn JB(2007)呈现水平对噪声间隙(GIN)测试的影响。《中国医学杂志》音频18:141-150。
  21. 莱维特·H(1971):转变?心理声学中的Down方法。声学学报49:467-477。
  22. Shetty H, Mendhakar A(2015)坎纳达语短语识别测试的开发。印度语朗听协会29:21。
  23. Narne VK, Vanaja CS(2008)听神经病变个体的包膜增强对言语知觉的影响。耳听29:45-53。
  24. Versfeld NJ, Daalder L, Festen JM, Houtgast T(2000)用于有效测量语音接收阈值的句子材料选择方法。声学学报107:1671-1684。
  25. Lowery KJ, Plyler PN(2013)降噪技术对背景噪声接受度的影响。J Am Acad Audiol 24: 649-659。
  26. Schneider BA, Pichora-Fuller MK(2001)与年龄相关的时间处理变化:对语音感知的影响。听力22:227-238。
  27. Hall JW, Grose JH(1991)成人和儿童使用固定掩模级和固定信号级表示的频率选择性的notch -noise测量。听第34:651-660条。
  28. Carlyon RP, busus S, Florentine M(1989)三种类型调制器的调制掩蔽释放作为调制速率的函数。听第42章37-45节。
  29. Schlittenlacher J, Moore BCJ(2016)听力正常和听力受损受试者对调幅深度的辨别。J声学Soc Am 140: 3487-3495。

引用:Shetty HN, Raju S(2021)听觉障碍老年人在噪声存在时对深波段调制语音的感知。耳鼻喉头颈外科7:61

版权:©2021 Hemanth Narayan Shetty等人。这是一篇开放获取的文章,根据创作共用署名许可协议(Creative Commons Attribution License)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。

18新利app载
Baidu
map