书城医学助听器学
8925900000015

第15章 助听器的声学处理技术(3)

5.4.2移频技术

1.移频技术的定义

移频技术(frequency shifting techniques)是指将无高频残余听力或高频残余听力较差的助听器佩戴者无法通过普通助听器听到的且重要的高频言语信息转移至其仍存有较好残余听力的低频频段。因此,移频技术是将言语信号的带宽尽可能地匹配至助听器佩戴者仍较敏感的残余听觉动态范围之内,并非企图使缺失或不复存在的(耳蜗死区)高频毛细胞产生反应。

2.移频技术的历史

移频概念的提出可追溯到20世纪五六十年代,当时Bennet、Byers(1967)和Beasley(1976)试图应用频率降低技术(frequency lowering techniques)进行助听和语训,然而鉴于早期技术的局限性以及相关专业培训和助听器调试灵活度的缺乏,在很大程度上影响了移频技术在当时的临床应用和推广。

然而,移频技术的发展并未就此停滞不前,按比例移频压缩(proportional frequency compression)技术和不按比例移频压缩技术相继出现,尽管很多时候最初的移频技术并没有运用于可佩戴的助听装置或语训工具,其中以变调装置最具代表性。变调装置是通过恒定的频率移动形成言语信号的变化,但是由于其所采用的不按比例的频率转换方法无法确保言语信号中语素间相对关系的稳定,导致了语言声变化的极不自然,因此不按比例的移频不仅对语言理解没有帮助,反而干扰了正常的听觉功能。

20世纪末期,尽管助听技术已能够越来越好地满足听障人士的需求,但是澳大利亚国家听力实验室的Davis Penn和Ross(1993)依然认为,助听器移频技术这类能够避开增益限制及无用听力频段的信号处理策略仍是填补普通助听器与电子耳蜗间空白领域的最佳方案。国内外部分研究同样显示,移频助听装置较非移频助听器能够显着地提高高频听力严重损失者的言语理解能力。

美国听力言语学会2003年发布的婴幼儿助听器验配指导方案中也明确指出:对于重度及重度以上的高频听力损失者而言,当选配传统助听器无法听到关键语音时,移频助听器将会是一个很好的选择。

3.移频技术的分类

目前的助听器移频技术可按不同的信号压缩处理模式大致分成三类:按比例移频压缩技术、线性移频压缩技术和非线性移频压缩技术。其中按比例移频压缩技术属于早期助听器移频技术,而线性移频压缩技术和非线性移频压缩技术则是新近发展的助听器移频技术,以丹麦唯听公司的Inteo系列助听器和瑞士峰力公司的“美人鱼”特大功率助听器为代表。

另外,美国EMILY公司至今一直在使用一类特殊的移频装置,该装置的统计原理是以1000~2000Hz内的声谱信息是获取语言信息至关重要的影响因素这一理论为基础而设计研发的。

在声音信号的处理过程中,EMILY移频装置首先探知拾音范围内的所有音素和能量的构成,将低于1000Hz或高于2000Hz的频带范围进行移动复制,从而使移动频率范围内的音素得以实时加强,使声音特性更易被觉察。然而由于该移频装置的临床使用数据有限,尽管该移频装置能够被助听设备所应用,但截至目前仍未能实质性地改变听障人士的聆听效果。

(1)按比例移频压缩技术

早期的移频技术是一类采用“慢放”的压缩移频技术(1994)。该类移频压缩技术类似于录音机的慢放功能,是通过电子磁带装置将语言信号几乎“实时”的按比例移动和压缩,以确保语言信号中各语素间相应频谱位置关系的稳定,同时对高频部分微弱的辅音信息作为辅音推动,最大限度地将有用的高频信号移至可以利用的低频区域。

如按比例压缩改变的仅仅是能量峰的绝对频率,保证了不同声音信号间能量关系的稳定,因此就理论而言,无高频残余听力或高频残余听力较差的助听器佩戴者是能够通过助听器识别和分辨这些压缩后的高频清辅音的。

1)按比例移频压缩技术的原理

按比例频率压缩是一类通过选择的方式处理声音信号的压缩技术,即动态言语再编码处理程序。其首先分析判定言语的声学特性,随后选定需压缩频率的声音信号,并将之压缩移向临近的低频区域,而经分析被选定不需压缩频率的声音信号则保持不变。

以英语“Sheinks instead of swimming.”频谱图为例,说明按比例移频压缩的选择特性。

2)按比例移频压缩助听器

海德助听器公司的ImpaCt和Logicom助听器就属于按比例移频压缩助听器,其清辅音的频率压缩控制范围分别为1.5~5.0倍,每0.25为一档,共15档。

这两款助听器可根据输入的言语信号进行实时数字分析,对言语的频率、振幅和时间特性进行动态调控,即在传统振幅压缩放大策略助听器的基础上,采用特有的类似于电子耳蜗语言编码的实时动态言语重新编码(dynamic speech recoding,DSR)、动态辅音推动(dynamic consonantboost,DCB)、频率压缩(frequency compression,FC)数字处理技术,以及大量标准的可编程选配参数,改善对言语理解至关重要的语言辨别能力。而对于低频音信号则采用自动增益控制(AGC)处理,促使其保持在最适阈(MCL),同时通过内置的数字音素分析器跟随言语的动态范围进行DSR调控,当言语中的高频辅音一旦被识别,DSR功能立即启动,将高频辅音信号推动到佩戴者残存的听觉动态范围之内。当然较多的频率压缩虽然可提高言语的觉察力,但会降低言语的辨别力,因此ImpaCt和Logicom采用了动态辅音推动(DCB)与频率压缩(FC)技术以期平衡言语觉察力与辨别力间的关系。

(2)线性移频压缩技术

线性移频压缩技术即可听度扩展技术(audibility extender,AE),是一类线性移频助听技术,主要是将无高频残余听力或高频残余听力较差的助听器佩戴者无法通过普通助听器听到的高频声音线性移动至仍存有一定残余听力的低频区域。

1)线性移频压缩技术的原理及处理过程

线性移频压缩技术的原理是动态整合(提供佩戴者的个人信息)助听器佩戴者的听力损失信息,判断需要移动频率的区域。其中移频开始的频率被称为起始频率(start frequency),通常AE是在起始频率上一个倍频程处进行移动的。

通过言语噪声跟踪器分析环境频谱,将分析结果反馈于动态整合系统,随后AE拾取原始倍频程区域内的最高强度频率,进行锁定移动,若该频率发生改变,移动频率也将发生相应的改变。

例如,当4000Hz处存在最高强度时,4000Hz及其附近的声音将被线性移动一个倍频程至2000Hz,而其他频率也会相应向下移动2000Hz,即3000Hz被移至1000Hz,4500Hz被移至2500Hz,移动后的信号将被置于一个可听的区域内。同时,为了避免移动后的信号所产生的掩蔽效应和其他潜在失真的影响,2000Hz倍频程外的频率将被过滤。

移动结束的言语信号将自动经AE保存,或通过手动微调对转换信号采取相应的调整。而最终的输出信号则是线性移动信号与原始信号在初始频率下的混合。

2)线性移频压缩助听器

丹麦唯听(Widex)公司2007年推出的Inteo系列助听器所采用的即为线性移频压缩的可听度扩展(AE)技术。

(3)非线性移频压缩技术

非线性移频压缩技术同样是一类将无高频残余听力或高频残余听力较差的助听器佩戴者无法通过普通助听器听到的高频声音,选择性地移动至相邻仍存有一定残余听力的低频区域并进行放大的移频压缩技术。

1)非线性移频压缩技术的原理及处理过程

非线性移频压缩技术区别于其他移频技术的是,非线性移频压缩技术在移动前,被选择的高频部分将首先通过压缩环节,以避免移动后的高频信号声与低频区域的信号发生完全重叠而影响言语的识别,通过非线性移频压缩技术处理输出的声音信号的频率范围较原始信号的频率范围更窄,而这恰恰是该技术非线性特性的体现。

需要注意的是,声音频率范围的改变仅是因为对高于分割频率(the cut‐off frequency)的声音信号采取频率压缩造成的,而压缩的程度则要保证被压缩的频率不影响低于分割频率的声音信号,以此最大限度地降低失真。

分割频率和压缩比是非线性频率压缩技术的两个关键参数。其中高分割频率(3000Hz)和高压缩比,通常仅影响最高频率的声音信号。因此,采用该类压缩参数的助听器适用于低频听力损失较轻同时高频听力损失也仅处于中度的听障人士。而采用低分割频率(1500Hz)和低压缩比时,尽管压缩程度较低,但其影响的频率范围较宽,因此,采用该类压缩参数的助听器更适合于听损频率较宽的重度听障人士。

2)非线性移频压缩助听器

瑞士峰力(Phonk)公司2008年度推出的“美人鱼”系列助听器所采用的即是被称为SoundRecover的非线性移频压缩技术。

4.移频技术存在的问题

经移频后,尽管原始声音信号波峰和波谷的时间特性以及各语素间的相对关系得到了保持,但是其能量结构确实发生了改变,因此临床中“声音不自然”、“有空洞感”、“更难以理解”常常被移频助听器佩戴者所表述。同时对于多数成年人而言,若新选配时就感觉移频的效果不佳,那么经长期训练后即使语言理解力有所提高,其主观对移频技术也是难以接受的。

移频助听器信号处理功能增强,运算过程更为复杂,因此其耗电量大,发生故障的机会可能较多。

模拟信号处理的局限性,影响佩戴者的语言理解能力,特别是早期的频率降低技术仅是简单的执行过程,无法达到有效的信号处理结果。

5.佩戴移频助听器需注意的问题

通常情况下,对于重度听力损失而言,聆听经移频处理的语言信号并非如同正常人习惯的听觉感受般舒适,特别是当助听器佩戴者听到新的或者多年没听到的声音时,人类的大脑会自动将其识别为噪音而被忽略。而临床听力工作者在选配过程中也同样会告知移频助听器佩戴者,当他们佩戴移频助听器后,势必将经历一个适应的过程,通过足够的听觉训练,利用人脑强大的适应能力和整合能力,熟悉新的听觉感觉,并将之重新组合至他们的感知系统内。

因此,在Inteo系列助听器投放市场后,丹麦唯听(Widxe)公司提出了一种被称为焦点听力训练的辅助练习模式,其目的在于促进移频助听器佩戴者接受新型的可听度扩展运算法则,进行大脑皮质功能重组。练习的内容包括:以高频清辅音/p/、/t/、/k/、/s/、/f/、/o/、/sh/为目标,以PC家庭训练项目为基础,包括10天的练习课程,前7天每天集中训练一个音素,而剩下的3天则用于复习全部的声音,这些声音可能是Inteo佩戴者在使用可听度扩展程序之前无法听到的。

5.5助听器声反馈技术

国外报告显示,约24%的助听器佩戴者认为助听器的反馈严重影响了助听器的正常使用。

特别是近年来随着开放耳助听器的出现以及人们对美锲而不舍的追求,助听器的体积越来越小,麦克风与受话器的距离也因此不断地靠近,而这部分的设计都是增加助听器声反馈发生率的原因。另外就临床而言,一半以上的助听器佩戴者的听力损失均达到了中重度,他们需要更多的增益来满足他们的聆听条件,而这恰恰意味着他们的助听器发生反馈的几率远远超过轻度听力损失的助听器佩戴者。因此,相应的控制助听器声反馈的要求也就变得日益迫切。

5.5.1助听器声反馈技术的原理

基于助听器体积的限制,助听器受话器和麦克风间的距离往往很近,因此被放大的声音信号在由受话器输出时,其中的部分能量会通过助听器通气孔或耳道壁间隙经空气传导泄露,或是通过助听器机械结构经振动传导泄露。而一旦该部分泄露的声音信号无法被声反馈路径所衰减,那么将很有可能被麦克风拾取,再次成为输入信号而被循环放大,进而引起助听器某些频率的能量出现共振,发出可听见的啸叫声。而且,即使这种反馈信号相对较弱,不易被听见,它的存在也仍会造成某种程度的声音信号失真。

总体而言,助听器声反馈的产生需满足以下条件:①麦克风和受话器位于同一声场;②受话器的输出能够通过空间传递至麦克风;③受话器的输出产生的声音能量足够强,麦克风的拾音灵敏度足够高。

5.5.2助听器声反馈产生的原因

1.耳道结构及其声学特性

解剖学认为耳道是一类特殊的声学共振腔,声音信号在经耳道传递的过程中,由于共振腔的存在,部分频率的信号会被增强,系统的频谱特性也将因此失去平坦的外观。