سمعکها در طول دهه گذشته به طور قابل توجهی پیشرفت کردهاند، عمدتاً به دلیل تکامل فناوری دیجیتال. انتظار میرود که دهه آینده شاهد تعداد بیشتری از نوآوریها در فناوری سمعک باشد و این مقاله تلاش میکند تا پیشبینی کند که در چه زمینههایی این پیشرفتها رخ خواهد داد. هم نوآوریهای تدریجی و هم نوآوریهای بنیادی در سمعکهای دیجیتال تحت تاثیر پیشرفتهای تحقیقاتی در حوزههای زیر خواهند بود:1. فناوری بیسیم،2. فناوری چیپ دیجیتال، 3. علم شنوایی، و 4. علم شناختی. فرصتها و محدودیتهای هر یک از این حوزهها مورد بحث قرار خواهد گرفت. علاوه بر این، روندهای نوظهور مانند اتصال و فردیسازی نیز به پیشرفت فناوری جدید کمک خواهند کرد و اینها در زمینههای ذکر شده مورد بحث قرار میگیرند.
طی دهه گذشته، فناوری سمعک به طور قابل توجهی پیشرفت کرده است. در سال 1996، معرفی پردازش سیگنال دیجیتال (DSP) در سمعکها، اجازه اجرای الگوریتمهای پردازش سیگنال پیشرفته را داد. در سال 2005، 93% از سمعکهای فروخته شده در ایالات متحده دارای فناوری DSP بودند و بیش از نیمی از آنها شامل میکروفونهای جهتدار بودند که بهبود قابل تأییدی در فهم گفتار در محیطهای پر سر و صدا فراهم کردند. محصولات کانال باز به دلیل حذف بازخورد و راحتی بیشتر محبوبیت یافتهاند، حتی با اینکه میزان بهره ارائه شده توسط این دستگاهها به طراحی صوتی آنها محدود است.
در اوایل دهه 1990، کمتر کسی چنین پیشرفتهایی را در صنعت سمعک پیشبینی میکرد. در آن زمان، بسیاری حتی فکر نمیکردند که فشردهسازی با دامنه دینامیکی گسترده چندباندی (WDRC) به استاندارد پردازش برای مشکلات شنوایی تبدیل شود؛ زیرا پژوهشهای زیادی قبل از سال 1990 منتشر شده بود که نشان میداد WDRC غیرضروری و شاید مضر است. میکروفونهای جهتدار، کاهش نویز و حتی اتصالات کانال باز در سمعکها توسط سال 1990 امتحان شده بود، اما با موفقیت چندانی همراه نبودند.
جنبههای شناختی
اینها جنبههای شناختی درک گفتار هستند که بر میزان توجه و تلاشی که سیستم شناختی در طول ارتباط مصرف میکند، تأثیر میگذارند. در مکالمه واقعی (در مقابل آزمایشهای استاندارد گفتار در نویز)، شنوندگان همچنین افکاری را که توسط آنچه میشنوند تولید میشوند، ایجاد میکنند، روابط بین جملات مختلف را ایجاد میکنند در حالی که زمینههای سطح بالاتر را رسم میکنند، اطلاعات را در حافظه ذخیره میکنند و درباره آنچه که قصد دارند در پاسخ به آنچه که میشنوند بگویند، فکر میکنند. به عبارت دیگر، فعالیت شناختی بیشتری در مکالمه نسبت به آزمایشهای شناخت فونم یا آزمایشهای ساده گفتار در نویز دخیل است. شکل 2، که از Sweetow و Henderson-Sabes اقتباس شده است، این وضعیت پیچیده را به صورت گرافیکی نشان میدهد. البته، شنوندگان ممکن است با انجام وظایف ثانویه در طول مکالمه، مانند خواندن منو یا رانندگی، سیستم توجه خود را بیشتر تحت فشار قرار دهند.
اما چه چیزی باعث موفقیت آنها در حال حاضر شده است؟
فناوری به اندازه کافی پیشرفت کرده تا اجرای آنها به صورت کاربردی امکانپذیر شود:
فشردهسازی چندباندی با فرم کوچک و نویز کم پیادهسازی شد؛ جهتگیری میکروفونهای جهتدار بهبود یافت و طراحی آنها به گونهای بود که امکان جابجایی بین حالتهای همهجهت و جهتدار فراهم شود تا از مسائل نویزی جلوگیری شود؛ حذف بازخورد در دستگاههای کانال باز امکان بهره بیشتر را فراهم کرد و آکوستیک بهبود یافت تا پهنای باند قابل استفاده افزایش یابد.
فنآوریهای جدید زمانی توسعه مییابند و در بازار موفق میشوند که نیازهای برآورده نشده مصرفکنندگان را رفع کنند. دادههای اخیر نشان میدهد که 71% از کاربران سمعک از سمعکهای خود رضایت کلی دارند، اما هنوز چندین حوزه مشخص وجود دارد که نیاز به بهبود دارند. دادههای رضایت مشتری از MarkeTrak VII5 نشان میدهد که نیازهای برآورده نشده فعلی که پردازش دیجیتال ممکن است بتواند به آنها رسیدگی کند، کداماند. همانطور که دیده میشود، بسیاری از حوزههای نارضایتی کاربران و بنابراین فرصتهایی برای بهبود فناوری دیجیتال وجود دارد: به عنوان مثال، پردازشی که میتواند مدیریت بهتری از نویز باد و جایگذاری بهتری از بلندی صدا فراهم کند.
نوآوریهای صنعتی به صورت تدریجی یا تغییرات رادیکالی اتفاق میافتند. نوآوریهای تدریجی به دلیل اینکه شامل پیشرفتهای طبیعی فناوری موجود هستند، پیشبینیشان آسانتر است. نوآوریهای رادیکالی به دلیل اینکه شامل مفاهیم جدیدی هستند که نمونههای فعلی ندارند، پیشبینیشان دشوارتر است. این نوآوریها اغلب به فناوریهای مخربی منجر میشوند که بازار صنعت را به کلی تغییر میدهند.
این نوع نوآوریها اغلب شامل آوردن فناوری از یک حوزه به حوزه دیگر هستند و تأثیر این فناوریهای جدید ممکن است توسط کسانی که در هر دو حوزه آگاه هستند پیشبینی شود. به عنوان مثال، معرفی پردازش سیگنال دیجیتال (DSP) و کاربرد حذف بازخورد نوآوریهای رادیکالی بودند اما میتوانستند توسط کسانی که با استفاده DSP در حوزههای غیر سمعک آشنا بودند و میتوانستند مزایای احتمالی آن برای کاربران سمعک را ببینند، پیشبینی شوند. بنابراین، اگرچه پیشبینیها درباره آینده اغلب نامطمئن هستند، پیشبینی مزایای احتمالی فناوری جدید کاملاً بیاساس نیست.
فناوری بیسیم دیجیتال
فناوری بیسیم دیجیتال بر تمامی این محدودیتها غلبه کرده و عملکرد بیشتری اضافه خواهد کرد.
مزایای فنی
فناوری بیسیم دیجیتال سیگنال با وفاداری بالاتری نسبت به سیستمهای آنالوگ منتقل میکند. در سیستمهای بیسیم آنالوگ، کیفیت سیگنال با فاصله بیشتر گیرنده از فرستنده کاهش مییابد. اما سیگنالهای دیجیتال وفاداری خود را با سازگاری بیشتری حفظ میکنند. کیفیت تا یک فاصله محدود خوب باقی میماند و سپس به شدت کاهش مییابد. این فاصله به عنوان فاصله قابلیت استفاده شناخته میشود که در آن کاربران میتوانند مطمئن باشند که صدای دریافتی آنها بدون افت کیفیت و نویز است. این ویژگی فناوری بیسیم دیجیتال تا حدی به دلیل کدگذاری تصحیح خطا است، تکنیکی که خطاهای رخ داده در دادههای بیسیم را تشخیص داده و آنها را تصحیح میکند. طرحهای کدگذاری دیجیتال نیز مقاومتر در برابر تداخل سیگنالهای الکترومغناطیسی و تداخل از سایر دستگاههای بیسیم موجود در منطقه هستند.
تعداد زیادی از شرکتها که فناوری بیسیم دیجیتال را توسعه میدهند. بیش از 5000 شرکت برای ایجاد محصولات بلوتوث ثبتنام کردهاند به توسعه این فناوری کمک کرده و هزینه و اندازه آن را کاهش میدهند. فناوری بیسیم دیجیتال از لحاظ توان و اندازه کمتر از همتایان آنالوگ خود است که این امر کاربرد آن در سمعکها را بهبود میبخشد.
اتصال
در آینده، سمعکها به صورت بیسیم به مجموعه وسیعی از محصولات صوتی متصل خواهند شد. این امکان به دلیل فراگیر شدن فناوری بیسیم دیجیتال در لوازم الکترونیکی مصرفی فراهم میشود. تعداد فزایندهای از محصولات با قابلیتهای بیسیم تولید میشوند. مهمتر از همه، محصولات صوتی که کاربران سمعک میخواهند به آنها گوش دهند، با فناوری بیسیم دیجیتال جاسازی شده در محصول تولید میشوند، که اتصال به سمعکها را بیسیم آسانتر میکند. اگر تلویزیونی به عنوان مثال صدای خود را بیسیم منتقل میکند، یک گیرنده بیسیم میتواند به سمعک اضافه شود تا کاربر سمعک بتواند به صدای تلویزیون گوش دهد که تحت تأثیر بازتاب اتاق قرار نمیگیرد و نگران مزاحمت برای دیگران با صدای بلند تلویزیون نباشد.
توسعههای بیسیم به تنهایی همچنان اتصال را برای کاربران سمعک آسان نمیکند اگر هر دستگاهی با فناوری متفاوتی صدا را منتقل کند. با این حال، بلوتوث به عنوان یک استاندارد پذیرفته شده است که تولیدکنندگان موافقت کردهاند از آن استفاده کنند هنگام انتقال دیجیتال صدای خود. این امر به سایر محصولات با گیرنده بلوتوث اجازه میدهد تا صدای منتقل شده را دریافت کرده و بدون نیاز به طراحی خاص پخش کنند. یک گیرنده بلوتوث در یا متصل به یک سمعک میتواند صدا را از انواع منابع صوتی دریافت کند: تلویزیونها، رادیوها، تلفنهای همراه، پخش کنندههای MP3. استفاده از بلوتوث برای سیستمهای پخش عمومی به عنوان جایگزینی برای سیستمهای حلقهای نیز پیشنهاد شده است.
شرکتهای تولیدکننده سمعک اکنون لوازم جانبی بلوتوثی را ایجاد میکنند که به ورودی صوتی مستقیم سمعکهای پشت گوش (BTE) متصل میشود. این لوازم جانبی لینک بیسیمی بین سمعکها و تلفنهای همراه فراهم میکنند که به این ترتیب صدای تلفن همراه به طور مستقیم به سمعک منتقل میشود. آنها همچنین صدای کاربر سمعک را دریافت کرده و آن را به تلفن همراه منتقل میکنند. این لوازم جانبی اساساً سمعک را به یک هدفون هندزفری تلفن همراه تبدیل میکنند. میکروفون بیسیمی که توسط همکار کاربر سمعک پوشیده میشود نیز میتواند صدای او را مستقیماً به سمعک منتقل کند. با این فناوری، نسبت صدای گوینده به نویز پسزمینه به مراتب بهتر از نسبت بهبود یافته توسط میکروفون جهتدار در یک سمعک بهبود مییابد. همانطور که سمعکها به تعداد بیشتری از دستگاهها به صورت بیسیم متصل میشوند، کنترل اتصال به یک مسئله مهم تبدیل خواهد شد. توسعه رابط کاربری و طراحیهای قابلیت استفاده به جنبههای فزایندهای از سمعکها تبدیل خواهند شد.
این اتصال به محصولات صوتی تنها آغاز مزایای جدیدی خواهد بود که فناوری بیسیم دیجیتال فراهم خواهد کرد. پروتکل بلوتوث اتصال را نه تنها برای صدا بلکه برای دادههای غیرصوتی مانند سیگنالهای کنترل فراهم میکند. وقتی بلوتوث برای گوش دادن به تلفن همراه استفاده میشود، سیگنال دیجیتال بیسیم صدا را بین تلفن و هدفون به جلو و عقب منتقل میکند و همچنین دستورات مانند کنترل حجم صدا، پاسخ، بیصدا و قطع را منتقل میکند. این قابلیت به سمعکها اجازه میدهد تا سایر محصولات را با کنترلهای کاربری روی سمعک کنترل کنند.
در زمینه الکترونیک مصرفی، سیمهایی که در حال حاضر برای انتقال دادهها و سیگنالهای کنترل بین محصولات استفاده میشوند، در نهایت با فناوری بیسیم جایگزین خواهند شد: انتقال تصاویر از دوربین دیجیتال به رایانه شخصی یا انتقال صدا از پخشکننده DVD به بلندگوها. بلوتوث قبلاً برای جایگزینی کابلهای برنامهریزی که برای برنامهریزی سمعکها استفاده میشدند، استفاده شده است و برنامههای جدیدی توسعه خواهند یافت که مزایای جدیدی برای کاربران سمعک و شنواییشناسان فراهم میکنند.
یانز آیندهای را توصیف کرد که در آن تمامی منابع صوتی به صورت بیسیم با یک سمعک ارتباط برقرار میکنند و پیشنهاد کرد که تبدیل متن به گفتار میتواند در رایانهها برای ارسال ایمیل به صورت بیسیم به سمعکها استفاده شود. به وضوح، اتصال بین سمعک و بسیاری از دستگاهها به یک اصل تبدیل خواهد شد. استفاده از استاندارد بلوتوث برای اتصال بیسیم باعث ایجاد بسیاری از امکانات برای تعامل بین سمعکها و محصولات صوتی یا حتی محصولات غیرصوتی خواهد شد.
ارتباط بیسیم گوش به گوش ارتباط بیسیم گوش به گوش توصیف کننده وضعیتی است که سمعکهای چپ و راست یک کاربر دارای سمعک دوطرفه به صورت بیسیم با یکدیگر ارتباط برقرار میکنند. این قابلیت اخیراً به صنعت معرفی شده است، هرچند با نرخ داده پایین 315 بیت در ثانیه. برنامههای فعلی برای این ارتباط شامل هماهنگی کنترلهای حجم چپ و راست و چند عملکرد پایه دیگر است.
با افزایش نرخ داده بیسیم، امکانات بیشتری قابل اجرا خواهد بود. در نهایت، یک جفت سمعک به عنوان یک سیستم واحد به جای دو سمعک جداگانه در نظر گرفته خواهد شد. با اتصال گوش به گوش، هر عملکردی در سمعکها میتواند هماهنگ شود. پردازش نیز میتواند بین سمعکها به اشتراک گذاشته شود تا محدودیتهای چیپ DSP را غلبه کند، جایی که الگوریتمها تنها در یک سمعک محاسبه میشوند و نتایج با دیگری به اشتراک گذاشته میشوند به جای اینکه الگوریتمها به طور مستقل در هر دو سمعک محاسبه شوند. با این روش، محاسبات بین سمعکها به اشتراک گذاشته میشوند، که محدودیتهای محاسباتی در هر چیپ سمعک را غلبه میکند. البته عیب این روش این است که دو سمعک به یکدیگر وابسته هستند و زمانی که یکی از آنها غایب است، عملکرد خوبی ندارند.
وقتی نرخ دادهها برای ارتباط گوش به گوش به اندازه کافی افزایش یابد تا صدا بین آنها منتقل شود (نیاز به نرخ دهها هزار بیت در ثانیه به جای صدها بیت در ثانیه فعلی)، فهم گفتار در نویز میتواند با استفاده از تکنیکهای پرتوافکنی بهبود یابد. در سادهترین سطح، سیگنال از هر دو سمعک میتواند با هم اضافه شود تا نسبت سیگنال به نویز برای یک سیگنال هدف در جلوی کاربر بهبود یابد. همچنین با خطچین، یک الگوی جهتدار که توسط میکروفونهای جهتدار فعلی بهدست آمده است برای مقایسه نشان داده شده است.
الگوریتمهای پیچیدهتر الگوریتمهای پیچیدهتر مانند پرتوگیری تطبیقی و جداسازی منبع کور احتمالاً در زمانی که انتقال صوتی گوش به گوش با نرخ داده بالا صورت میگیرد، اعمال خواهند شد و چالش در کاربرد این الگوریتمها این است که اطمینان حاصل شود که فهم گفتار بهبود مییابد بدون اینکه کیفیت صدا قربانی شود. ادراک دوگوشی بهبود یافته به یک تمرکز صنعتی تبدیل خواهد شد زمانی که ارتباط گوش به گوش بالغ شود. با فشردهسازی چندباندی، کاهش نویز، و سایر الگوریتمهای تطبیقی که به طور مستقل در دو گوش عمل میکنند، این امکان وجود دارد که نشانههای دوگوشی توسط سمعکها تحریف شوند. ارتباط بیسیم بین سمعکها امکان الگوریتمهایی را فراهم میکند که تلاش میکنند ادراک دوگوشی را به حالت عادی بازگردانند. تا به امروز، چیز کمی در مورد اثر سمعکهای مستقل بر پدیدههای دوگوشی مانند موقعیتیابی و رهایی مکانی از پوشش نویز شناخته شده است. این اثرات در ادامه این مقاله مورد بحث قرار خواهند گرفت، اما ارتباط بیسیم گوش به گوش میتواند مکانیسمی برای رسیدگی به هر تعامل بین سمعکها و ادراک دوگوشی فراهم کند با تلاش برای حفظ نشانههای دوگوشی با پردازش هماهنگ بین گوشها.
محدودیتها
دلیل اینکه فناوری بیسیم دیجیتال در هر سمعک امروزی وجود ندارد، مصرف برق است. در حال حاضر، یک چیپ بلوتوث بیش از 30 میلیوات برای انتقال و دریافت صدا نیاز دارد. بیشتر سمعکها به طور کل کمتر از 1 میلیوات برق نیاز دارند، بنابراین افزودن یک چیپ بلوتوث مصرف برق را به شدت افزایش داده و عمر باتری سمعک را کاهش میدهد. تا زمانی که این مشکل برق حل نشود، احتمالاً چیپهای بلوتوث به عنوان یک جزء در سمعکها اضافه نخواهند شد. یانز یک راهحل موقت پیشنهاد داد که یک دستگاه رله همهمنظوره با یک باتری بزرگ که نزدیک سمعک قرار میگیرد، سیگنالهای بلوتوث را دریافت کرده و سپس آنها را با استفاده از یک فناوری بیسیم که کمتر از بلوتوث برق مصرف میکند، به سمعک منتقل میکند. این راهحل مصرف برق کمتر سمعک را با نیاز به یک لوازم جانبی مبادله میکند، اما اتصال گستردهای که قبلاً توصیف شد را فراهم میکند اگر قابلیت استفاده به طور ساده طراحی شده باشد.
با ادامه طراحی چیپهای بیسیم دیجیتال به شکل کوچکتر و با مصرف برق کمتر، این محدودیتها ناپدید خواهند شد و احتمالاً اکثر سمعکها دارای گیرندههای بیسیم جاسازی شده خواهند بود به همان روشی که امروزه اکثر سمعکها دارای DSP هستند. زمانی که این اتفاق بیفتد، سمعکها شامل الگوریتمهای گوش به گوش جدید خواهند شد و به تقریباً هر منبع صوتی که کاربر میخواهد گوش دهد متصل خواهند شد. چالش مهندسی این خواهد بود که اتصال به این منابع را برای کاربر سمعک به آسانی ممکن سازند.
پردازش سیگنال دیجیتال (DSP) صنعت پردازش سیگنال دیجیتال (DSP) در صنعت سمعک به بلوغ رسیده است. بیشتر سمعکها مجموعهای مشابه از الگوریتمهای DSP را شامل فشردهسازی چندبانده، کاهش نویز، لغو بازخورد، پردازش جهتدار و طبقهبندی محیط دارند. بسیاری از رهبران فکری در صنعت گفتهاند که توسعه تراشههای DSP از ایدههای صنعت برای کاربرد آنها پیشی گرفته است (یعنی تراشههای DSP در سمعکها اکنون قابلیتهای بیشتری از آنچه شرکتها میدانند با آنها انجام دهند، دارند) و نباید انتظار داشت توسعه بیشتری در عملکرد DSP در آینده داشته باشد. در واقع، خلاف آن درست است. هر شرکت بزرگ سمعک تلاش زیادی میکند تا پردازش سیگنالی را که میخواهد ارائه دهد در قابلیتهای محدود تراشههای DSP سمعک جا دهد. در انجام این کار، آنها اغلب الگوریتمها را ساده میکنند و آنها را کمتر پیچیده از آنچه مهندس برنامهریزی کرده بود، میکنند تا کد الگوریتم در سیکلهای ساعت و حافظه محدود تراشههای DSP جا بگیرد. این کمی شبیه به کاهش گرافیک در یک بازی کامپیوتری است زیرا کارت ویدیو یا واحد پردازش مرکزی به اندازه کافی قدرتمند نیستند تا همه ویژگیهای سهبعدی که نرمافزار میتواند ارائه دهد را مدیریت کند—عملکرد اساسی وجود دارد، اما تجربه تقریباً به خوبی آنچه میتواند باشد اگر سختافزار قویتر باشد، نیست. برای حفظ جریان فعلی زیر ۱ میلیآمپر، تراشههای DSP در سمعکها سرعت ساعت خود را تنها به چند مگاهرتز میرسانند، در حالی که DSPهای عمومی مورد استفاده در الکترونیک مصرفی میتوانند در صدها و هزاران مگاهرتز اجرا شوند. حافظه برنامهنویسی و داده در تراشههای DSP سمعک نیز به چند ده هزار کلمه حافظه دسترسی تصادفی (RAM) محدود میشود، در مقایسه با صدها هزار یا حتی میلیونها کلمه RAM در DSPهای عمومی. به دلیل این محدودیتهای سختافزاری، الگوریتمهای موجود در سمعکها ساده شدهاند تا همه بتوانند بر روی یک تراشه DSP واحد اجرا شوند و در حافظه آن جای بگیرند. محدودیتهای فعلی تراشههای DSP سمعک همچنین معرفی انواع جدید الگوریتمهایی را که میتوانند بر روی DSPهای تجاری قدرتمندتر اجرا شوند اما بر روی DSPهای سمعک نمیتوانند، محدود میکند. این حقایق دو چیز را برای آینده معنی میدهد: (1) الگوریتمهای فعلی سمعک با گذشت زمان بهبود خواهند یافت زیرا تراشههای DSP سمعک قدرتمندتر میشوند، و (2) الگوریتمهایی که در صنعت سمعک دیده نشدهاند، معرفی خواهند شد وقتی تراشههای DSP سمعک قادر به اجرای آنها شوند. محدودیت در آنچه سمعکها میتوانند انجام دهند در فناوری تراشه نهفته است، نه در دانش آنچه میتوان با آنها انجام داد. در این صورت، چه نوآوریهایی در الگوریتمهای DSP در آینده انتظار میرود؟
الگوریتمهای پردازش سیگنال دیجیتال (DSP) الگوریتمهای بهبود یافته الگوریتمهای موجود در سمعکها با افزایش قابلیتهای DSP و با یادگیری بیشتر درباره سودمندی الگوریتمهای فعلی بهبود و بهینهسازی خواهند شد. بهعنوان مثال، کاهش نویز را در نظر بگیرید. صنعت مخابرات نمونهای از نحوه بهبود کاهش نویز و افزایش گفتار در سمعکها ارائه میدهد؛ تلفنهای همراه دارای الگوریتمهای کاهش نویز بسیار پیچیدهتر هستند زیرا تراشههای DSP قویتری دارند. در حالی که الگوریتمهای کاهش نویز سمعکهای فعلی به آمارهای پاکت و طبقهبندیکنندههای محیطی ساده متکی هستند، الگوریتمهای پیشرفتهتر در زمینههای دیگر از مدلهای تولید گفتار در قالب کدگذاری پیشبینی خطی و فیلترینگ سپستری بهعنوان بخشی از سیستمهای تشخیص گفتار و کاهش نویز استفاده میکنند. اگرچه این الگوریتمها درک گفتار را نسبت به سیگنال غیرپردازشی افزایش نمیدهند، ممکن است کیفیت صدا را نسبت به الگوریتمهای کاهش نویز سمعکهای فعلی بهبود بخشند. با افزایش سرعت و حافظه تراشههای سمعک، نسخههای پیچیدهتری از الگوریتمهای فعلی سمعک توسط شرکتهای سمعک توسعه خواهند یافت، از طریق توسعه داخلی یا ترجمه تحقیقات انجامشده در دانشگاهها و صنایع دیگر، و مزایای بیشتری به کاربر سمعک ارائه خواهند داد.
الگوریتمهای جدید با افزایش قابلیتهای تراشههای DSP، الگوریتمهای جدید و پیچیدهتری نیز معرفی خواهند شد. بسیاری از این الگوریتمهای جدید از سایر صنایع که پردازش صدا انجام میدهند، قرض گرفته خواهند شد زیرا آنها سالها با تراشههای قدرتمندتر برای توسعه و بهینهسازی طرحهای پردازشی خود کار کردهاند. بهعنوان مثال، صنعت ضبط موسیقی دارای الگوریتمهای پردازش صوتی پیشرفته برای فشردهسازی، تغییر زیر و بم و دیگر اثرات است که توسط شنوندگان بسیار منتقد بهینهسازی شدهاند. با این حال، بیشتر این الگوریتمها از صنایع دیگر به مقدار زیادی کار نیاز دارند تا برای استفاده در سمعکها اصلاح شوند.
الگوریتمهای پردازش سیگنال دیجیتال (DSP) ابتدا، همانطور که قبلاً گفته شد، سمعکها همیشه قابلیتهای پردازش سیگنال دیجیتال (DSP) کمتری نسبت به محصولات دیگر دارند که محدودیتهای اندازه و قدرت مشابهی ندارند. این بدان معناست که هنوز کار زیادی برای سادهسازی الگوریتمها و ادغام آنها با الگوریتمهای موجود سمعک وجود دارد. علاوه بر این، تراشههای DSP سمعک از نمایش ثابت 16 بیتی دادهها استفاده میکنند، در حالی که بسیاری از زمینههای صوتی دیگر از نمایش نقطه شناور 32 بیتی استفاده میکنند. پردازش سیگنالهای 16 بیتی نیاز به قدرت کمتری دارد اما همچنین میتواند بیشتر در معرض خطاهای گرد کردن و مسائل دامنه دینامیک باشد، بنابراین ترجمه کد 32 بیتی به کد 16 بیتی در حالی که اطمینان از حداقل خطاهای محاسباتی میتواند فرآیندی زمانبر باشد. دوم، بیشتر صنایع صوتی دارای انواع بسیار خاصی از صدا هستند که پردازش میکنند. صنعت مخابرات معمولاً گفتار را با نسبتهای سیگنال به نویز بالا پردازش میکند؛ صنعت موسیقی فقط صدا و آلات موسیقی را پردازش میکند که اغلب به صورت جداگانه در ترکها قرار گرفتهاند؛ صنعت کنفرانس تلفنی فقط صداهایی را که در اتاقهای کنفرانس وجود دارد، مانند گفتار و نویز تهویه هوا، پردازش میکند. با این حال، سمعکها باید بتوانند همه صداهای ممکن را با حداقل تغییر و کیفیت خوب پردازش کنند تا کسی که تمام روز گوش میدهد، بتواند آنها را بشنود. به عبارت دیگر، آنها باید بتوانند هر صدا و هر صدایی را در همه ترکیبهای ممکن پردازش کنند. الگوریتمهایی که فقط برای هدستها در دفتر طراحی شدهاند نمیتوانند بهسادگی به یک سمعک منتقل شوند بدون تغییرات جدی برای اطمینان از اینکه در همه شرایطی که ممکن است کاربر سمعک تجربه کند، کار میکنند. مشتریان تلفنهای همراه خود را پس نمیدهند زیرا صدای چنگال روی بشقاب به درستی پردازش نشده است، اما کاربران سمعک این کار را خواهند کرد. سوم، الگوریتمهای موجود در صنایع دیگر برای شنوندگان با شنوایی طبیعی طراحی شدهاند. اگر و چگونه باید برای گوش دادن توسط افراد دارای نقص شنوایی تغییر داده شوند، ناشناخته است. فیلترهای شنوایی وسیعتر، رشد بلندی و تغییرات در عملکرد ماسکینگ پیشرو ممکن است باعث شود که شنوندگان دارای نقص شنوایی طراحیهای پردازشی مختلفی را نسبت به آنهایی که برای شنوندگان با شنوایی طبیعی بهینهسازی شدهاند، ترجیح دهند. تعامل الگوریتمهای جدید با سایر الگوریتمهای سمعک مانند فشردهسازی چندبانده نیز باید به دقت بررسی شود تا اطمینان حاصل شود که الگوریتمها با هم بهخوبی کار میکنند.
سیستمهای هوشمند در سمعکها سمعکهای امروزی دارای ویژگیهای خودکار بسیاری هستند: روشن و خاموش کردن جهتدهی و کاهش نویز، طبقهبندی محیط کاربر (مثلاً ماشین، رستوران پر سر و صدا یا دفتر آرام) و تنظیمات سمعک. این اتوماسیون به تکامل ادامه خواهد داد، اما یادگیری نیز به سمعکها اضافه خواهد شد و آنها را “هوشمند” خواهد کرد. الگوریتمهای تطبیقی فعلی در سمعکها نباید بهعنوان هوشمند طبقهبندی شوند زیرا فاقد یادگیری هستند، که توانایی بهبود رفتار در طول زمان در پاسخ به اطلاعات حسگر است. تکنیکهایی مانند شبکههای عصبی، منطق فازی و الگوریتمهای ژنتیک به طور گستردهای در دانشگاهها برای استفاده در سیستمهایی که رفتار را یاد میگیرند و نحوه کار خود را بهطور بهینه تغییر میدهند، مورد تحقیق قرار گرفتهاند و باید انتظار داشته باشیم که در صنعت سمعک ظهور کنند. یکی از کاربردهای سیستمهای هوشمند کمک به تطبیقهای فردی است. تنظیم صحیح پارامترهای یک سمعک توسط شنواییشناس یا متخصص ابزار شنوایی به نیازهای کاربر سمعک برای موفقیت سمعک حیاتی است، و اکثر تطبیقها نیاز به چندین بازدید از مطب برای تنظیم صحیح پارامترها دارند. یک سیستم هوشمند میتواند مقدار زمان لازم برای تنظیم سمعک را کاهش دهد با اجازه دادن به تنظیم خودکار خارج از دفتر کلینیک. علاوه بر این، همه توزیعکنندگان در ارائه بهترین تنظیمات سمعک برای نیازهای بیماران خود مهارت ندارند، و گاهی اوقات بیماران به دلیل تطبیق نامناسب از مزیت کامل سمعکهای خود بهرهمند نمیشوند. یک سمعک که میتواند بهطور خودکار نحوه کار خود را در طول زمان تغییر دهد تا به بهتر شدن نیازهای کاربر سمعک پاسخ دهد، به آن دسته از بیماران که توسط یک تطبیقدهنده خبره تطبیق نشدهاند، سود میرساند. چالش با پیادهسازی سیستمهای هوشمند در سمعکها این است که اطمینان حاصل شود که سیستم بهطور بهینه تطبیق میکند تا پردازش صدا برای کاربر سمعک بهبود یابد.
سیستمهای هوشمند و علم شنوایی در سمعکها
سیستمهای هوشمند دورانت و همکاران21 یک الگوریتم ژنتیکی پیادهسازی کردند که پارامترهای یک لغو کننده بازخورد در سمعک را تنظیم میکرد تا عملکرد لغو کننده بازخورد در طول زمان بهبود یابد. الگوریتم ژنتیکی نیاز داشت که کاربر کیفیت صدای سمعک را با تنظیمات پارامترهای مختلف ارزیابی کند و الگوریتم از پاسخهای شنونده برای تنظیم و بهبود مداوم لغو کننده بازخورد و کیفیت صدای نتیجهگیری استفاده میکرد. میتوان تصور کرد که این رویکرد به بسیاری از جنبههای استفاده از سمعک اعمال شود. چنین سیستمی باید به گونهای طراحی شود که استفاده از آن آسان باشد و اطمینان حاصل کند که سمعک بهبود مییابد و بهطور اشتباه بدتر نمیشود. یک کاربرد ساده از این ایده اخیراً با کنترلهای حجم “قابل آموزش” معرفی شده است که نحوه استفاده کاربران از کنترل حجم خود را نظارت و یاد میگیرد و سپس تنظیم حجم اصلی را به سطح ترجیحی کاربر تنظیم میکند.
علم شنوایی علم ادراک شنوایی یک زمینه بالغ است، همانطور که فهم ما از روانشناسی شنوایی نقص شنوایی نیز بالغ است. تعجبآور است که تحقیق کمی در این زمینهها به طراحی سمعک و تنظیم سمعک کمک کرده است. شاخص گفتار برای بهینهسازی شنیدن گفتار استفاده شده است و دادههای رشد بلندی به طراحی و تنظیم فشردهسازی چند بانده منجر شده است. تلاشها برای طراحی دیگر الگوریتمهای سمعک براساس روانشناسی شنوایی نقص شنوایی، مانند کاربرد تقویت کنتراست طیفی برای جبران فیلترهای شنوایی گستردهتر افراد نقص شنوایی، موفق نبوده است. در آینده، شاهد کاربرد موفقیتآمیز علم شنوایی به نوآوریهای فناوری DSP خواهیم بود، اما بیشتر پیشرفتها نیاز به توسعه یکپارچه تشخیصهای جدید، پردازش سیگنال و معیارهای اعتبارسنجی خواهد داشت. کاربرد مستقیم علم شنوایی به فناوری دیجیتال جدید در آینده کاربرد مدلهای شنوایی به پردازش سیگنال سمعک خواهد بود.
مدلهای شنوایی در سمعکها
مدلهای شنوایی مدلهای شنوایی بهطور موفقیتآمیز در انواع برنامههای پردازش صوتی استفاده شدهاند، مثلاً در vocoderهای ادراکی مانند MP323 و بهعنوان جبهههای ورودی برای سیستمهای شناسایی خودکار گفتار. فشردهسازی چندبانده، در واقع، بر اساس یک مدل عملکرد حلزون گوش است حتی اگر اغلب بهعنوان صرفاً وسیلهای برای حفظ شنیداری در حالی که سطوح بلندی راحتی را حفظ میکند، در نظر گرفته میشود. الگوریتمهای جدید سمعک بر اساس مدلهای عملکرد شنوایی سطح بالا و پایین طراحی شدهاند. اعمال مدلهای شنوایی به پردازش سمعکها منطقی به نظر میرسد با توجه به اینکه سمعکها سعی میکنند تغییرات در عملکرد شنوایی را جبران کنند. مدلهای شنوایی یکی از روشها برای درک عملکرد شنوایی عادی و نقص شنوایی هستند و قطعاً روشن میکنند که پردازش چگونه میتواند تفاوت را جبران کند. مدلهای شنوایی ممکن است به الگوریتمهایی که مرتبط با نقص شنوایی نیستند نیز کمک کنند و بررسی این کاربردها را میتوان در Kollmeier یافت. انسانها میتوانند منابع صدا و محیطها را با دقت بیشتری نسبت به سیستمهای مبتنی بر کامپیوتر تشخیص دهند؛ مدلسازی نحوه پردازش صدای سیستم شنوایی انسانی ممکن است بینشی به بهترین رویکرد برای طراحی شناسایی منابع صدا و طبقهبندی محیط مبتنی بر DSP ارائه دهد. اعمال مدلهای شنوایی پیچیده به سمعکها تاکنون توسط محدودیتهای محاسباتی تراشههای DSP سمعکها جلوگیری شده است. با این حال، با قویتر شدن این تراشههای DSP، امکان اعمال مدلهای شنوایی واقعبینانهتر میشود. مدلهایی که ممکن است هنگام پیادهسازی در سمعکها مفید باشند شامل مدلهای حلزونی هستند که پهنای باند فیلترهای وابسته به سطح و کاهش با وضوح معادل به فیلترهای حلزون گوش را شبیهسازی میکنند، مدلهای فیلتر بانکی مدولاسیون که ادراک پاکتها در مناطق فرکانس مختلف را نشان میدهند، و مدلهای طیفی-زمانی که نشان میدهند چگونه ویژگیهای پیچیده را ادراک میکنیم. چنین مدلهای شنوایی از دادههای ادراکی و فیزیولوژیک درباره نحوه ادراک صدا استخراج شدهاند. تا جایی که این مدلها میتوانند تغییر داده شوند تا ادراک شنوایی توسط افراد دارای نقص شنوایی را منعکس کنند، ممکن است طراحی سمعک را با مدلسازی تغییرات ادراک از دست دادن خاص هر فرد بهبود بخشند.
مدلهای شنوایی و شخصیسازی در سمعکها
مدلهای شنوایی باندی و همکاران34 این رویکرد را برای استخراج نسخه بهینه افزایش خطی برای یک آودیگرام خاص به کار بردند. از یک مدل حلزون و عصب شنوایی برای تعیین پاسخ عصب شنوایی به گفتار برای یک سیستم شنوایی طبیعی و سیستمهای شنوایی دارای نقص با مقادیر مختلف نقص شنوایی استفاده شد. باندی و همکاران پارامترهای الگوریتم تطبیق افزایش خطی را محاسبه کردند که مدل پاسخ عصب شنوایی سیستمهای دارای نقص را به نزدیکترین شکل ممکن به پاسخ طبیعی برساند. نسخه تطبیقی که از این رویکرد مبتنی بر مدل به دست آمد مشابه نسخه تطبیقی بازنگری شده آزمایشگاههای ملی آکوستیک (NAL-R) بود، که بر اساس معیار تساوی شدت گفتار در تمام زیر باندهای فرکانسی استخراج شده بود. نتایج باندی و همکاران حمایت اضافی برای رویکرد NAL-R ارائه میدهد و همچنین نشان میدهد که مدلهای شنوایی میتوانند برای بهینهسازی عملکرد سمعک استفاده شوند. استفاده از یک مدل شنوایی همچنین توضیح اضافی برای اینکه چرا الگوریتم تطبیقی NAL-R موفق بوده است ارائه میدهد: افزایش که شدت صدا را در باندها در سطح راحتترین شدت (MCL) برابر میکند، همچنین آن را که پاسخ عصب شنوایی سیستم دارای نقص را به پاسخ سیستم شنوایی غیرنقص دار نزدیکترین میکند. اگرچه این کاربرد نیاز به اجرای مدل بر روی تراشه DSP سمعک نداشت زیرا کاربرد آن یک الگوریتم تطبیق بود، میتوان تصور کرد که از همان مدل برای تعیین پردازش صحیح سمعک بهطور لحظهای در خود سمعک استفاده شود. بهعنوان مثال دیگر، کارنی و همکاران36 یک استراتژی پردازش سیگنال طراحی کردند که تغییر در پاسخ فازی حلزون گوش ناشی از نقص شنوایی را جبران میکند. پاسخهای فازی لحظهای یک حلزون سالم و یک حلزون دارای نقص مدلسازی شد و سپس تفاوت در فاز به سیگنال اعمال شد تا پاسخ فازی طبیعی به شنونده دارای نقص شنوایی بازگردانده شود. نتایج محدود نشان داد که درک گفتار و کیفیت صدا در برخی از افراد بهبود یافت. هر دو این رویکردها مشابه استراتژی کلی توصیف شده توسط ادواردز 37 هستند که پیشنهاد داد پردازش سمعک باید معیارهای روانآکوستیکی و فیزیولوژیکی سیستم شنوایی دارای نقص را به حالت طبیعی بازگرداند. مدلهای دقیق عملکرد شنوایی طبیعی و نقص دار میتوانند برای تسهیل این رویکرد استفاده شوند.
شخصیسازی فناوری سمعک با تغییر رویکرد صنعت به پاتولوژیها و نیازهای بیماران دارای نقص شنوایی تغییر خواهد کرد. صنعت بیوتکنولوژی در یک انتقال مشابه در رویکرد خود به بیماری، تشخیص و درمان قرار دارد، و جدول 2 از جدولی که توسط یک تحلیلگر صنعت بیوتکنولوژی ایجاد شده است، اقتباس شده است. ستون چپ در جدول 2 شناسایی میکند که بیماران سمعک تا کنون چگونه مورد توجه قرار گرفتهاند و ستون راست شناسایی میکند که این رویکرد در آینده چگونه تغییر خواهد کرد.
مدلهای شنوایی و شخصیسازی در سمعکها
مدلهای شنوایی ورودی اول در جدول 2 نشان میدهد که نقص شنوایی کمتر توسط معیارهای تشخیصی مانند آودیگرام تعریف خواهد شد و بیشتر توسط مکانیزم نقص تعریف خواهد شد. امروزه، سمعکها عمدتاً بر اساس آودیگرام کاربر سمعک تنظیم میشوند، در حالی که طبیعت نقص شنوایی هر فرد پیچیدهتر از این توصیف ساده است. آستانههای تن خالص نمیتوانند تشخیص دهند که آیا یک نقص شنوایی حسی-عصبی ناشی از آسیب به سلولهای مویی خارجی، سلولهای مویی داخلی یا ترکیبی از هر دو است. بهطور کلی، گفته میشود که نقص شنوایی تا حدود 60 دسیبل HL ناشی از از دست دادن سلولهای مویی خارجی است و سطوح بالاتر از دست دادن ناشی از آسیب بیشتر به سلولهای مویی داخلی است. احتمال زیاد دارد که حتی نقصهای زیر 60 دسیبل HL نیز شامل ترکیبی از آسیب به سلولهای مویی داخلی و خارجی باشد. مکانیزمهای اضافی نقص شنوایی شامل تغییرات در پتانسیل اندوکوکلئار است. اشمیدت و همکاران40 پیشنهاد دادهاند که پیرگوشی ممکن است ناشی از آسیب به دیواره جانبی حلزون گوش باشد و ولتاژ درون حلزون را کاهش داده و عملکرد سلولهای مویی را تغییر دهد. در این حالت، سلولهای مویی آسیب ندیدهاند، فقط در عملکرد تغییر کردهاند، و تقویت صدا باعث نمیشود عصبهای شنوایی با همان سطحی که با یک حلزون سالم یا یک حلزون دارای نقص سلولهای مویی داخلی یا خارجی پاسخ میدادند، پاسخ دهند. بهوضوح، برای درمان بهترین نقص شنوایی بیماران، فیزیولوژی نقص شنوایی آنها باید فهمیده شود. برای انجام این کار، نیاز به روشهای تشخیصی اضافی است که از آنها میتوان مکانیزم نقص شنوایی را تخمین زد. بهعنوان مثال، میزان فشردهسازی در یک منطقه فرکانسی خاص میتواند با استفاده از تکنیک آستانه ماسک شده تخمین زده شود، که ممکن است اطلاعاتی درباره سلامتی سلولهای مویی خارجی در آن منطقه فرکانسی فراهم کند. انتشارهای صوتی خود به خود (OAEs) نیز نشان داده شدهاند که با فشردهسازی مرتبط هستند، جایی که رشد انتشارهای صوتی با افزایش سطح محرک با رشد بلندی با سطح محرک مطابقت داشت. زیرا شیب عملکرد رشد بلندی فرض شده است که با وضعیت سلامتی سلولهای مویی خارجی مرتبط است، این اندازهگیری پاسخ OAE نیز ممکن است در تخمین فشردهسازی باقیمانده مفید باشد. چنین اطلاعاتی میتواند برای تغییر پردازش سیگنال سمعک یا طراحی الگوریتمهای جدید بر اساس درک بهتر از مکانیزم نقص شنوایی یک فرد استفاده شود. البته، این فقط برای نقصهای کمتر شدید کار خواهد کرد که انتشارهای صوتی را میتوان اندازهگیری کرد.
تفاوتهای فردی در درمان شنوایی
این تفاوتهای فردی ممکن است نیازمند درمانهای متفاوتی برای اختلالات شنوایی باشند، همانطور که در سومین ورودی جدول 2 نشان داده شده است. میتوان از فناوریهای مختلف سمعک و تنظیمات ویژگیهای مختلف استفاده کرد که با بهتر درک کردن تفاوتهای فردی بیماران و نیازهای مربوطهی آنها میسر میشود. به عنوان مثال، یافتهها نشان دادهاند که نمرات تست هوش با بهبود درک گفتار از فشردهسازی سریع زمان به طور مثبت همبستگی دارند، و این نشان میدهد که ممکن است زمانهای متفاوت فشردهسازی برای بیماران با تواناییهای شناختی مختلف تجویز شود.
استفادهی گسترده از رایانههای خانگی و موبایل این امکان را فراهم میکند که نیازهای فردی با روشهای نوآورانهای که با راهحلهای سمعک ادغام شدهاند، برآورده شوند. برخی بیماران نیاز به کمک بیشتری در سازگاری با سمعکهایشان دارند و روشهای درمانی خانگی مانند برنامه “ارتقاء گوش دادن و ارتباط” (LACE) ممکن است به روش معمول برای کمک به بیماران در بهینهسازی استفاده از فناوری سمعکشان تبدیل شوند. LACE به کاربران آموزش میدهد که با استفاده از سمعکهایشان شنوایی خود را بهبود بخشند و خود را با عملکرد کاربر تطبیق میدهد. اگر بیمار به سرعت پیشرفت کند، LACE به سرعت دشواری خود را افزایش میدهد؛ اگر بیمار در سازگاری با سمعک مشکل داشته باشد و در انجام وظایف LACE دشواری داشته باشد، برنامه به آرامی دشواری خود را کاهش میدهد. میتوان تصور کرد که سمعکها با گذشت زمان و با تطبیق بیماران با فناوری جدید، به همان روشی که آموزشهای LACE دشواری تستهای خود را با عملکرد موضوع تنظیم میکند، تنظیم میشوند. با ترکیب الگوریتمهای هوشمند در سمعکهایی که قبلاً مورد بحث قرار گرفت، سمعکها به سیستمهایی تبدیل میشوند که برای تنظیم درمان به نیازهای فردی کاربر طراحی شدهاند.
روشهای ارزیابی
روشهای استاندارد ارزیابی در میان پژوهشگران سمعک برای اندازهگیری بهرهمندی از سمعک بر عملکرد مربوط به شنیداری تمرکز داشتهاند، و درک گفتار معمولاً در حضور نویز شکلدهیشده گفتار یا سر و صدای چند گوینده اندازهگیری میشود. تاثیر شنیداری بر درک گفتار اکنون به خوبی درک شده است، و متخصصان شنوایی پارامترهای فشردهسازی سمعک را بهگونهای تنظیم میکنند که سعی در به حداکثر رساندن شنیداری دارند در حالی که بلندی صداهای مناسب را حفظ میکنند. ادراک شنوایی بیش از صرفاً شنیداری است. نقصهای پردازش فوقآستانه میتوانند کیفیت صدا و سایر عواملی که بر توانایی ما در استخراج اطلاعات شنیداری از جهان تأثیر میگذارند را تحت تأثیر قرار دهند. برای تعیین چگونگی تأثیر پردازش سیگنال دیجیتال بر این جنبههای شنوایی، ما به روشهای ارزیابیای نیاز داریم که به بیشتر از تأثیرات شنیداری حساسیت داشته باشند.
درک چگونگی تغییرات نویز درک با پیکربندی اختلال شنوایی چگونه است؟ تأثیر فشردهسازی چندبانده بر درک اکوها چیست؟ این جنبههای پیچیدهتر ادراک شنیداری اکنون باید مورد توجه قرار گیرند. زمینههای اضافی تحقیق شامل درک مدولاسیون دامنه و فرکانس، همبستگی فرکانس-متقاطع، ادراک دوگوشی، و تیمبر (کیفیت صوت) است. برای طراحی بهتر پردازش سیگنال در سمعکها، به فهم پیچیدهتری نیاز است که چگونگی تأثیر اختلالات شنوایی و پردازش سمعک بر پردازش شنیداری پیچیده مانند جداسازی منبع، جریانسازی شنیداری، استخراج ویژگی، و یکپارچهسازی شنیداری-بصری. برخی از این مسائل در بخش بعدی مورد بحث قرار خواهند گرفت.
شناخت
جامعه تحقیقاتی سمعک و صنعت سمعک به طور کلی به رویکرد پایین به بالا در تحقیقات نقص شنوایی و طراحی سمعک میپردازند. آنها نگران این هستند که چگونه نقص در محیط شنوایی محیطی سیگنال شنوایی را تغییر میدهد و چگونه سمعک این نمایش محیطی را تغییر میدهد. با این حال، مقدار قابل توجهی از ادراک شنوایی از بالا به پایین و درگیر سیستم شناختی است. نقص شنوایی و سمعکها احتمالاً بر این عملکرد سطح بالاتر تأثیر میگذارند. عملکرد شناختی و تعامل آن با نقص شنوایی و سمعکها توجه بالینی یا تحقیقاتی زیادی را دریافت نکرده است. تعامل بین سمعکها و عملکرد شناختی در طراحی سمعکها مورد توجه قرار نگرفته است. در آینده، سمعکها به گونهای طراحی خواهند شد که نه تنها اثر پردازش بر نمایش سیگنال در محیط شنوایی محیطی را در نظر بگیرند، بلکه تأثیر پردازش بر عملکرد شناختی را نیز در نظر بگیرند.
توجه و تلاش
یکی از شکایات رایج افراد دارای نقص شنوایی این است که گوش دادن در موقعیتهای پر صدا تجربهای خسته کننده است و یک فرد دارای نقص شنوایی پس از یک ساعت مکالمه در یک موقعیت پر صدا به مراتب خستهتر از کسی است که شنوایی عادی دارد. خستگی احتمالاً به دلیل تلاش بیشتر در گوش دادن است که برای درک گفتار از طریق سیستم شنوایی ناقص لازم است.
ارتباطات یک فرآیند پیچیده است که شامل عملکرد شنوایی مرتبط با شنیداری بسیار بیشتر از شنیداری ساده است. وقتی کسی در یک موقعیت پر صدا به گفتار گوش میدهد، دانش قوانین زبان و اطلاعات متنی برای کمک به فرآیند درک گفتار استفاده میشود. جملاتی با کلمات نشنیده، مانند جمله “گربه گرسنه یک خاکستری کوچک را دنبال کرد”، هنوز میتوانند با احتمال بیش از شانس به طور دقیق فهمیده شوند به دلیل محتوا و زبانشناسی. کلمهی گمشده در مثال میتواند به عنوان “موش” پیشبینی شود به دلیل موضوع، به دلیل اصلاحکنندههای “کوچک” و “خاکستری”، به دلیل این که باید یک نام باشد، و شاید به این دلیل که شخص شنونده توانست تشخیص دهد که کلمه یک هجای بود حتی اگر فونمها غیرقابل شناسایی بودند. اگر کلمهی گمشده زودتر در جمله رخ دهد، مانند :
“یک ___ کوچک و خاکستری، توسط یک گربه گرسنه دنبال میشد”
شنونده میتواند جمله را در حافظه نگه دارد و سپس بعد از شنیدن جمله کامل، کلمهی گمشده را پر کند.
جنبههای شناختی
اینها جنبههای شناختی درک گفتار هستند که بر میزان توجه و تلاشی که سیستم شناختی در طول ارتباط مصرف میکند، تأثیر میگذارند. در مکالمه واقعی (در مقابل آزمایشهای استاندارد گفتار در نویز)، شنوندگان همچنین افکاری را که توسط آنچه میشنوند تولید میشوند، ایجاد میکنند، روابط بین جملات مختلف را ایجاد میکنند در حالی که زمینههای سطح بالاتر را رسم میکنند، اطلاعات را در حافظه ذخیره میکنند و درباره آنچه که قصد دارند در پاسخ به آنچه که میشنوند بگویند، فکر میکنند. به عبارت دیگر، فعالیت شناختی بیشتری در مکالمه نسبت به آزمایشهای شناخت فونم یا آزمایشهای ساده گفتار در نویز دخیل است. شکل 2، که از Sweetow و Henderson-Sabes اقتباس شده است، این وضعیت پیچیده را به صورت گرافیکی نشان میدهد. البته، شنوندگان ممکن است با انجام وظایف ثانویه در طول مکالمه، مانند خواندن منو یا رانندگی، سیستم توجه خود را بیشتر تحت فشار قرار دهند.