HASQUE

Aus MARJORIE-WIKI
Wechseln zu: Navigation, Suche

HASQUE[1] (Hearing Adequate Signal Quality Evaluation) ist ein Hörtestsimulator zur gehöradäquaten (~berichtigten) objektiven Qualitätsbeurteilung von Audio - und Telekommunikationssystemen.

Entwicklung[Bearbeiten]

Mit Hilfe der Forschungsergebnisse von Eberhard Zwicker waren die Grundregeln für eine Nachbildung der Höreigenschaften gegeben. Unter anderem war die korrekte Nachbildung der im Innenohr (Cochlea) stattfindenden Frequenz-Ortstransformation eine Herausforderung für die Entwicklung neuer Algorithmen, da die Frequenz-/ Zeitauflösung des menschlichen Ohres mit bekannten Verfahren wie der schnellen Fourier-Transformation (FFT) oder Bandbreitenfiltern nicht korrekt nachgebildet werden konnte.

So wurde eine gleitende Spektralanalyse[2] schon Mitte der 1990er Jahre für eine bessere Zeitauflösung vorgeschlagen. Im Laufe der folgenden Jahre wurden die BARK–Transformation[3] und die CFT[4] für eine bessere Nachbildung der Frequenz-Ortstransformation mit gehöradäquater Frequenz- und Zeitauflösung entwickelt.   

Basierend auf der CFT begann die Entwicklung des HASQUE-Verfahrens im Jahr 2003, nachdem sich innerhalb der Internationale Fernmeldeunion (ITU) keine brauchbare Lösung zur gehöradäquaten Qualitätsbeurteilung von Geräuschreduktionsverfahren abzeichnete und die Qualitätsbeurteilung von Signalen mit Hintergrundgeräuschen mit bekannten Verfahren nicht befriedigend durchgeführt werden konnte. HASQUE wurde in 2005 zum Patent angemeldet und durch Erfahrungen mit verschiedenen Anwendungen aus den Bereichen PC-Multimedia, Abwehrtechnik (akustische Ortung), Telekommunikation (Bewertung von Verfahren zur Geräuschreduktion, Bandbreitenerweiterung, Sprachcodecs) und Studiotechnik (Bewertung von TV-Werbespots) in Zusammenarbeit mit mittleren und großen Unternehmen kontinuierlich verbessert.

Hörtestsimulation mit HASQUE[Bearbeiten]

Ein wesentliches Merkmal des HASQUE-Verfahrens ist, dass die Hörtestparameter Wiedergabelautstärke, Bandbreite und Akzeptanzschwelle individuell festgelegt werden können, womit eine natürliche Anpassung an verschiedene Hörtestbedingungen[5][6] möglich ist.

In Abhängigkeit der Wiedergabelautstärke wird eine Störung wegen des nichtlinearen Lautheitsempfindens unterschiedlich stark wahrgenommen. Insbesondere kleine Störungen werden bei hoher Wiedergabelautstärke wesentlich deutlicher wahrgenommen als bei normaler oder geringer Wiedergabelautstärke, obwohl die Nutzsignale ebenfalls in Abhängigkeit der Wiedergabelautstärke verändert werden.[7][8]

Die Angabe der Bandbreite ist erforderlich, um Qualitätsmaße verschiedener Hörtests vergleichen zu können. Eine Reduzierung der Bandbreite bewirkt immer eine Erhöhung der gemessenen objektiven Qualität, wenn dadurch Störungen außerhalb des Übertragungsbands unterdrückt werden. Bei Messsystemen ohne zusätzliche Bandbegrenzung wird die maximale Übertragungsbandbreite durch die Abtastrate und die Frequenzauflösung des Messsystems bestimmt. Nach ITU-T P.862[9] wird eine zusätzliche Bandbegrenzung zur Nachbildung der Telefonqualität eingesetzt.

Die Akzeptanzschwelle reflektiert die maximal akzeptierte Lautheit von Störung in einem System und wird in Sone angegeben. Für einfache Telekommunikationssysteme ist diese Schwelle deutlich höher im Vergleich zu professionellen Studiosystemen.

Die Nachbildung der Höreigenschaften des menschlichen Ohres wird bei HASQUE durch eine sogenannte Cochleatransformation im gesamten zur Verfügung stehenden Frequenzbereich ohne Bandbreitenbegrenzung durchgeführt. Der Name „Cochleatransformation“ wurde gewählt, da in der Cochlea im Innenohr wesentliche Höreigenschaften mit bestimmt werden. Die Frequenz-Ortstransformation arbeitet mit optimierter Zeit-/Frequenzauflösung. Maskierungseffekte werden durch gehöradäquate Algorithmen im Zeit- und Frequenzbereich nachgebildet. Die Mithörschwelle wird an das Hintergrundgeräusch der zu bewertenden Systeme in Abhängigkeit der Geräuscheigenschaften adaptiert. So werden quasi-stationäre Geräuschquellen wie beispielsweise Fahrgeräusche bei konstanter Geschwindigkeit und nicht-stationäre Geräusche wie das Rattern eines vorbeifahrenden Zuges unterschiedlich stark bewertet, um eine möglichst genaue Approximation an die subjektiv empfundene Qualität zu erreichen. HASQUE bildet mit der Cochleatransformation die Höreigenschaften des menschlichen Ohres nach, vergleicht über diese Nachbildung Ein– und Ausgangssignal eines Systems und berechnet aus den „hörbaren“ Fehlern ein Qualitätsmaß. 

Die Skalierung des Qualitätsmaßes kann individuell festgelegt werden. Eine Skalierung nach Empfehlungen der ITU-T auf einer 5-Punkte-Skala (bspw. der STI-CIS-Skala) ist ebenso möglich wie eine prozentuale Skalierung. HASQUE-Messsysteme stehen sowohl für die Beurteilung von Endgeräten in Echtzeit als auch zur Beurteilung von PCM-Aufnahmen als Offlinesystem zur Verfügung.

Messungen an Endgeräten in Echtzeit[Bearbeiten]

Bild 1: HASQUE Hörtestsimulator für Echtzeitmessungen

Echtzeitmesssysteme arbeiten bidirektional mit analogen Schnittstellen, welche mit hochwertigen 24-Bit-Wandlern bei 48 kHz abgetastet werden. Dem Anwender steht ein Hardwaretestprogramm zur Verfügung, welches über eine automatische Parametrierung eine korrekte Aussteuerung der Signalschnittstellen gewährleistet, um bestmögliche und reproduzierbare Qualitätsmaße zu erhalten.

Echtzeitmessungen werden mit Hilfe eines programmierbaren Taskinterpreters gestartet. Während der Messung werden Aufnahmen vom zu untersuchenden Terminal aufgezeichnet. Der Taskinterpreter wird zur Steuerung des Messsystems, der Messrichtung, der angeschlossenen Terminals und für die individuelle Auswahl von Testsignalen eingesetzt. Für die Programmierung des Taskinterpreters werden drei Versionen angeboten:

Bild 2 zeigt Programmierbeispiele für verschiedene Taskinterpreter, bei denen immer der gleiche Messablauf durchgeführt wird.

TIP TOP TUP
    
    REF = C:\...\Ref1.wav
    Press PTTA
    Wait =1500
    Evaluate
    Release PTTA
    Wait =1500
    Press PTTB
    Wait =1500
    Evaluate
    Release PTTB
    Wait =1500
    
    REF = C:\...\Ref1.wav 
    EvaluateAB
    EvaluateBA
    
    Send Ref1 
    Receive Ref1

Bild 2: Programmierbeispiele

Die TIP-Programmierung ermöglicht die individuelle Festlegung der Reaktionszeit der Hardware bei der Umschaltung der Messrichtung über die Push-to-Talk-Tastenfunktion (PTT). Die TOP-Programmierung fasst die PTT-Steuerung in einem Befehl zusammen, wobei die Reaktionszeit der Hardware als fester Wert in den Settings der Software eingegeben werden kann. Die TUP-Programmierung ist für verteilte Messsysteme mit unidirektionaler Steuerung geeignet, bietet die gleiche Programmierung der Reaktionszeit der Hardware wie TOP und arbeitet mit einer definierten Datenbasis, aus der die Testdaten durch Synonyme (Ref1...Ref2) ausgewählt werden können.

Offlinemessungen mit PCM-Aufnahmen[Bearbeiten]

Offlinemessungen werden mit windowskonformen PCM-Signalen (*.wav Dateien) durchgeführt. Es können sowohl einzelne Messungen als auch Serienmessungen durchgeführt werden. Die Abtastrate des Messsystems wird automatisch an die im Header der Audiodatei angegebene Abtastrate angepasst. Bei Serienmessungen werden zusätzlich Statistiken über die Qualitätsmaße, die Latenz und die Sprachunterbrechungen erzeugt. Für die Zusammenstellung von Serienmessungen steht dem Anwender ein spezieller Editor zur Verfügung.

Messergebnisse und Darstellungen[Bearbeiten]

HASQUE-Messsysteme sind mit statistischer Auswertung von Messreihen ausgerüstet. Mit der Anzeige der Verteilungsfunktion der MOS-Werte, Signallaufzeiten und Sprachunterbrechungen lassen sich mühelos Rückschlüsse auf die Eigenschaften der zu untersuchenden Systeme schließen. Mit Hilfe der Darstellung von Einzelergebnissen mit der grafischen Anzeige der hörbaren Störungen lassen sich detaillierte Untersuchungen an einzelnen Testfällen durchführen. Ausgewählten Passagen können mit Hilfe der Abspielfunktion abgehört und verglichen werden. Die Darstellung von Spektren erfolgt mit gehöradäquater Frequenzverteilung und zeigt die Frequenzgruppen auf der Bark-Skala. Dadurch sieht man, was man hört.

Vergleich mit subjektiven Hörtests[Bearbeiten]

Vergleicht man die Ergebnisse verschiedener Hörtests, ergeben sich erwartungsgemäß mit zunehmenden Störungen geringere Qualitätsmaße (MOS). Störungen können hierbei Geräusche, Signalunterbrechungen, lineare und nichtlineare Verzerrungen sein, weswegen die Abszisse in Bild 6 ohne Einheit angegeben ist.

Die maximalen Abweichungen der subjektiven Qualitätsbeurteilung (grün gestrichelt) vom gemittelten MOS-Wert (grün) ergeben sich durch die individuelle Akzeptanzschwelle der Testpersonen und können auch in Abhängigkeit von der Tagesform einer Testperson schwanken. Interessant ist hierbei die Tatsache, dass die Qualitätsunterscheidung - was klingt besser, was schlechter - zwischen den einzelnen Testfällen bei allen Testpersonen stark korrelieren und die Akzeptanzschwelle somit als Offset aufgefasst werden kann.

Die blaue Kurve im Bild 6 zeigt die objektiven Qualitätsmaße mit HASQUE und die graue Kurve die Ergebnisse mit anderen Messverfahren.

Wesentliche Fehler bei der objektiven Qualitätsbeurteilung können durch eine fehlerhafte Nachbildung der Höreigenschaften auftreten. Im Folgenden hierzu Hörproben mit unterschiedlicher Qualität.

Verfahren
Eingangssignal 8kHz
Ausgangssignal 8kHz
Eingangssignal 16kHz
Ausgangssignal 16kHz
HASQUE 4.5 3.1 4.5 2.7
Andere mit IRS 4.5 4.4 4.5 4.3

Aufnahmen werden mit Hörtestsimulatoren die mit Bandbreitenbegrenzung arbeiten trotz deutlich hörbarer Qualitätsunterschiede fast gleich gut bewertet. Die Bandbreitenbegrenzung ist nicht für die Qualitätsbeurteilung von allen Systemen geeignet.

Einzelnachweise[Bearbeiten]

  1. Patentanmeldung vom 29. April 2005, Code: DE 10 2005 019 903 A1 2006.11.02 (Offenlegungsschrift vom 2. November 2006), S. 3, Abschnitt 0012, patent-de.com, abgerufen am 21. Dezember 2016, .pdf
  2. E. Terhardt, Fourier Transformation of Time Signals, Acustica, Vol. 57, 1985.
  3. Rolf Kapust: Qualitätsbeurteilung codierter Audiosignale mittels einer BARK – Transformation. Dissertation, Technische Fakultät der Universität Erlangen, 1993.
  4. Michael Walker: Gehöradäquate digitale Sprachsignalverarbeitung. Funkschau 04/2003, ISSN 0016-2841. Seite 57-58.
  5. ITU-T P800 Recommendation Methods for subjective determination of transmission quality (englisch)
  6. ITU-T P835 Recommendation Subjective test methodology for evaluating speech communication systems that include noise suppression algorithm (englisch)
  7. E. Zwicker: Psychoakustik. Springer, Berlin 1982, ISBN 3-540-11401-7.
  8. E. Zwicker, H. Fastl: Psychoacoustics. Springer, Berlin 1999, ISBN 3-540-65063-6.
  9. ITU-T Recommendation P862 Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs, 02/2001, (englisch)
Info Sign.svg Dieser Wikipedia-Artikel wurde, gemäß GFDL, CC-by-sa mit der kompletten History importiert.