Aufnahmenverarbeitung
GDAHT hat einen festen Verarbeitungsprozess, dessen Teile teilweise angepasst oder an- und abgeschaltet werden können. Nach dem Start der Aufnahmenverarbeitung laufen alle Teile ohne Unterbrechung ab, außer ein Teil schlägt fehl.

Das Fenster zum Fortschritt der Aufnahmenverarbeitung zeigt im oberen Bereich die Haupt- und Unterschritte der Verarbeitung an. Einige wenige davon zeigen detaillierte technische Informationen, die nicht immer wichtig sind.
Das Symbol neben den Hauptschritten stellt den Fortschritt des Schritts dar. Ein Zahnrad stellt einen in Arbeit befindlichen Schritt dar. Ein Haken stellt einen erfolgreichen Schritt dar. Ein Kreuz stellt einen nicht erfolgreichen Schritt dar.
Die Fortschrittsleiste ist überschrieben mit einer Kurzbeschreibung des aktuellen Schritts. Der Fortschritt selbst ist gleichmäßig aufgeteilt zwischen allen zeitintensiven Schritten (Pegelanalyse, Hauptverarbeitung, Datei-Upload, ChurchTools-Upload). Daher liefert er keine exakte Schätzung über die verbleibende Dauer der Verarbeitung, da manche Schritte oft viel schneller sind als andere (insbesondere die Upload-Schritte).
Mit dem Details-Knopf können die technischen Details der Verarbeitung angezeigt werden. Es handelt sich hier um den vollständigen Programm-Log seit Beginn der Verarbeitung. Für Fehlerberichte möchten wir dennoch stattdessen den regulären Log erhalten.
Die Verarbeitung kann jederzeit abgebrochen werden. Bereits verarbeitete oder hochgeladene Aufnahmen werden nicht gelöscht.
Normalisierung
Da Aufnahmen oft einen variablen Pegel haben und viele Aufnahmegeräte ihre Aufnahmen mit sehr niedrigem Pegel durchführen, ist es sinnvoll, die Aufnahmen auf einen einheitlichen Pegel zu normalisieren. GDAHT verwendet hierfür die Norm EBU R128, welche mehrere Werte des Audiosignals und deren beabsichtigte Zielwerte festlegt:
- Die Ziellautheit bzw. Integrierte Lautheit (IL) wird in R128 auf -23 LUFS (entspricht -23 dB vom digitalem Vollpegel 0 dBFS) festgelegt. Diesem Standard folgen die meisten Fernsehsender. Viele Standards weichen hiervon ab: die meisten Internetstreamingplattformen wie Spotify und YouTube verlangen -14 LUFS, der AES-Standard empfiehlt -16 LUFS.
- Der Dynamikbereich (Loudness Range, LRA) ist auf 7 dB festgelegt. Da hier kein wichtiger Standard abweicht, ist dieser Wert in GDAHT nicht anpassbar.
- Das echte Spitzensignal (True Peak, TP), welches auch höher liegen kann als das digitale Spitzensignal (d.h. mehr als 0 dBFS), ist im Standard zwar auf -1 dBFS festgelegt, allerdings wird in der Praxis meist -2,0 dBFS - -2,3 dBFS verwendet. GDAHT verwendet den „sicheren“ Wert -2 dbFS. Da dies keinen großen Einfluss auf die Lautheit hat, ist auch dieser Wert in GDAHT nicht anpassbar.
Eine weitere englische Erläuterung zu den Werten und ihren Bedeutungen findet sich hier.
Ist die Normalisierung in den Einstellungen angeschaltet, wird GDAHT als ersten Verarbeitungsschritt das Audio auf seine aktuellen Pegelwerte analysieren. Eine vollständige Zweischrittanalyse ist notwendig, da das Audio ansonsten mit einem langsamen Kompressor in Echtzeit normalisiert wird, was in der Regel sehr unerwünscht klingt. Stattdessen wird das Signal einheitlich linear im Pegel angepasst, was den Klangcharakter der Originalaufnahme unverändert beibehält. Gibt es nach der Normalisierung noch starke Schwankungen im Pegel, dann ist die ursprüngliche Abmischung des Signals nicht optimal und sollte verbessert werden.
Die Analyse kann in der Regel mit 25-30-facher Echtzeitgeschwindigkeit durchgeführt werden (2-2,5 Minuten Zeitaufwand bei 1 Stunde Aufnahme). Die ermittelten Pegelwerte werden als Unterschritt ausgegeben. Die Pegelanpassung wiederum geschieht später während der Haupt-Audioverarbeitung.
Audiozuschnitt
Ist die Normalisierung aktiv, so ermittelt GDAHT den Schwellwert, unter dem Audioinhalte als Stille interpretiert werden. Damit können vom Anfang und Ende der Aufnahme Stille bis zum ersten bzw. letzten Nicht-Stille-Teil entfernt werden. Zur Sicherheit werden immer 1 Sekunde an Audio vor bzw. hinter dem erkannten Start- bzw. Endpunkt mit eingeschlossen.
Der Zuschnitt der Stille ist als Untereinstellung der Normalisierung verfügbar, da er wie erläutert von der Lautheitsanalyse der Normalisierung abhängt.
Audioverarbeitung
Die Audioverarbeitung geschieht in einem Gang, der mehrere Verarbeitungsfunktionen zusammenfasst:
- Zusammenfassung der Eingabedateien. Je nach Eingabekonfiguration (siehe Benutzung) werden Links- und Rechtskanäle zu Stereo zusammengefügt, Dateien aneinandergehängt, oder einfach die eine Eingabedatei verwendet.
- Normalisierung. Ist die Normalisierung aktiv, werden die im letzten Schritt ermittelten Lautheitsdaten der Quelldateien verwendet, um eine Normalisierung durchzuführen. Für Details zur Normalisierungsfunktion siehe oben.
- Kompression und Speicherung in Zielformaten. Alle ausgewählten Zielformate verwenden dasselbe Audioformat (48kHz, max. 16 bit).
- Anfügen der Metadaten. Diese unterscheiden sich je nach Zielformat leicht.
Je nach genauem Aufwand kann die Aufnahmenverarbeitung sehr unterschiedlich lange dauern. In unseren Tests haben wir auf Laptops von 2020-2021 Geschwindigkeiten zwischen 18x und 620x Echtzeit beobachtet. Die folgenden Parameter beeinflussen die Aufnahmenverarbeitung in unterschiedlichem Maß:
- Selbstverständlich brauchen längere Aufnahmen mehr Zeit.
- Mehr Ausgabeformate benötigen mehr Zeit. Außerdem ist die Geschwindigkeit immer auf das langsamste Format beschränkt (s.u.).
- AAC ist deutlich langsamer als Opus, was langsamer als FLAC ist. Bei einzelner Audioverarbeitung erreicht Opus Geschwindigkeiten von bis zu 92x, AAC von 22x, und FLAC von über 600x Echtzeit. Folglich raten wir von der Verwendung von AAC auch aus diesem Grund ab.
- Audionormalisierung benötigt etwas mehr Zeit, da das Audio nicht einfach vom Eingabeformat durchgereicht wird. Dies reduziert die Verarbeitungsgeschwindigkeit in der Regel auf maximal 25x.
- Hat die Eingabe eine hohe Bittiefe (z.B. 24 Bit) oder eine Samplerate, die von 48 kHz abweicht, so wird etwas mehr Zeit benötigt, um diese Formate zu konvertieren.
Upload
Sind ein oder beide Uploadschritte aktiv, so werden die fertigen Audiodateien auf einen Dateiserver hochgeladen und dann eventuell aus ChurchTools verlinkt.
Der Dateiupload lädt Dateien im Zielordner unter dem lokalen Dateinamen hoch. Unbeachtet anderer Änderungen der Dateiablage ergibt sich somit ein 1-1-Abbild des lokalen Aufnahmenordners. Es werden für die Aufnahmen keine extra Ordner pro Datum angelegt (o.ä.).
Zu weiteren Informationen zu den unterstützten Protokollen und wie sie anzugeben sind, siehe die Einstellungsdokumentation.
Der ChurchTools-Upload ist zum aktuellen Zeitpunkt noch nicht implementiert und wird später dokumentiert.
Schlägt der Upload fehl, so lässt er sich alleinestehend beliebig oft wiederholen. Das hat den Hintergrund, dass der Upload mit seinem Netzwerkzugriff unvorhersehbarer als andere Teile der Verarbeitung sind und öfters fehlschlagen kann.