Skip to content

Tran­skrip­ti­ons­zeit hal­bie­ren: Eine semi-auto­ma­ti­sche und kos­ten­freie Tran­skrip­ti­ons­rou­ti­ne für die qua­li­ta­ti­ve Forschung

Tran­skrip­ti­ons­zeit hal­bie­ren: Eine semi-auto­ma­ti­sche und kos­ten­freie Tran­skrip­ti­ons­rou­ti­ne für die qua­li­ta­ti­ve Forschung

Das Tran­skri­bie­ren, also das Über­tra­gen von Audio­da­ten in Text­form, ist eine der zeit­auf­wän­digs­ten Auf­ga­ben im sozi­al­wis­sen­schaft­li­chen For­schungs­pro­zess. Bei manu­el­ler Tran­skrip­ti­on benö­tigt man als geüb­ter Tip­per für ein ein­stün­di­ges Inter­view etwa fünf Stun­den. Geüb­te Schrei­ber tip­pen übri­gens 50 bis 70 Wör­ter pro Minu­te, beim 2‑Fin­ger-Such­sys­tem hal­biert sich die­se Zahl auch schnell. Also wie­so nicht die Sprach­er­ken­nungs­soft­ware von Ama­zon Ale­xa, Apple Siri, Goog­le Assi­stant oder Sam­sung Bix­by zur auto­ma­ti­schen Tran­skrip­ti­on nut­zen und so Zeit sparen?

Wir haben diver­se Soft­ware, APIs und Kon­fi­gu­ra­tio­nen getes­tet und eine Tran­skrip­ti­ons­rou­ti­ne zur semi-auto­ma­ti­schen und vor allem kos­ten­lo­sen Kon­ver­tie­rung von Spra­che in Text entwickelt:

Audio rich­tig auf­neh­men je nach Interviewform

Je bes­ser das Inter­view auf­ge­nom­men ist, je deut­li­cher und kla­rer die Spra­che zu ver­ste­hen ist, des­to genau­er funk­tio­nie­ren auto­ma­ti­sier­te Sprach­er­ken­nungs­pro­gram­me. Falls eure Erhe­bung also noch nicht abge­schlos­sen sein soll­te, führt ihr eure Inter­views per­sön­lich durch – Face-to-Face – und nehmt das Gespräch mit einem por­ta­blen Ste­reo-Audio­re­cor­der auf.

Fest­netz > Mobil­netz > Skype!

Soll­te ein per­sön­li­ches Inter­view nicht mög­lich sein, ach­tet auch beim Tele­fon­in­ter­view auf die best­mög­li­che Audio­qua­li­tät.
Bei der Auf­nah­me eines Inter­views über ein Fest­netz­te­le­fon soll­te ein Tele­fon-Auf­nah­me­ad­ap­ter genutzt wer­den. Die Auf­nah­me kann dann bei­spiels­wei­se über einen PC erfolgen.

Bei der Auf­nah­me eines Anru­fes über ein Smart­pho­ne kön­nen „Call Recor­der“ Apps genutzt wer­den.
Android App um Anru­fe auf­zu­zeich­nen:
iOS-App um Anru­fe aufzunehmen:

Ein Gespräch über Sky­pe kann direkt mit den Bord­mit­teln von Sky­pe auf­ge­nom­men wer­den: https://support.skype.com/de/faq/FA12395/wie-zeichne-ich-skype-anrufe-auf

Zusam­men­stel­lung von Sprach­er­ken­nungs- und Transkriptionssoftware

Die wohl bekann­tes­te kos­ten­pflich­ti­ge Soft­ware zur Über­set­zung von Spra­che zu Text ist „Nuan­ce“ der Fir­ma Dra­gon. Diver­se kos­ten­pflich­ti­ge Ser­vices wie GoTran­script, Tran­scri­be­Files, Hap­py­Scri­be, Amber­Script, Sonix bie­ten die Mög­lich­keit an, Audio­da­tei­en direkt online auto­ma­tisch tran­skri­bie­ren zu las­sen. Falls ihr kein Geld aus­ge­ben möch­tet, zei­gen wir euch hier, wie ihr kos­ten­los Goog­le Speech-to-Text nut­zen könnt.

Falls ihr in der Lage seid, ein paar Zei­len Code zu schrei­ben, emp­feh­len wir aber die APIs der gän­gi­gen Sprach­as­sis­ten­ten direkt zu nutzen:

Kos­ten­lo­se Tran­skrip­ti­ons­rou­ti­ne mit der Sprach­dik­tat­funk­ti­on von Goog­le Docs und Win­dows Stereomix 

Um die Tran­skrip­ti­ons­rou­ti­ne ein­zu­rich­ten, muss unter Win­dows „Ste­reo­mix“ akti­viert wer­den. Ste­reo­mix ist ein vir­tu­el­les Auf­nah­me­ge­rät für euren Sys­tem­sound, sprich: Abge­spiel­tes Audio­ma­te­ri­al wird nicht nur über die Laur­spre­cher aus­ge­ge­ben, son­dern auch intern auf das Mikro­fon gelegt.

Nach erfolg­rei­cher Ein­rich­tung soll­te also beim Abspie­len von Medi­en­da­tei­en am PC der Pegel des Laut­spre­chers wie auch der des Mikro­fons ausschlagen.

Ste­reo­mix unter Win­dows 10 aktivieren

Alter­na­ti­ve zu Win­dows Ste­reo­mix: Vir­tu­al Cable instal­lie­ren und einrichten

Sprach­dik­tat­funk­ti­on in Goog­le Docs nutzen

Nach­dem nun Ste­reo­mix oder das Vir­tu­al Cable ein­ge­rich­tet wur­de, öff­net ihr mit dem Chro­me-Brow­ser ein neu­es Doku­ment in Goog­le Docs. In der Werk­zeugleis­te wählt ihr unter Tools die „Sprach­ein­ga­be“, wor­auf­hin sich ein neu­es Fens­ter öffnet.

Sobald ihr nun eine Audio­da­tei auf eurem PC abspielt und das Mikro­fon­sym­bol im Sprach­ein­ga­be­fens­ter in Goog­le Docs akti­viert, tran­skri­biert Goog­le eure Audio­da­tei. Wenn ihr die Wie­der­ga­be pau­siert, endet auch die Tran­skrip­ti­on. Die Erken­nungs­ge­nau­ig­keit steigt, wenn ihr die Wie­der­ga­be­ge­schwin­dig­keit leicht reduziert.

Titel­bild: Gvosdikov/​Shutterstock, https://cloud.google.com/speech-to-text

Kommentare

Noch kein Kommentar, Füge deine Stimme unten hinzu!


Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Unsere Website verwendet Cookies und sammelt dadurch Informationen über Deinen Besuch, um unsere Website zu verbessern und Social Media-Inhalte anzuzeigen. Alle Infos findest Du in unserer Datenschutzerklärung.

Cookie Einstellungen

Unten kannst Du wählen, welche Art von Cookies Du auf dieser Website zulassen möchtest. Klicke auf die Schaltfläche "Speichern", um die Auswahl zu übernehmen.

FunktionalUnsere Website verwendet funktionale Cookies. Diese Cookies sind notwendig, damit unsere Website funktionieren kann.

AnalyseUnsere Website verwendet analytische Cookies, die es ermöglichen, unsere Website zu analysieren und u.a. im Hinblick auf die Benutzerfreundlichkeit zu optimieren.

Social MediaUnsere Website verwendet Social-Media-Cookies, um Dir Inhalte von Drittanbietern wie YouTube und Facebook anzuzeigen. Diese Cookies können Deine persönlichen Daten verfolgen.

SonstigeUnsere Website verwendet Cookies von Drittanbietern, die nicht aus den Bereichen Analytik, soziale Medien oder Werbung stammen.