OpenAI Audio-Operationen#

Verwenden Sie diese Operation, um ein Audio zu generieren oder eine Aufnahme in OpenAI zu transkribieren oder zu übersetzen. Weitere Informationen zum OpenAI-Knoten selbst finden Sie unter OpenAI.

Audio generieren#

Verwenden Sie diese Operation, um Audio aus einer Texteingabe zu erstellen.

Geben Sie diese Parameter ein:

Anmeldedaten für die Verbindung mit: Erstellen oder wählen Sie vorhandene OpenAI-Anmeldedaten aus.
Ressource: Wählen Sie Audio.
Operation: Wählen Sie Audio generieren.
Modell: Wählen Sie das Modell aus, das Sie zum Generieren des Audios verwenden möchten. Weitere Informationen finden Sie unter TTS | OpenAI.
- TTS-1: Verwenden Sie dies, um die Geschwindigkeit zu optimieren.
- TTS-1-HD: Verwenden Sie dies, um die Qualität zu optimieren.
Texteingabe: Geben Sie den Text ein, für den das Audio generiert werden soll. Die maximale Länge beträgt 4096 Zeichen.
Stimme: Wählen Sie eine Stimme aus, die beim Generieren des Audios verwendet werden soll. Hören Sie sich die Vorschauen der Stimmen unter Text to speech guide | OpenAI an.

Optionen#

Antwortformat: Wählen Sie das Format für die Audioantwort aus. Wählen Sie zwischen MP3 (Standard), OPUS, AAC, FLAC, WAV und PCM.
Audiogeschwindigkeit: Geben Sie die Geschwindigkeit für das generierte Audio aus einem Wert von 0.25 bis 4.0 ein. Standardmäßig ist 1 eingestellt.
Ausgabe in Feld speichern: Standardmäßig ist data eingestellt. Geben Sie den Namen des Ausgabefelds ein, in dem die Binärdateidaten gespeichert werden sollen.

Weitere Informationen finden Sie in der Dokumentation Create speech | OpenAI.

Aufnahme transkribieren#

Verwenden Sie diese Operation, um Audio in Text zu transkribieren. Die OpenAI-API begrenzt die Größe der Audiodatei auf 25 MB. OpenAI verwendet standardmäßig das Modell whisper-1.

Geben Sie diese Parameter ein:

Anmeldedaten für die Verbindung mit: Erstellen oder wählen Sie vorhandene OpenAI-Anmeldedaten aus.
Ressource: Wählen Sie Audio.
Operation: Wählen Sie Aufnahme transkribieren.
Name des Eingabedatenfelds: Standardmäßig ist data eingestellt. Geben Sie den Namen der binären Eigenschaft ein, die die Audiodatei in einem dieser Formate enthält: .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav oder .webm.

Optionen#

Sprache der Audiodatei: Geben Sie die Sprache des eingegebenen Audios in ISO-639-1 ein. Verwenden Sie diese Option, um Genauigkeit und Latenz zu verbessern.
Ausgabezufälligkeit (Temperatur): Standardmäßig ist 1.0 eingestellt. Passen Sie die Zufälligkeit der Antwort an. Der Bereich liegt zwischen 0.0 (deterministisch) und 1.0 (maximale Zufälligkeit). Wir empfehlen, entweder dies oder Ausgabezufälligkeit (Top P) zu ändern, aber nicht beides. Beginnen Sie mit einer mittleren Temperatur (um die 0.7) und passen Sie sie basierend auf den beobachteten Ausgaben an. Wenn die Antworten zu repetitiv oder starr sind, erhöhen Sie die Temperatur. Wenn sie zu chaotisch oder themenfremd sind, verringern Sie sie.

Weitere Informationen finden Sie in der Dokumentation Create transcription | OpenAI.

Aufnahme übersetzen#

Verwenden Sie diese Operation, um Audio ins Englische zu übersetzen. Die OpenAI-API begrenzt die Größe der Audiodatei auf 25 MB. OpenAI verwendet standardmäßig das Modell whisper-1.

Geben Sie diese Parameter ein:

Anmeldedaten für die Verbindung mit: Erstellen oder wählen Sie vorhandene OpenAI-Anmeldedaten aus.
Ressource: Wählen Sie Audio.
Operation: Wählen Sie Aufnahme übersetzen.
Name des Eingabedatenfelds: Standardmäßig ist data eingestellt. Geben Sie den Namen der binären Eigenschaft ein, die die Audiodatei in einem dieser Formate enthält: .flac, .mp3, .mp4, .mpeg, .mpga, .m4a, .ogg, .wav oder .webm.

Optionen#

Ausgabezufälligkeit (Temperatur): Standardmäßig ist 1.0 eingestellt. Passen Sie die Zufälligkeit der Antwort an. Der Bereich liegt zwischen 0.0 (deterministisch) und 1.0 (maximale Zufälligkeit). Wir empfehlen, entweder dies oder Ausgabezufälligkeit (Top P) zu ändern, aber nicht beides. Beginnen Sie mit einer mittleren Temperatur (um die 0.7) und passen Sie sie basierend auf den beobachteten Ausgaben an. Wenn die Antworten zu repetitiv oder starr sind, erhöhen Sie die Temperatur. Wenn sie zu chaotisch oder themenfremd sind, verringern Sie sie.

Weitere Informationen finden Sie in der Dokumentation Create transcription | OpenAI.

Häufige Probleme#

Informationen zu häufigen Fehlern oder Problemen und vorgeschlagenen Lösungsschritten finden Sie unter Häufige Probleme.