Скорость (0.5-1.5): Скорость речи. 1.0 = норма, 1.2 = быстрее (для IVR), 0.8 = медленнее.
Температура (0.1-1.0): Вариативность и эмоциональность. 0.7 = сбалансировано, 0.3 = монотонно (для диктовки), 0.9 = очень выразительно.
• Длительность: 5-30 секунд чистого аудио (WAV/MP3)
• Качество: Без шумов, музыки, эха
• Транскрипт: Введите ТОЧНЫЙ текст из аудио для лучшего клонирования
• Стиль: Опционально опишите эмоцию (саркастичный, грустный, энергичный)
Генерация аудио...
Аудио появится здесь