Voice Dataset Pipeline

Загрузите запись → подождите обработку → откройте waveform, поправьте границы и сдайте.

Live services

checking

Локальные настройки для Full ASR через SpeechKit/Object Storage и Qwen advisory. Секреты не показываются обратно после сохранения.

Required folder-level access: ai.speechkit-stt.user, storage.editor, ai.languageModels.user; AI Studio API key scope: yc.ai.languageModels.execute.

Object Storage bucket auto
yc CLI auto
AI Studio model default
AI Studio endpoint default

Датасет

Запись

Записи датасета

IDФайлСтатусДействия

Обработка

recording: -

Выберите запись или загрузите новую — обработка стартует автоматически.

Сначала подготовьте evidence для выбранной записи: Full ASR через SpeechKit, Qwen advisory и Candidate regions. Повторный запуск продолжает незавершённые jobs.

2. Формирование варианта нарезки

draft settings

Сформировать нарезку → открыть review queue → после прослушивания выгрузить clips. Настройки ниже только строят draft для waveform/review queue и не запускают live SpeechKit или Qwen.

Нарезка

WaveSurfer regions

Выгрузка результата

После прослушивания regions выгрузите клипы отдельным run.

Сабмиты

Архивы по текущей записи появятся здесь после кнопки “Сдать”.

IDRunСтатусФайл
Discovery / advisory artifacts recording: -
# Timing Duration Boundary Review Actions
Legacy / accepted fragments downstream review

Validation batches

run: -
ID Status Fragments Clean min Source Updated Feedback Actions
Manifest/report JSON

Сабмиты

IDRecordingRunСтатусФайл