Voice Dataset Pipeline
Загрузите запись → подождите обработку → откройте waveform, поправьте границы и сдайте.
Live services
checkingЛокальные настройки для Full ASR через SpeechKit/Object Storage и Qwen advisory. Секреты не показываются обратно после сохранения.
Required folder-level access: ai.speechkit-stt.user, storage.editor, ai.languageModels.user; AI Studio API key scope: yc.ai.languageModels.execute.
Датасет
Запись
Записи датасета
| ID | Файл | Статус | Действия |
|---|
Обработка
recording: -Выберите запись или загрузите новую — обработка стартует автоматически.
Сначала подготовьте evidence для выбранной записи: Full ASR через SpeechKit, Qwen advisory и Candidate regions. Повторный запуск продолжает незавершённые jobs.
2. Формирование варианта нарезки
draft settingsСформировать нарезку → открыть review queue → после прослушивания выгрузить clips. Настройки ниже только строят draft для waveform/review queue и не запускают live SpeechKit или Qwen.
Нарезка
WaveSurfer regionsВыгрузка результата
После прослушивания regions выгрузите клипы отдельным run.
Сабмиты
Архивы по текущей записи появятся здесь после кнопки “Сдать”.
| ID | Run | Статус | Файл |
|---|
Discovery / advisory artifacts recording: -
| # | Timing | Duration | Boundary | Review | Actions |
|---|
Legacy / accepted fragments downstream review
Validation batches
run: -| ID | Status | Fragments | Clean min | Source | Updated | Feedback | Actions |
|---|
Batch feedback
Manifest/report JSON
Сабмиты
| ID | Recording | Run | Статус | Файл |
|---|