VOOZH about

URL: https://huggingface.co/datasets/boffire/kabyle-synth-voice

⇱ boffire/kabyle-synth-voice · Datasets at Hugging Face


Dataset Viewer

Kabyle Parallel Corpus (OmniVoice × Tatoeba)

Corpus parallèle de 997 phrases kabyles avec audio généré par OmniVoice.

Statistiques

  • Langue : kabyle (kab)
  • Phrases totales : 997
  • Nouvelles phrases (ce run) : 987
  • Durée totale : 1958.4s (32.6 min)
  • Sampling rate : 24000 Hz
  • Source texte : Tatoeba
  • Modèle TTS : k2-fsa/OmniVoice
  • Dernière mise à jour : 2026-05-10T10:49:01.178795

Structure

kabyle_corpus_997/
├── audio/ # Fichiers WAV
├── metadata.jsonl # Métadonnées
├── metadata.csv # Métadonnées CSV
└── dataset_info.json # Info HuggingFace Datasets

Utilisation

from datasets import load_dataset
ds = load_dataset("audiofolder", data_dir=".")

⚖️ Licence

Textes : CC BY 2.0 FR (Tatoeba) | Audios : générés par OmniVoice

Downloads last month
25

Space using boffire/kabyle-synth-voice 1

Collection including boffire/kabyle-synth-voice