VT2022 XXX fiche
Résumé
Mots-Clés
Spleeter, Intelligence Artificielle, Deep Learning, Séparation de sources, Time-frequency masking
Abstract
Introduction
Acteurs du projet
Modèle utilisé
Time-Frequency Masking
Spleeter utilise une technique appelée Time-Frequency Masking (T-F Masking).
Les différentes pistes musicales (ou stems) d'une musique mélangeant plusieurs musiques sont réparties sur tout le spectre des fréquences audibles (20 à 2000 Hz) et chacune de ces pistes correspond à une gamme de fréquences.
C'est-à-dire que les voix, la batterie, les basses, etc. occupent différentes bandes de fréquences.
Ainsi, en utilisant le Time-Frequency Masking, les fréquences qui correspondent à une piste particulière peuvent être filtrées du mélange.
Ainsi, en filtrant chaque piste, nous nous retrouvons dans les pistes séparées de la piste mélangée donnée en entrée.