VT2022 XXX fiche

From air
Revision as of 16:55, 11 December 2022 by Eve.Poitevin (talk | contribs)
Jump to navigation Jump to search

Résumé

Mots-Clés

Spleeter, Intelligence Artificielle, Deep Learning, Séparation de sources, Time-frequency masking

Abstract

Introduction

Acteurs du projet

Modèle utilisé

Time-Frequency Masking

Spleeter utilise une technique appelée Time-Frequency Masking (T-F Masking). Les différentes pistes musicales (ou stems) d'une musique mélangeant plusieurs musiques sont réparties sur tout le spectre des fréquences audibles (20 à 2000 Hz) et chacune de ces pistes correspond à une gamme de fréquences. C'est-à-dire que les voix, la batterie, les basses, etc. occupent différentes bandes de fréquences. Ainsi, en utilisant le Time-Frequency Masking, les fréquences qui correspondent à une piste particulière peuvent être filtrées du mélange. Ainsi, en filtrant chaque piste, nous nous retrouvons dans les pistes séparées de la piste mélangée donnée en entrée.

U-Net

Modèles pré-entraînés proposés

Caractéristiques du modèle

Projets utilisant Spleeter

Avantages et limites

Références