VT2022 XXX fiche: Difference between revisions

From air
Jump to navigation Jump to search
No edit summary
No edit summary
Line 18: Line 18:


==Time-Frequency Masking==
==Time-Frequency Masking==

Spleeter utilise une technique appelée Time-Frequency Masking (T-F Masking).
Les différentes pistes musicales (ou stems) d'une musique mélangeant plusieurs musiques sont réparties sur tout le spectre des fréquences audibles (20 à 2000 Hz) et chacune de ces pistes correspond à une gamme de fréquences.
C'est-à-dire que les voix, la batterie, les basses, etc. occupent différentes bandes de fréquences.
Ainsi, en utilisant le Time-Frequency Masking, les fréquences qui correspondent à une piste particulière peuvent être filtrées du mélange.
Ainsi, en filtrant chaque piste, nous nous retrouvons dans les pistes séparées de la piste mélangée donnée en entrée.


==U-Net==
==U-Net==

Revision as of 16:55, 11 December 2022

Résumé

Mots-Clés

Spleeter, Intelligence Artificielle, Deep Learning, Séparation de sources, Time-frequency masking

Abstract

Introduction

Acteurs du projet

Modèle utilisé

Time-Frequency Masking

Spleeter utilise une technique appelée Time-Frequency Masking (T-F Masking). Les différentes pistes musicales (ou stems) d'une musique mélangeant plusieurs musiques sont réparties sur tout le spectre des fréquences audibles (20 à 2000 Hz) et chacune de ces pistes correspond à une gamme de fréquences. C'est-à-dire que les voix, la batterie, les basses, etc. occupent différentes bandes de fréquences. Ainsi, en utilisant le Time-Frequency Masking, les fréquences qui correspondent à une piste particulière peuvent être filtrées du mélange. Ainsi, en filtrant chaque piste, nous nous retrouvons dans les pistes séparées de la piste mélangée donnée en entrée.

U-Net

Modèles pré-entraînés proposés

Caractéristiques du modèle

Projets utilisant Spleeter

Avantages et limites

Références