whisper

P2AC Whisper et P2AC SRT ont vocation à devenir open source. En attendant, deux modes d’utilisation sont possibles :
sur le PC du UserLab, pour profiter de la puissance du GPU (P2AC Whisper) ;
sur votre ordinateur, après test et installation à la MRGT.

Les logiciels P2AC sont gratuits, fonctionnent hors ligne et sont en amélioration continue. Vos usages et retours, dans le cadre de projets de recherche, sont précieux pour les faire évoluer.
N’hésitez pas à me contacter pour discuter de vos besoins ou de vos suggestions d’amélioration

Les logiciels P2AC Whisper et P2AC SRT sont la propriété de l’Université d’Angers et sont protégés par le droit d’auteur. Leur utilisation est autorisée uniquement dans le cadre des projets de recherche validés par la P2AC. Toute reproduction, diffusion, modification ou redistribution, totale ou partielle, en dehors de ce cadre nécessite l’accord préalable de la P2AC. En cas de publication ou de communication scientifique reposant sur ces outils, merci de citer : « Userlab P2AC, SFR Confluences, Université d’Angers ».

P2AC Whisper

P2AC Whisper est un logiciel de transcription audio/vidéo basé sur Whisper (OpenAI), l’un des modèles open source les plus performants aujourd’hui. Utilisé par les chercheurs, les médias et les professionnels, il offre une transcription multilingue fiable.

Il utilise les derniers modèles, fonctionne 100 % hors ligne pour garantir la confidentialité, et prend en charge plusieurs langues ainsi que le traitement CPU/GPU.
La diarisation PyAnnote permet en plus d’identifier automatiquement les différents locuteurs.

Après avoir sélectionné le modèle, la langue, le mode de calcul (CPU ou GPU) et éventuellement la diarisation, il suffit d’importer le fichier audio ou vidéo. Le logiciel se charge alors automatiquement de la transcription et de la séparation des locuteurs.

Dans l’exemple ci-après : un extrait vidéo de 1 min 40 est transcrit et diarisé en 36 secondes sur une station de travail équipée d’une carte graphique RTX 4000 (mode GPU activé).

Plusieurs formats de sortie sont générés automatiquement :

.srt : sous-titres, pour accompagner la lecture de la vidéo

.txt : transcription brute, sans diarisation

.xlsx : tableau avec la diarisation et la timeline des prises de parole

P2AC SRT

P2AC SRT est un outil conçu pour faciliter la correction de retranscriptions. Il fonctionne à partir d’une piste de sous-titres générée par P2AC Whisper, ainsi que du fichier audio ou vidéo correspondant.

Son interface permet de suivre la transcription, de l’ajuster en temps réel, puis d’exporter facilement une nouvelle piste de sous-titres mise à jour.

 

Retour en haut