• chevron_right

      Comment fouiller dans les sous-titres de 630 millions de vidéos Youtube ?

      news.movim.eu / Korben · Monday, 22 May, 2023 - 07:00 · 1 minute

    Imaginez un monde où vous pourriez chercher n’importe quoi à partir d’un mot clé dans les sous-titres de YouTube comme si vous cherchiez un mot dans un bouquin.

    Eh bien, mes amis, ce monde existe ! Et vous n’avez même pas besoin de sortir votre Tardis pour vous y rendre.

    Bah oui, parce qu’il arrive régulièrement qu’on cherche soit un passage dans une vidéo sans le retrouver, soit carrément une vidéo dans une mer d’autres vidéos sans jamais retomber dessus… Et ça, c’est triste ! Heureusement avec « Filmot « , ce problème va être vite résolu.

    Ce site permet très facilement de rechercher des mots clés ou des phrases spécifiques dans les sous-titres de plus de 630 millions de vidéos présentes sur YouTube, soit environ 48 millions de chaînes. Incroyable, non ?

    Par exemple, en entrant le mot « Korben » dans le petit champ de recherche, je peux en quelques instants retrouver toutes les vidéos qui parlent de moi. Ou si je cherche une expression comme « ceux qui ne sont rien » par exemple, et bien je peux en retrouver toutes les mentions dans tout un tas de vidéos.

    Exemple d'image de sous-titres de vidéos YouTube

    Alors, comment ça marche ? Hé bien c’est très simple.

    Il suffit d’aller sur le site Filmot, d’entrer votre recherche et voilà ! Les résultats s’afficheront grâce à la magie d’internet et vous pourrez même les filtrer s’il y en a trop. C’est presque trop beau pour être vrai !!

    Et si les sous-titres ne correspondent pas à l’audio ou à la langue de la vidéo, pas de souci. Comme les sous-titres sont générés automatiquement par YouTube, il peut évidemment y avoir des erreurs, mais vous pouvez toujours les signaler en cliquant sur le bouton « Report » de la vidéo concernée.

    Bref, super outil, super pratique ! À tester ici !

    • chevron_right

      Whisper-ui – Transcrire vos audios / vidéos bien au chaud dans une interface graphique

      news.movim.eu / Korben · Sunday, 30 April, 2023 - 07:00 · 1 minute

    Vous vous souvenez de Whisper, ce projet d’OpenAI qui permet de convertir au format texte, n’importe quel audio, ce qui permet par exemple de faire des transcriptions d’interview ou des sous-titres pour une vidéo ?

    J’avais même fait un tuto sur le sujet .

    Et bien bonne nouvelle, le codeur Abhay Kashyap a mis au point une interface graphique pour Whisper simplement nommée Whisper-ui. Cela fonctionne avec Streamlit et ça permet de se constituer une liste de média à traduire ou retranscrire très facilement.

    Capture d'écran de l'interface graphique de Whisper-ui montrant la transcription en cours d'un fichier audio

    Vous pourrez ensuite naviguer dans vos fichiers et les filtrer comme bon vous semble avec le moteur sur la gauche et évidemment récupérer la retranscription.

    Pour installer Whisper-ui, le plus simple c’est de passer par Docker puisqu’il y a un Docker-Compose fourni.

    git clone https://github.com/hayabhay/whisper-ui.git
    cd whisper-ui
    docker-compose up -d

    Puis vous rendre sur l’URL suivante : http://localhost:8501/

    Logo de Whisper-ui, représentant une icône de microphone avec le nom de l'application écrit en dessous

    Sinon, vous pouvez aussi l’installer directement :

    sudo apt install ffmpeg
    pip install -r requirements.txt

    Et lancer le script Python avec Streamlit :

    streamlit run app/01_🏠_Home.py

    Bref, c’est pratique, ça fait gagner du temps et ça permet d’éviter de se farcir tout en ligne de commande. Et si vous cherchez d’autres projets qui utilisent Whisper, y’a toute une liste merveilleuse ici ! Merci à Nobody pour l’info !

    + d’infos ici.

    • chevron_right

      Comment extraire les sous-titres incrustés d’une vidéo ?

      news.movim.eu / Korben · Thursday, 27 April, 2023 - 07:00 · 1 minute

    Aujourd’hui, j’ai déniché un petit outil qui devrait ravir tous les fans de séries, animés et films sous-titrés. On a presque tous déjà vécu cette frustration intense lorsque le texte des sous-titres est directement incrusté dans la vidéo et qu’on ne peut pas le récupérer pour corriger les fautes par exemple ou pour traduire les sous-titres automatiquement dans une autre langue.

    Heureusement, grâce à ce programme nommé VideoSubFinder , vous allez pouvoir extraire le texte incrusté dans une vidéo et le rendre utilisable pour créer de nouveaux sous-titres ou les traduire.

    Le fonctionnement est simple : le programme détecte automatiquement les frames avec du texte incrusté dans la vidéo (aussi appelé « hardsub ») et enregistre les positions et les timings. Ensuite, il génère des images de texte nettoyées de leur arrière-plan, ce qui permet ensuite d’utiliser un programme de reconnaissance optique de caractères (OCR) comme FineReader ou Subtitle Edit pour générer des sous-titres complets avec le texte d’origine et les timings.

    Image montrant l'interface d'un outil d'extraction de sous-titres d'une vidéo

    Fallait y penser non ?

    Ce programme est disponible pour Windows et Linux, mais certaines dépendances doivent être installées pour que tout fonctionne correctement. Si vous êtes utilisateur de Windows, vous devrez télécharger la lib Microsoft Visual C++ redistribuable 2022 , tandis que les utilisateurs d’Ubuntu 20.04.5 LTS devront installer libgtk-3-0.

    Cette petite application est vraiment pratique pour les gens qui manipulent des sous-titres, mais elle peut également être utile aux personnes qui travaillent dans le domaine de la traduction ou qui souhaitent simplement récupérer du texte à partir de vidéos.

    Amusez-vous bien !