{
    "version": "https:\/\/jsonfeed.org\/version\/1.1",
    "title": "Заметки — Игорь К.: заметки с тегом транскрибация",
    "_rss_description": "Блог Игоря К. о маркетинге, аналитике, фотографии и жизни...",
    "_rss_language": "ru",
    "_itunes_email": "",
    "_itunes_categories_xml": "",
    "_itunes_image": "",
    "_itunes_explicit": "",
    "home_page_url": "https:\/\/blog.fossko.ru\/tags\/transkribaciya\/",
    "feed_url": "https:\/\/blog.fossko.ru\/tags\/transkribaciya\/json\/",
    "icon": "https:\/\/blog.fossko.ru\/pictures\/userpic\/userpic@2x.jpg?1610628098",
    "authors": [
        {
            "name": "Игорь К.",
            "url": "https:\/\/blog.fossko.ru\/",
            "avatar": "https:\/\/blog.fossko.ru\/pictures\/userpic\/userpic@2x.jpg?1610628098"
        }
    ],
    "items": [
        {
            "id": "510",
            "url": "https:\/\/blog.fossko.ru\/all\/transkribiruem-video-iz-telegrama\/",
            "title": "Транскрибируем видео из телеграма",
            "content_html": "<p>Когда требуется распознать видео с вебинара в телеграме, делаем следующее:<\/p>\n<ol start=\"1\">\n<li>Скачиваем видео к себе на компьютер<\/li>\n<li>Вытаскиваем аудиодорожку через ffmpeg<\/li>\n<\/ol>\n<pre class=\"e2-text-code\"><code class=\"\">ffmpeg -i video1014957119.mp4 video1014957119.mp3<\/code><\/pre><ol start=\"3\">\n<li>Транскрибируем через <a href=\"\/all\/rasshifrovka-audio-i-video\/\">whisper-ctranslate2 в Гугл колаб<\/a><\/li>\n<\/ol>\n<div class=\"e2-text-picture\">\n<img src=\"https:\/\/blog.fossko.ru\/pictures\/whisper-ctranslate2-audio-to-text-bystry.ipynb---Colaboratory---Google-Chrome-2023-05-12-12.44.30.jpg\" width=\"920\" height=\"416\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Фрагмент вебинара SEO c Ильей Карбышевом: <a href=\"https:\/\/t.me\/irinausichenko\/865\" class=\"nu\">«<u>SEO для редакторов<\/u>»<\/a><\/div>\n<\/div>\n",
            "date_published": "2023-05-12T12:51:24+03:00",
            "date_modified": "2023-05-12T12:51:21+03:00",
            "tags": [
                "автоматизация",
                "питон",
                "транскрибация"
            ],
            "image": "https:\/\/blog.fossko.ru\/pictures\/whisper-ctranslate2-audio-to-text-bystry.ipynb---Colaboratory---Google-Chrome-2023-05-12-12.44.30.jpg",
            "_date_published_rfc2822": "Fri, 12 May 2023 12:51:24 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "510",
            "_e2_data": {
                "is_favourite": false,
                "links_required": [
                    "highlight\/highlight.js",
                    "highlight\/highlight.css"
                ],
                "og_images": [
                    "https:\/\/blog.fossko.ru\/pictures\/whisper-ctranslate2-audio-to-text-bystry.ipynb---Colaboratory---Google-Chrome-2023-05-12-12.44.30.jpg"
                ]
            }
        },
        {
            "id": "508",
            "url": "https:\/\/blog.fossko.ru\/all\/rasshifrovka-audio-i-video\/",
            "title": "Расшифровка аудио и видео",
            "content_html": "<p>Когда требуется расшифровать аудиофайл, или ролик с ютуба, я пользуюсь whisper или whisper-ctranslate2 в среде <a href=\"https:\/\/colab.research.google.com\/\">Гугл колаб<\/a><\/p>\n<div class=\"e2-text-picture\">\n<div class=\"fotorama\" data-width=\"761\" data-ratio=\"1.4834307992203\">\n<img src=\"https:\/\/blog.fossko.ru\/pictures\/Untitled0.ipynb---Colaboratory---Google-Chrome-2023-04-21-14.35.15.jpg\" width=\"761\" height=\"513\" alt=\"\" \/>\n<img src=\"https:\/\/blog.fossko.ru\/pictures\/Untitled0.ipynb---Colaboratory---Google-Chrome-2023-04-21-14.36.18.jpg\" width=\"711\" height=\"309\" alt=\"\" \/>\n<\/div>\n<div class=\"e2-text-caption\">При использовании библиотеки whisper-ctranslate2 лучше использовать графическую карту — GPU. Меню → Среда выполнения → Сменить среду выполнения → GPU<\/div>\n<\/div>\n<pre class=\"e2-text-code\"><code class=\"\"># установка оригинального whisper\n!pip install git+https:\/\/github.com\/openai\/whisper.git\n\n# установка ffmpeg\n!sudo apt update &amp;&amp; sudo apt install ffmpeg\n\n# установка whisper-ctranslate2\n!pip install -U whisper-ctranslate2\n\n# установка yt-dlp для сохранения видео с ютуба\n!pip install yt-dlp<\/code><\/pre><p>Двойной символ && используется для запуска двух команд одновременно, если первая команда завершена успешно. Это означает, что если первая команда возвращает ошибку, то вторая команда не будет выполнена.<\/p>\n<p><a href=\"https:\/\/github.com\/Softcatala\/whisper-ctranslate2\">Гитхаб whisper-ctranslate2<\/a><\/p>\n<p>С декабря 2023 года выдается ошибка: «RuntimeError: Library libcublas.so.11 is not found or cannot be loaded»<br \/>\nДля исправления ошибки установите Cuda 11 командой:<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">!apt install libcublas11<\/code><\/pre><p>Скачивать будем ролик Ильи Бирмана из лекции <a href=\"https:\/\/ilyabirman.ru\/meanwhile\/all\/understanding-the-task\/\">о понимании задачи<\/a><\/p>\n<pre class=\"e2-text-code\"><code class=\"\"># качаем ролик id в mp3 в корень\n!yt-dlp -x --audio-format mp3 -o .\/birman_ponimanie_zadachi.mp3 -- PbnbwkoCQOE<\/code><\/pre><p>Распознавать можно whisper-ctranslate2 — по моим наблюдением расшифровывает в 2—3 раза быстрее чем оригинальный whisper.  На данный момент модель large-v2 самая полная.<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">#распознаем через whisper-ctranslate2\n!whisper-ctranslate2 &quot;birman_ponimanie_zadachi.mp3&quot; --language Russian  -o .\/result --model large-v2 --model_dir .\/model<\/code><\/pre><div class=\"e2-text-picture\">\n<img src=\"https:\/\/blog.fossko.ru\/pictures\/rasshifrovka-audio-i-video.png\" width=\"749\" height=\"558\" alt=\"\" \/>\n<div class=\"e2-text-caption\">Результат в консоле будет появляться по мере распознавания. Результирующие файлы будут в папке result в форматах .json, .srt, .tsv, .txt и .vtt. Например, в txt — только текст, в tsv — таймкоды, в vtt и srt — субтитры.<\/div>\n<\/div>\n<p>Через оригинальный whisper имеет смысл распознавать на компьютерах без видеокарт, это долго, но работает. Whisper требует версию питона 3.8—3.10, на других версиях не заработает.<\/p>\n<pre class=\"e2-text-code\"><code class=\"\">#распознаем через оригинальный whisper\n!whisper &quot;iliahov2.mp3&quot; -o .\/result --model large-v2 --model_dir .\/model<\/code><\/pre><p class=\"loud\">Если вам нужно что-то распознать или транскрибацию провести. Пишите в телеграм, договоримся :—)<\/p>\n",
            "date_published": "2023-04-21T15:13:37+03:00",
            "date_modified": "2024-03-12T00:01:53+03:00",
            "tags": [
                "автоматизация",
                "питон",
                "транскрибация"
            ],
            "image": "https:\/\/blog.fossko.ru\/pictures\/Untitled0.ipynb---Colaboratory---Google-Chrome-2023-04-21-14.35.15.jpg",
            "_date_published_rfc2822": "Fri, 21 Apr 2023 15:13:37 +0300",
            "_rss_guid_is_permalink": "false",
            "_rss_guid": "508",
            "_e2_data": {
                "is_favourite": true,
                "links_required": [
                    "jquery\/jquery.js",
                    "fotorama\/fotorama.css",
                    "fotorama\/fotorama.js",
                    "highlight\/highlight.js",
                    "highlight\/highlight.css"
                ],
                "og_images": [
                    "https:\/\/blog.fossko.ru\/pictures\/Untitled0.ipynb---Colaboratory---Google-Chrome-2023-04-21-14.35.15.jpg",
                    "https:\/\/blog.fossko.ru\/pictures\/Untitled0.ipynb---Colaboratory---Google-Chrome-2023-04-21-14.36.18.jpg",
                    "https:\/\/blog.fossko.ru\/pictures\/rasshifrovka-audio-i-video.png"
                ]
            }
        }
    ],
    "_e2_version": 4171,
    "_e2_ua_string": "Aegea 11.4 (v4171)"
}