影片下載轉檔筆記 ( Youtube 、 Twitch 、 TwitCasting 、 Twitter Spaces 音訊空間、 fc2 live 、 ffmpeg 、 yt-dlp )

序言

本文記述下載 Youtube 、 Twitch 、 TwitCasting 、 Twitter Spaces 音訊空間,和影片轉檔的幾個常用工具和指令

延伸閱讀
關於監控、自動下載請見這篇
[Docker] 直播監控、自動影片下載筆記 ( Youtube 、 Twitch 、 TwitCasting 、 Twitter Spaces 音訊空間)
你可能也想看
讓軟體工程師告訴你,我如何讓我的V豚DD生活更加舒適
目錄

下載: yt-dlp

GitHub: https://github.com/yt-dlp/yt-dlp
下載點: https://github.com/yt-dlp/yt-dlp/releases/latest

yt-dlp 依賴於 ffmpeg 執行,請同時安裝 ffmpeg

yt-dlp 分家自 youtube-dl,它涵蓋 youtube-dl 的所有功能,並且有著更多的功能,更多的 patch,更活躍的開發社群。 除了Youtube外它也支援很多其它影片站,包括 niconico、twitch、twitcasting、twitter、facebook,這裡是完整清單。 此處是完整的說明書輸出檔名說明格式指定說明

列出所有影片格式

這條並不會執行下載,它會印出能下載的所有格式後結束 (如同此文首圖)

yt-dlp -F [url]

下載指定的影片格式

如果你要下載最高畫質的格式,不要傳入此參數,預設已是最高畫質!
此預設值為bestvideo*+bestaudio/best

有關於bestvideo+bestaudiobest的解釋
best: 最好的格式
bestvideo+bestaudio: 最好的影片格式、最好的音訊格式,並在下載完合併為一檔案

Youtube 對於影像音訊合一檔案最高只提供到 720p 畫質,再往上皆是分離格式,也就是說以best最多只能在 Youtube 下載到720p影片!
這也是為什麼各個瀏覧器擴充、下載網站不會給你高於 720p 的影片,因為瀏覧器中無法進行合併作業,而在伺服器上運算會產生額外的主機開銷。

以下範例為「下載影像 137 格式、音訊 251 格式後合併檔案」

yt-dlp -f 137+251 [url]

帶入 cookie file 下載,以下載需要登入才能瀏覧的影片

對於需要登入後才能瀏覧的影片,像是會員限定影片、Facebook 私密社團影片等,yt-dlp 支援傳入 cookies file過驗證。

取得 cookies file 的方法
  • 安裝瀏覧器擴充功能,以匯出 Netscape HTTP Cookie File
  • 開啟無痕視窗! 原因見此 issue
  • 瀏覧至 Youtube 網頁,登入你的帳號
  • 以擴充功能匯出youtube.com網域的所有 cookie
  • 將匯出之 cookie 檔案重命名為cookies.txt
注意
此 cookies file 包含了你的 Youtube 登入授權
任何人只要取得這個檔案,即可以你的身份操作 Youtube
務必妥善保管,它比帳號密碼更加重要
yt-dlp --cookies "cookies.txt" [url]

帶入瀏覧器中的 cookie 下載,以下載需要登入才能瀏覧的影片

yt-dlp 也能直接從你的瀏覧器扒出 cookie,以使用相關網站的登入狀態。
支援的瀏覧器: brave, chrome, chromium, edge, firefox, opera, safari, vivaldi

注意
在使用此指令時必須關閉你的瀏覧器! 原因見此 issue
yt-dlp --cookies-from-browser chrome [url]

在影片檔嵌入描述和影片縮圖

yt-dlp --embed-thumbnail --embed-metadata [url]
有時縮圖格式會是 webp,而 webp 無法顯示在檔案總管
加上--convert-thumbnails jpg把它一律轉檔為 jpg
yt-dlp --embed-thumbnail --convert-thumbnails jpg --embed-metadata [url]

輸出檔名範本

參數清單在此: https://github.com/yt-dlp/yt-dlp#output-template

yt-dlp -o "%(upload_date)s %(title)s (%(id)s).%(ext)s" [url]

使用 aria2c 下載器平行下載

下載點: https://github.com/aria2/aria2/releases/latest

串流處理過的影片會切成數個小段落傳輸,或是允許客戶端請求指定的檔案片段,這正好適合使用 aria2c 平行下載。
下方的範例使用 16 條連線平行下載,它幾乎可以吃到我 300M 的網速上限

yt-dlp --external-downloader aria2c --external-downloader-args "-j 16 --retry-wait 10 --max-tries 10" [url]

下載並封裝為 mp4、mkv 格式

必需注意編碼是否能封進對應的封裝格式,否則請不要給此參數,yt-dlp 會自動選出合適的

yt-dlp --merge-output-format mp4 [url]
yt-dlp --merge-output-format mkv [url]

不下載 dash 檔案

dash 在 Youtube 是直播中提供的格式,是轉檔前的格式
你可以用這個參數以避開它,yt-dlp 會在只有 dash 格式時報錯退出

yt-dlp --youtube-skip-dash-manifes [url]

下載開源格式

這裡的格式是指 Google 自己的 vp8、vp9 格式 webm。它的壓縮率(通常)較 mp4 好,但要等 youtube 轉檔完才有。 建議搭配 merge-output-format 封裝為 mkv,不要把它裝進 mp4

yt-dlp --prefer-free-formats [url]

直播由起始下載

對,就是和 ytarchive 一樣的功能。

不知道 yt-dlp 哪裡沒處理好,約 1/5 的機率它不會合併影片或是殘留碎片檔案。
別用這個,用下一小節介紹的 ytarchive。
https://github.com/yt-dlp/yt-dlp/issues/2137
yt-dlp --live-from-start [url]

小結

把上面那串全部整理起來能得到下方幾個腳本

  1. 下載(通常壓縮率更好的) mkv
  2. 下載 mp4
  3. 下載 mkv,然後丟進 mkclean 處理,詳請見 #mkclean
  4. 下載 mkv,然後執行 cues_to_front 處理,詳請見 #cues_to_front

下載: ytarchive

展開

GitHub: https://github.com/Kethsar/ytarchive
下載: 安裝 golang 後執行 go install github.com/Kethsar/ytarchive@master
Docker: https://github.com/jim60105/docker-ytarchive

如果直播已開始,且你預測直播在結束後會直接砍檔,ytarchive 就能派上用場了! yt-dlp 在錄直播時是從現時點開始錄,你會失去已過去的直播部份,而 ytarchive 是由直播的開頭起始下載

yt-dlp 在2021/12/25實作了 --live-from-start ,基本上完全取代了 ytarchive 的功能。
但不知道 yt-dlp 哪裡沒處理好,約 1/5 的機率它不會合併影片或是殘留碎片檔案。
這讓 ytarchive 留下了一條生路,ytarchive 表現非常穩定

下載直播

注意格式是放在 url 後面,它和 yt-dlp 的傳參數方式不相同

ytarchive -w [url] best

帶入 cookie 下載,以下載需要登入才能瀏覧的影片

對於需要登入後才能瀏覧的影片(會員限定影片),ytarchive 支援傳入 cookies file 過驗證。 取得 cookies file 的詳細步驟和上述相同,請見這裡

ytarchive -w -c cookies.txt [url] best

在影片檔嵌入描述和影片縮圖

ytarchive -w --add-metadata -t [url] best

輸出檔名範本

參數清單和 youtube-dl 相同

ytarchive -w -o "%(upload_date)s %(title)s (%(id)s)" [url] best

下載: Youtube Segment Downloader (Youtube 片段下載器)

GitHub: https://github.com/jim60105/YoutubeSegmentDownloader

Youtube 片段下載器,指定秒數而不用下載整部影片
適合任何需要從 Youtube 下載影片段的人
這是我寫的

下載: Streamlink

GitHub: https://github.com/streamlink/streamlink
Docker: https://github.com/rayou/docker-streamlink

Streamlink 是串流下載的專用工具,它是為 twitch 開發
它也能用在 Youtube 直播,但 Youtube 上更推薦用 yt-dlp
反過來也是,yt-dlp 在抓 twitch 時常遇到檔案損壞,twitch 請愛用 Streamlink

我很少載 twitch,用不到複雜的選項,完整的說明書在此

streamlink --twitch-disable-ads [url] "best"

下載: twitcasting-recorder

GitHub: https://github.com/jim60105/twitcasting-recorder
Docker: https://github.com/jim60105/docker-twitcasting-recorder

這是 twitcasting 專用串流錄影工具
錄 twitcasting 這事我試了能我找到的所有工具,而這是唯一一個能運作的 ← 這是兩年前的經驗,現在 yt-dlp 能正常運行

這是錄串流專用的,如果是下載既有影片請用 yt-dlp
python main.py [url]

下載: fc2-live-dl

GitHub: https://github.com/HoloArchivists/fc2-live-dl
Docker: https://github.com/jim60105/docker-fc2-live-dl

這是 live.fc2.com 專用串流錄影工具,一般頻道和成人頻道都可使用

這是錄串流專用的,如果是下載既有影片請用 yt-dlp

安裝

pip install --upgrade fc2-live-dl

下載詳見 Readme

fc2-live-dl [url]

下載: twspace-dl

GitHub: https://github.com/Ryu1845/twspace-dl

這是 twitter space 音訊空間專用下載工具
我參與了它的 dockerize

下載完整存檔的方式
  1. 在結束後以 space url 下載,但 space 有可能被刪除
  2. 在直播時取得 master url,並在結束後下載,master url 會存活一個月

下載「正在開的」音訊空間

twspace_dl -U [twitter account url]

以space url下載音訊空間

twspace_dl -i [space url]

取得「正在開的」音訊空間的master url

twspace_dl -U [twitter account url] -u -s

以master url下載完整的音訊檔案

twspace_dl -U [twitter account url] -f [master url]
注意
由於 Twitter API 變更,2023 年 7 月 1 日後禁止用戶匿名存取 Twitter API 端點,因此必須 -c cookies.txt 帶入 cookie。

下載: Stream Recorder (Chrome 擴充功能)

官方站: https://www.hlsloader.com/
下載點: https://chrome.google.com/webstore/detail/stream-recorder-download/iogidnfllpdhagebkblkgbfijkbkjdmm

此工具適合用來下載 yt-dlp 未支援的其它小站點。
它是抓取網頁頁面中的影片流,當其它工具失效時,此工具值得一試。

轉檔: ffmpeg

官方站: https://ffmpeg.org
下載點: https://ffmpeg.org/download.html

轉檔就用 ffmpeg,沒有第二選擇。
下方列幾個我常用的指令,完整指令表見說明書

mp4 轉 mkv

封裝格式是以附檔名指定
mkv 可以封裝所有 mp4 能裝的格式,所以可以加上-c copy使之複製內容,不重新編碼。
反過來 mkv 轉 mp4 時可能不行,要看編碼格式。如果裝不進去就去掉 -c 參數讓它自動轉檔。

ffmpeg -i in.mp4 -c copy out.mkv

加封面圖至 mkv

這裡指的封面圖,是在檔案總管能讀出的縮圖

ffmpeg -i in.mkv -c copy -map 0 -dn -attach cover.png -metadata:s:t mimetype=image/png -metadata:s:t filename=cover.png out.mkv

加封面圖至 mp4

這裡指的封面圖,是在檔案總管能讀出的縮圖

ffmpeg -i in.mp4 -i cover.png -map 1 -map 0 -c copy -disposition:0 attached_pic out.mp4

移除某一個軌道(移除指定的音軌、視訊、圖檔、字幕)

在移除前需要先確定要移除的軌道編號,這裡要使用和 ffmpeg 搭配的另一個工具: ffprobe

ffprobe video.mp4

此指令會印出所有軌道的內容,如下圖,第 0 軌是視訊、第 1 軌是音訊、第 2 軌是 jpg 附檔

接下來使用反向 mapping: 將所有軌道導入後,減去不要的軌道
下方示範去掉 jpg 附檔,也就是第 2 軌,關鍵在於-0:2

ffmpeg -i in.mp4 -map 0 -map -0:2 -c copy out.mp4
更多有關 negative mapping 的範例請見

mp4 faststart

mp4 檔案的 moov atom (內包含了影片的索引) 預設是放在影片的最末尾。這不利於網路串流,無法查找索引,你必需從頭下載檔案才能播放。使用-movflags faststart參數以把 moov atom 移至片頭以解決這個問題。

強烈建議所有上傳網路分享的 mp4 檔都要做這道處理,這樣線上預覧才能正確串流。-movflags faststart參數可以和其它 mp4 轉檔指令合併使用。

原文說明: 出處
Run a second pass moving the index (moov atom) to the beginning of the file. This operation can take a while, and will not work in various situations such as fragmented output, thus it is not enabled by default.
ffmpeg -i in.mp4 -c copy -map 0 -movflags +faststart out.mp4

mkv cues_to_front

請參考 mkclean

mkv 檔案的索引 (在 mkv 稱做 cues) 預設是放在影片的最末尾。這不利於網路串流,無法查找索引,你必需從頭下載檔案才能播放。使用-cues_to_front yes參數以把 cues 移至片頭以解決這個問題。

我建議將上傳空間分享的 mkv 檔做這道轉檔
注意,這在 ffmpeg 算是個新功能,從 ffmpeg 5.1 版開始支援。現時點不少網路空間並不支援 mkv cues_to_front 串流,它們照樣從頭開始下載。

原文說明: 出處
If set, the muxer will write the index at the beginning of the file by shifting the main data if necessary. This can be combined with reserve_index_space in which case the data is only shifted if the initially reserved space turns out to be insufficient.

This option is ignored if the output is unseekable.
ffmpeg -i in.mkv -c copy -cues_to_front yes out.mkv

依時間剪切影片,不重新編碼

詳細說明請見
注意
未重新編碼時,會因為關鍵幀位置導致起始畫面凍結,以及影片長度不準確
移除-c copy參數以進行重編碼

注意參數順序造成的差異

以下範例為剪出「由第 1 分鐘起,長 2 分鐘」

ffmpeg -ss 00:01:00 -i in.mp4 -to 00:02:00 -c copy out.mp4

以下範例為剪出「由第 1 分鐘起,到第 2 分鐘止 (長 1 分鐘)」

ffmpeg -i in.mp4 -ss 00:01:00 -to 00:02:00 -c copy out.mp4

轉檔為 Youtube 的建議格式

影片重編碼
ffmpeg -i in.mkv -c:v libx264 -preset slow -crf 18 -c:a copy -pix_fmt yuv420p out.mkv
影片、音訊重編碼,加上-movflags +faststart
ffmpeg -i in.mkv -c:v libx264 -preset slow -crf 18 -c:a aac -b:a 192k -pix_fmt yuv420p -movflags +faststart out.mp4

把多個影片一個接一個的合併在一起

有三種選擇,如果不確定要使用哪種方法,請嘗試使用 concat demuxer。
  • concat video filter

    如果你的多個資料(影片、音訊等)的參數(像是寬度、高度)不一致,或是格式和編碼方式不同,或者你想要對資料做一些過濾處理的話,就可以使用這個方法。
    請注意,這個方法會重新編碼所有的資料。如果不想重新編碼所有的資料,你可以只編碼不符合的那部分資料,讓它們有一致的編碼方式和其他參數。然後使用 concat demuxer 來避免重新編碼所有的資料。
    ffmpeg -i opening.mkv -i episode.mkv -i ending.mkv -filter_complex "[0:v] [0:a] [1:v] [1:a] [2:v] [2:a] concat=n=3:v=1:a=1 [v] [a]" -map "[v]" -map "[a]" output.mkv
  • concat demuxer

    如果你不想重新編碼資料且你的格式不支援直接串接多個檔案,請使用這個方法。適用在 MP4 格式。
    (echo file 'first file.mp4' & echo file 'second file.mp4' )>list.txt
    ffmpeg -safe 0 -f concat -i list.txt -c copy output.mp4
    簡單解釋,你需要創建一個 txt 檔,其中列出了要合併哪些檔案,然後把這個 txt 檔傳入 ffmpeg -f concat
  • concat protocol

    這個方式只適用在支援直接串接多個檔案的格式,像是 MPEG-1、MPEG-2 PS 和 DV 格式。不適用 MP4 格式。
    ffmpeg -i "concat:input1|input2" -codec copy output.mkv

附錄: mkclean

官方站: https://www.matroska.org/downloads/mkclean.html
下載點: https://sourceforge.net/projects/matroska/files/mkclean/

mkclean 是一個命令行工具,可以清理和最佳化 Matroska(.mkv/.mka/.mks/.mk3d) 和 WebM(.webm/.weba) 這些已被合併的檔案。它會將 Element 重新排序,將 Cues 放在前面,這樣你的 Matroska 文件就可以在網絡上有效率地串流。

mkclean in.mkv out.mkv
延伸閱讀

19 則留言:

  1. 你好
    Twspace-dl
    最近會出現
    RuntimeError: No guest token found after five retry

    回覆刪除
    回覆
    1. https://github.com/Ryu1845/twspace-dl/issues/28
      是closed issue,還未release
      但docker image有做CI,用docker的話pull image就行

      刪除
  2. 您好 我本身是使用 macos
    在官網上用 go install github.com/Kethsar/ytarchive@master 安裝成功後
    輸入指令都會跑出 zsh: command not found: ytarchive
    請問要如何解決 謝謝

    回覆刪除
  3. 您好,想請問如何用ffmpeg合成ytarchive下載直播出來的兩個ts檔?

    回覆刪除
    回覆
    1. 正常來說它會自動合併,你可以試試都用-i塞進去
      ffmpeg -i video.ts -i audio.ts -c copy out.mkv

      刪除
  4. 大大您好,我是Youtube Segment Downloader的使用者,很感謝您做了如此好用的工具
    近日使用這套工具時在按下"開始"後,準備的過程都會閃退
    我換了3款電腦下載使用,也重新安裝,換過別的YT影片抓皆無法解決
    只好冒昧前來詢問是否有解方

    回覆刪除
    回覆
    1. 目前測試了幾部片子皆可正常下載,十分感謝大大的處理,這工具幫我在後製剪片蒐集素材有極大幫助

      刪除
  5. 您好,我已將 yt-dlp、ffmpeg的檔案都下載到本機至同個衣料夾中,不過在使用yt-dlp.exe時會立刻閃退,請問有可能的原因嗎?

    回覆刪除
    回覆
    1. 你是不是直接雙擊執行它?
      請在 cmd 或 powershell 執行指令喔

      刪除
  6. 你好 想請問 twitch用Streamlink錄製(開播時當下人不在想重頭開始錄)有像 yt-dlp --live-from-start的指令嗎或者ytarchive的方法嗎?

    回覆刪除
  7. 請問取得真實網址的方法有哪些,例如有些網頁,可以用ant video downloader或IDM知道,然後就可以用yt-dlp下載,但是最近有些網頁改版後,例如gim*,如果這種情況只能得到一些無法用yt-dlp下的網址,只能選擇用錄的嗎?謝謝

    回覆刪除
    回覆
    1. Stream Recorder 也不能用的話就大概沒救

      刪除
  8. 您好,想請問一下,由於YT管制加強,有些vtuber開始移動到RPLAY這個平台直播,請問這個平台有辦法用YT-DLP錄製直播檔嗎?

    回覆刪除
    回覆
    1. 可能不行
      https://github.com/yt-dlp/yt-dlp/blob/master/supportedsites.md

      刪除
  9. 網誌管理員已經移除這則留言。

    回覆刪除

本站遭到垃圾留言(病毒連結)攻擊,開啟審核模式。留言後並不會馬上公開顯示。

目錄