WordPress极简博客 WordPress极简博客
  • 新鲜事
  • 战疫情
  • UI素材
    • UI素材
    • 电商/节日
    • PPT
      • 节日庆典
      • 工作汇报
      • 商业计划书
    • word
      • 简历竞聘
      • 合同/公文
  • 创客头条
    • 音乐分享
    • 初创文章
    • 极客头条
    • 生活趣事
    • 生活日记
    • 防骗指南
  • 编程教学
    • API日记
    • Linux安全栏目
      • Linux运维安全汇总
      • DDOS攻击防护
      • XSS攻击防护
      • SQL安全防护
    • Python技术栏目
      • Python基础入门
      • Python基础结构
    • WordPress技术栏目
      • WP主题
      • WordPress技术教程
      • RIPRO主题美化
    • WordPress漏洞发布
    • 技术教程汇总
    • 严选源码
  • 专题
  • 基友
  • 隐私
  • 注册
    登录
立即登录
  • 首页
  • 云优化
  • 新疫情
  • 新鲜事
    • 热文
    • 极客
    • 生活
  • 技术篇
    • WP主题
    • 技术教程
    • Python入门
    • Python基础
  • 专题篇
  • 友链君
首页 编程教学 Python基础结构 GitHub分享爬WEB视频

GitHub分享爬WEB视频

夏柔 7月 17, 2020

这篇文章分享的是高质量使用python一行代码爬任意web上的视频教程

该库无需安装第三方APP缓存来借助下载——Python神器库You-Ge

you-get
下载
本站高速下载

如果没有其他便捷的方法,You-Get是一个微型命令行实用程序,可从Web下载媒体内容(视频,音频,图像)。

使用教程

you-get -i "https://www.wpon.cn/XXX/XXX/"

上面可用哔哩哔哩的视频链接

这是you-get从YouTube下载视频的方法:

这就是您可能要使用它的原因:

  • 您在Internet上享受了一些东西,只是想自己下载就可以了。
  • 您可以从计算机上在线观看喜欢的视频,但是禁止保存它们。您感到无法控制自己的计算机。(这不是开放Web应该如何工作的方式。)
  • 您想摆脱任何封闭源技术或专有JavaScript代码,并禁止在计算机上运行Flash之类的东西。
  • 您是黑客文化和免费软件的拥护者。

有什么you-get可以为您做的:

  • 从YouTube,Youku,Niconico等热门网站下载视频/音频。(请参阅支持的网站完整列表)
  • 在媒体播放器中流式传输在线视频。没有网络浏览器,没有更多广告。
  • 通过抓取网页下载(感兴趣的)图像。
  • 下载任意非HTML内容,即二进制文件。

有兴趣吗 下面是教程,开始咯

您是Python程序员吗?然后检查出源并进行分叉!

前景需要

  • Python 3.2或以上
  • FFmpeg 1.0或以上
  • (可选)RTMPDump

选项1:通过pip安装

的正式发行版you-get已发布在PyPI上,并且可以通过pip软件包管理器从PyPI镜像轻松安装。请注意,您必须使用Python 3版本pip:

$ pip3 install you-get

选项2:通过Antigen安装(对于Zsh用户)

将以下行添加到您的.zshrc:

antigen bundle soimort/you-get

选项3:从GitHub下载

您可以下载的稳定版本(与PyPI的最新版本相同),也可以下载的开发(更多修补程序,不稳定的功能)分支you-get。解压缩它,然后将包含you-get脚本的目录放入您的中PATH。

或者,运行

$ [sudo] python3 setup.py install

要么

$ python3 setup.py install --user

安装you-get到永久路径。

选项4:Git克隆

即使您不经常使用Python编写代码,这也是所有开发人员的推荐方法。

$ git clone git://github.com/soimort/you-get.git

然后将克隆的目录放入您的中PATH,或运行./setup.py install以安装you-get到永久路径。

选项5:自制程序(仅限Mac)

您可以you-get通过以下方式轻松安装:

$ brew install you-get

选项6:pkg(仅FreeBSD)

您可以you-get通过以下方式轻松安装:

壳完成

Bash,Fish和Zsh的完成定义可以在中找到contrib/completion。请查阅您的Shell手册以了解如何利用它们。

升级中

根据您选择安装的选项you-get,可以通过以下方式进行升级:

$ pip3 install --upgrade you-get

或通过以下方式下载最新版本:

$ you-get https://github.com/soimort/you-get/archive/master.zip

为了在develop不弄乱PIP的情况下获得最新的分支,可以尝试:

$ pip3 install --upgrade git+https://github.com/soimort/you-get@develop

入门

下载影片

收到感兴趣的视频后,您可能需要使用--info/ -i选项查看所有可用的质量和格式:

$ you-get -i 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
site:                YouTube
title:               Me at the zoo
streams:             # Available quality and codecs
    [ DASH ] ____________________________________
    - itag:          242
      container:     webm
      quality:       320x240
      size:          0.6 MiB (618358 bytes)
    # download-with: you-get --itag=242 [URL]

    - itag:          395
      container:     mp4
      quality:       320x240
      size:          0.5 MiB (550743 bytes)
    # download-with: you-get --itag=395 [URL]

    - itag:          133
      container:     mp4
      quality:       320x240
      size:          0.5 MiB (498558 bytes)
    # download-with: you-get --itag=133 [URL]

    - itag:          278
      container:     webm
      quality:       192x144
      size:          0.4 MiB (392857 bytes)
    # download-with: you-get --itag=278 [URL]

    - itag:          160
      container:     mp4
      quality:       192x144
      size:          0.4 MiB (370882 bytes)
    # download-with: you-get --itag=160 [URL]

    - itag:          394
      container:     mp4
      quality:       192x144
      size:          0.4 MiB (367261 bytes)
    # download-with: you-get --itag=394 [URL]

    [ DEFAULT ] _________________________________
    - itag:          43
      container:     webm
      quality:       medium
      size:          0.5 MiB (568748 bytes)
    # download-with: you-get --itag=43 [URL]

    - itag:          18
      container:     mp4
      quality:       small
    # download-with: you-get --itag=18 [URL]

    - itag:          36
      container:     3gp
      quality:       small
    # download-with: you-get --itag=36 [URL]

    - itag:          17
      container:     3gp
      quality:       small
    # download-with: you-get --itag=17 [URL]

默认情况下,顶部的是您将获得的一个。如果这对您来说很酷,请下载:

$ you-get 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
site:                YouTube
title:               Me at the zoo
stream:
    - itag:          242
      container:     webm
      quality:       320x240
      size:          0.6 MiB (618358 bytes)
    # download-with: you-get --itag=242 [URL]

Downloading Me at the zoo.webm ...
 100% (  0.6/  0.6MB) ├██████████████████████████████████████████████████████████████████████████████┤[2/2]    2 MB/s
Merging video parts... Merged into Me at the zoo.webm

Saving Me at the zoo.en.srt ... Done.

(如果YouTube视频有任何隐藏字幕,它们将与视频文件一起以SubRip字幕格式下载。)

或者,如果您喜欢其他格式(mp4),则只需使用you-get显示的选项即可:

$ you-get --itag=18 'https://www.youtube.com/watch?v=jNQXAC9IVRw'

注意:

  • 目前,我们大多数受支持的网站尚未实现格式选择;在这种情况下,默认的下载格式是质量最高的格式。
  • ffmpeg 是必需的依赖项,用于下载和加入在多个部分(例如,在优酷等某些网站上)流式传输的视频,以及用于1080p或高分辨率的YouTube视频。
  • 如果您不想you-get在下载后加入视频部分,请使用--no-merge/ -n选项。

下载其他内容

如果您已经有了想要的确切资源的URL,则可以使用以下方法直接下载它:

$ you-get https://stallman.org/rms.jpg
Site:       stallman.org
Title:      rms
Type:       JPEG Image (image/jpeg)
Size:       0.06 MiB (66482 Bytes)

Downloading rms.jpg ...
100.0% (  0.1/0.1  MB) ├████████████████████████████████████████┤[1/1]  127 kB/s

否则,you-get将抓取网页并尝试找出是否有您感兴趣的东西:

$ you-get http://kopasas.tumblr.com/post/69361932517
Site:       Tumblr.com
Title:      kopasas
Type:       Unknown type (None)
Size:       0.51 MiB (536583 Bytes)

Site:       Tumblr.com
Title:      tumblr_mxhg13jx4n1sftq6do1_1280
Type:       Portable Network Graphics (image/png)
Size:       0.51 MiB (536583 Bytes)

Downloading tumblr_mxhg13jx4n1sftq6do1_1280.png ...
100.0% (  0.5/0.5  MB) ├████████████████████████████████████████┤[1/1]   22 MB/s

注意:

  • 此功能是一项实验功能,远非完美。它最适用于从Tumblr和Blogger等受欢迎的网站上抓取大尺寸图像,但是实际上没有适用于Internet上任何网站的通用模式。

在Google视频中搜索并下载

您可以将任何内容传递给you-get。如果该网址无效,you-get将进行Google搜索并为您下载最相关的视频。(这可能不完全是您希望看到的东西,但仍然很有可能。)

$ you-get "Richard Stallman eats"

暂停并继续下载

您可以使用Ctrl+ C中断下载。

临时.download文件保留在输出目录中。下次you-get使用相同的参数运行时,下载进度将从上一个会话恢复。如果文件已完全下载(临时.download扩展名已消失),you-get则将跳过下载。

要强制重新下载,请使用--force/ -f选项。(警告:这样做会覆盖任何同名的现有文件或临时文件!)

设置下载文件的路径和名称

使用--output-dir/ -o选项设置路径,并使用--output-filename/ -O设置下载文件的名称:

$ you-get -o ~/Videos -O zoo.webm 'https://www.youtube.com/watch?v=jNQXAC9IVRw'

提示:

  • 如果您遇到默认视频标题的问题,这些选项很有用,默认视频标题可能包含特殊字符,这些特殊字符在当前的shell /操作系统/文件系统中不能很好地播放。
  • 如果编写脚本来批量下载文件并将其放入具有指定名称的指定文件夹中,这些选项也很有用。

代理设定

您可以you-get通过--http-proxy/ -x选项指定要使用的HTTP代理:

$ you-get -x 127.0.0.1:8087 'https://www.youtube.com/watch?v=jNQXAC9IVRw'

但是,http_proxy默认情况下将应用系统代理设置(即环境变量)。要禁用任何代理,请使用该--no-proxy选项。

提示:

  • 如果你需要使用代理了很多(如果您的网络阻止某些网站),你可能希望使用you-get与proxychains和集alias you-get="proxychains -q you-get"(Bash中)。
  • 对于某些网站(例如,优酷网),如果您需要访问某些仅在中国大陆可用的视频,则可以选择使用特定的代理从站点中提取视频信息:--extractor-proxy/ -y。

观看影片

使用--player/ -p选项将视频输入到您选择的媒体播放器中,例如mpv或vlc,而不是下载它:

$ you-get -p vlc 'https://www.youtube.com/watch?v=jNQXAC9IVRw'

或者,如果您希望在浏览器中观看视频,而没有广告或评论部分:

$ you-get -p chromium 'https://www.youtube.com/watch?v=jNQXAC9IVRw'

提示:

  • 可以使用该-p选项启动另一个下载管理器,例如you-get -p uget-gtk 'https://www.youtube.com/watch?v=jNQXAC9IVRw',尽管它们可能不能很好地配合使用。

加载cookie

并非所有人都可以公开获得所有视频。如果您需要登录帐户访问某些内容(例如私人视频),则不可避免地需要you-get通过--cookies/ -c选项将浏览器Cookie馈入。

注意:

  • 到目前为止,我们支持两种浏览器cookie格式:Mozilla cookies.sqlite和Netscape cookies.txt。

重用提取的数据

使用--url/ -u获取从页面提取的可下载资源URL的列表。使用--json得到一个抽象提取数据的JSON格式。

警告:

  • 暂且,这个功能已经不被稳定和JSON模式可能在未来的重大更改。

支持的网站

现场网址影片?图片?音频?
YouTubehttps://www.youtube.com/✓
推特https://twitter.com/✓✓
VKhttp://vk.com/✓✓
藤蔓https://vine.co/✓
Vimeohttps://vimeo.com/✓
威欧http://www.veoh.com/✓
Tumblrhttps://www.tumblr.com/✓✓✓
泰德http://www.ted.com/✓
声云https://soundcloud.com/✓
展示厅https://www.showroom-live.com/✓
Pinterest的https://www.pinterest.com/✓
MTV81http://www.mtv81.com/✓
混合云https://www.mixcloud.com/✓
咖啡馆http://www.metacafe.com/✓
Magistohttp://www.magisto.com/✓
可汗学院https://www.khanacademy.org/✓
互联网档案馆https://archive.org/✓
Instagram的https://instagram.com/✓✓
InfoQhttp://www.infoq.com/presentations/✓
伊姆古尔http://imgur.com/✓
重音乐档案http://www.heavy-music.ru/✓
自由声音http://www.freesound.org/✓
Flickrhttps://www.flickr.com/✓✓
FC2视频http://video.fc2.com/✓
脸书https://www.facebook.com/✓
如何http://www.ehow.com/✓
Dailymotionhttp://www.dailymotion.com/✓
库布http://coub.com/✓
哥伦比亚广播公司http://www.cbs.com/✓
乐队夏令营http://bandcamp.com/✓
泰国活着http://alive.in.th/✓
interest.mehttp://ch.interest.me/tvn✓
755 
ナナゴーゴー
http://7gogo.jp/✓✓
niconico 
ニコニコ动画
http://www.nicovideo.jp/✓
163 
网易视频
网易云音乐
http://v.163.com/ 
http://music.163.com/
✓✓
56网http://www.56.com/✓
娱乐http://www.acfun.cn/✓
百度
百度贴吧
http://tieba.baidu.com/✓✓
爆米花网http://www.baomihua.com/✓
bilibili 
哔哩哔哩哩
http://www.bilibili.com/✓✓✓
豆瓣http://www.douban.com/✓✓
斗鱼http://www.douyutv.com/✓
凤凰视频http://v.ifeng.com/✓
风行网http://www.fun.tv/✓
爱奇艺
爱奇艺
http://www.iqiyi.com/✓
激动网http://www.joy.cn/✓
酷6网http://www.ku6.com/✓
酷狗音乐http://www.kugou.com/✓
酷我音乐http://www.kuwo.cn/✓
乐视网http://www.le.com/✓
荔枝FMhttp://www.lizhi.fm/✓
秒拍http://www.miaopai.com/✓
MioMio弹幕网http://www.miomio.tv/✓
MissEvan 
猫耳FM
http://www.missevan.com/✓
痞客邦https://www.pixnet.net/✓
PPTV聚力http://www.pptv.com/✓
齐鲁网http://v.iqilu.com/✓
QQ 
腾讯视频
http://v.qq.com/✓
企鹅直播http://live.qq.com/✓
新浪
新浪视频
微博秒拍视频
http://video.sina.com.cn/ 
http://video.weibo.com/
✓
搜狐搜狐
视频
http://tv.sohu.com/✓
土豆网
土豆
http://www.tudou.com/✓
虾米http://www.xiami.com/✓✓
阳光卫视http://www.isuntv.com/✓
音悦台http://www.yinyuetai.com/✓
优酷
优酷
http://www.youku.com/✓
战旗电视http://www.zhanqi.tv/lives✓
央视网http://www.cntv.cn/✓
Naver 
네이버
http://tvcast.naver.com/✓
芒果TVhttp://www.mgtv.com/✓
火猫电视http://www.huomao.com/✓
阳光宽频网http://www.365yg.com/✓
西瓜视频https://www.ixigua.com/✓
新片场https://www.xinpianchang.com//✓
快手https://www.kuaishou.com/✓✓
抖音https://www.douyin.com/✓
TikTokhttps://www.tiktok.com/✓
中国体育(电视)http://v.zhibo.tv/ 
http://video.zhibo.tv/
✓
知乎https://www.zhihu.com/✓

对于不在列表中的所有其他站点,通用提取器将负责从页面中查找和下载有趣的资源。

已知错误

如果某件东西坏了,you-get不能让您得到想要的东西,请不要惊慌。(是的,这种情况一直发生!)

在https://github.com/soimort/you-get/wiki/Known-Bugs上检查是否已经是已知问题。如果不是,请遵循有关如何报告问题的准则。

参与进来

您可以在Gitter频道#soimort / you-get上与我们联系(这是为Gitter 设置IRC客户端的方式)。如果您有关于的快速问题you-get,请在此处提问。

如果您要报告问题或做出贡献,请确保首先阅读准则。

法律问题

该软件是根据MIT许可发行的。

特别是请注意

  • 本软件按“原样”提供,不提供任何形式的明示或暗示的保证,包括但不限于对适销性,特定目的的适用性和非侵权性的保证。无论是由于软件,使用或其他方式产生的,与之有关或与之有关的合同,侵权或其他形式的任何索赔,损害或其他责任,作者或版权所有者概不负责。软件。
#3.2#Flash#GitHub#Internet#JavaScript#pip#python#you-get
1
J2dcg1.png
猜你喜欢
  • Python字符串的基础笔记
  • Python赋值语句讲解
  • Python字符串的格式化输出
  • Python字符串之切片例子大全
  • Python简单的内置函数
  • Python从入门到中级工程师131~150期
  • Python从入门到中级工程师111~130期
  • Python从入门到中级工程师91~110期
  • Python从入门到中级工程师71~90期
  • Python从入门到中级工程师51~70期
01 5月, 2020
以忍者形式修补的高度严重漏洞
夏柔
站长
夏山如碧 - 怀柔天下
1725
文章
25
评论
58145K
获赞
版权声明

文章采用创作共用版权 CC BY-NC-ND/2.5/CN 许可协议,与本站观点无关。

如果您认为本文侵犯了您的版权信息,请与我们联系修正或删除。
投诉邮箱wpsite@aliyun.com

栏目推荐
Python基础入门33
WordPress技术教程267
前沿技术情报所22
城市创新——新消费11
最近有哪些不可错过的热文23
程序员的养生之道0
节
春
  • 新鲜事
  • 疫情实况
  • UI素材
  • 技术教程
  • 音乐分享
  • 专题
  • 友情
  • 隐私
  • 云优化
Copyright © 2019-2025 WordPress极简博客. Designed by 夏柔. 辽公网安备21010502000474号 辽ICP备19017037号-2