博客
电影
宝箱
友链
关于
<
纪德《帕吕德》,日复一日的人生
读《抉择时刻》,小布什自传
>
从youtube观看记录分析时长
作者:
Cifer
类别: 技术
时间:2020-05-22 22:02:16
字数:2817
版权所有,未经允许,请勿转载,谢谢合作~
#### 前言 最近看到一个<a href="https://www.boatsky.com/blog/107">从youtube观看记录分析时长</a>的开源脚本 <a href="https://gitlab.com/viktomas/total-youtube-watchtime" target="_blank">https://gitlab.com/viktomas/total-youtube-watchtime</a>,实践了一下,并把过程简化后记录下来,最后对youtube表达一些观点。 跑个别人的脚本就写篇博客,是不是太水了?一方面,这个脚本要跑通,虽然简单,但流程较多;另一方面youtube每月登录用户超过20亿(对比微信月活跃用户11亿),说不定会有人需要。 #### 一、 导出Google账号的JSON数据 1.在已经登录google情况下,打开数据选择页<a href="https://takeout.google.com/" target="_blank">https://takeout.google.com/</a> 2.反选“Deselect all”,只选择 YouTube and YouTube Music 3.点击“Multiple Formats”,选择History “JSON”格式,确认。 4.再次点击“All YouTube data included”,只选择history 5.下一步后,使用默认设置即可(send download link via email)(export once) (zip)(2GB), 然后Create export 导出。 6.进入Gmail进行确认,这是本人操作,然后下载,获得其中的watch-history.json文件 #### 二、 获取youtube data api key 上述watch-history.json只是一个目录文件,更多的详情需要去youtube拉取,而在这之前,我们需要有一个权限认证钥匙。 1.打开<a href="https://console.developers.google.com" target="_blank">https://console.developers.google.com</a> 2.点击导航中的选项弹窗,创建一个项目 NEW PROJECT (如果你原本就有用原来的也可以), 以下操作都在这个项目下进行。 3.在“Credentials”界面,进行创建凭证,Create credentials > API key 。拿到你的your_API_key 4.这时your_API_key并不能直接使用,因为没有对这个key进行授权。在“Dashboard”界面, 开启对应的api与服务, 点击“ENABLE APIS AND SERVICES”后,选择“YouTube Data API V3”。这样这个key就有相关授权。 #### 三、下载脚本,进行分析 1.你需要安装 git, node (版本10+), npm 如果不是开发者,在Mac下可以如下安装 安装git ```` git —version ```` 会提示你自己安装 安装node ```` ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" sudo brew install node ```` 第一步是安装Homebrew,如曾经安装过则跳过,直接第二步。npm与node是绑定安装的,无需另外安装。 最后从版本号,确认三者被安装了 ```` git --version node -v npm -v ```` 2.如果有了以上三个软件,正式开始,首先下载脚本。 ```` git clone https://gitlab.com/viktomas/total-youtube-watchtime.git ```` 3.进入下载的脚本项目 total-youtube-watchtime中,把之前的watch-history.json文件放至其根目录。 4.安装脚本的npm依赖包。 ```` npm install ```` 5.拉取数据 ```` API_KEY=<your_API_key> npm run fetch ```` 几分钟之后,脚本会下载详情数据放到根目录的db.json,并且会把你观看youtube的时长插入其中。 6.生成图形页 ```` npm run generate ```` 会在根目录生一个report.html文件,使用浏览器打开它即可。 ```` npm run stats ```` 查看浏览次数最多的视频。 #### 这个脚本的问题 脚本下面已经写明了,有很多youtube的视频已经删除了,取不到它的数据。其二,观看时间取的是视频本身的时长,不是你真正的观看时间,真正的观看时长估计youtube也没去记录(也很难计算,原因想想就知道)。它是假设点开的视频都看完了,主要是进行大致的预估。 #### 从youtube观看时长的一些思考。 Cifer本身在高峰时期,一个月的youtube时长高达100小时+,而大部分时候都会选择完整的看完全视频,虽然是用得2倍速,这算下来时间也耗费不少。 在不同的年龄段,按时间顺序,用过比较长时间相关产品,天涯论坛(启蒙),QQ空间(个人空间年代),百度贴吧(看盗版小说年代),YY语音(公会听排队翻唱歌曲时代,那时几乎没有视频直播,都是听歌打游戏),微信朋友圈(readonly),知乎(那年还有人用知识答题),youtube。几乎以上哪种产品,都是跟风打发时间用的,可能刚开始会长点见识,但并没有卵用,慢慢就觉得极为无趣,也就基本放弃了,都是被时代淘汰的产品(包括不玩的人人网、微博、B站、抖音)。也许,什么时候又会被新产品吸引吧。 这里单独拿youtube聊一下,youtube不允许up主在视频本身中插入广告,而是由youtube统一推送“定制化官方广告”,让up主更专心的做内容,用户观看体验更佳。为什么up要为youtube提供源源不断的视频呢?因为youtube广告收入高,比如2019年它全年的广告收入是150亿美元(对比同年B站广告收入0.4亿美元, B站主要靠游戏赚钱,这些钱与up主无关),因此youtube可以为up主带来更高的收益,同时这些视频对于用户来说都是免费的,唯一要忍受的就是5s的广告(手动关闭的情况)。(注:爱奇艺、腾讯视频、优酷与youtube不是一个行业,它们的对比对象是奈飞) youtube的缺点也非常明显,同样分类、同样的点击,让时长决定广告价值。更新频率决定推荐位,很多up主不得不频繁更新且故意加时长,最后质量严重下降。可以发现,绝大多数视频,不看也罢。
如果觉得有帮忙,您可以在本页底部留言。
相关推荐:
Webpack深入浅出plugin
Webpack自动更新php静态资源文件名hash
Webpack构建流程之源码分析
Webpack基于scss生成css独立文件
Webpack深入浅出loader
移动端浏览器真机调试的几种方法
接入台湾超商门店地址选择
ember入门教程
Ember之Handlebars模板引擎
Mac高频快捷键之前端篇
简述浏览器缓存之cookie
浏览器打开页面的过程中发生了什么
Git命令简化笔记
PHP实现微信JS-SDK权限验证
SQL快速运用指南
如何用正确的姿势写HTML
正则表达式实例解析
……
更多
<
纪德《帕吕德》,日复一日的人生
读《抉择时刻》,小布什自传
>
全部留言
我要留言
内容:
网名:
邮箱:
个人网站:
发表
全部留言