B站视频数据分析报告
0. 说明

程序通过调用BiliBili弹幕网(简称B站)api获取视频信息,所有数据获取完成于2016年09月27日22:59。

数据总量为6449720条,其中极小一部分为已被删除的视频的数据。

本站统计结果仅供参考。

1. 各指标TOP10
2. 播放量统计
播放量Top80标题字符云
3. 用户关注的标签与类目
(1) 类目分布
(2) 播放量大于100w的视频标签
Top80标签字符云
(3) 收藏数大于2w的视频标签
4. 视频总排名

计算公式:总积分 = 播放量 + 收藏量*40 + 分享量*50 + 评论量*30 + 弹幕数量*9 + 硬币量*10

统计结果筛除了部分被删除、待审核等异常状态的视频

(1) Top10
排名视频得分
1【哔哩哔哩2016拜年祭】55633251
2 【古筝】千本樱——你可见过如此凶残的练习曲42793439
3【哔哩哔哩2015拜年祭】34952687
4【4月】在下坂本有何贵干? 01【独家正版】32444976
5【官方中文】Fate/Zero29753087
6【散人】大型励志剧 娱乐圈小助理养成计划(已更新至重置P13 齐聚餐厅)29611579
7papi酱的周一放送——一个明星的自我修养28454553
8【全明星Rap】黑喂狗!27881923
9【灵魂rap】如何让孩子爱上♂学习?27752985
10【高清日剧】Legal High/胜者即是正义(全11回+SP1)【人人】25724830
(2) Top10积分分布
(3) Top11-Top50
5. 感谢访问

(0) 灵感来源

参考了知乎文章《爬取了bilibili站644w视频信息之后的故事。》,感谢作者"路人甲"

(1) 关于排名积分算式

关于视频排名积分计算方法,本人咨询了许多老司机,最终得出此公式

此仅代表一家之言,排序只为本人娱乐所用,不代表B站真实排名,敬请谅解

(2) 关于字符云

由于中文词法分析不够到位导致字符云的实际情况可能会与本站所示情况略有不符

(3) 关于爬虫

因为写的实在不是很好所以源代码不公开,如有感兴趣者可与我交流