基于非参数秩和检验的 B 站电影评分系统研究
2021-03-04 点击:813 次
作者: |
张可奇,李秋敏 |
作者单位: |
成都信息工程大学统计学院 |
摘要: |
该文通过爬虫代码搜集了当前 B 站电影栏目列表
中的所有电影(约 1000 部),同时爬取每部电影下的所有评
分数据(约 65 万条),每条评分数据包含评分时间与用户的
ID 信息。通过非参数统计中的Mann-Whitney秩和检验对搜
集的数据进行分析和研究,结果表明:B 站电影栏目中第一
次评分人员的比例会对评分产生显著影响。同时参考美国
IMDb 贝叶斯加权统计算法中只收录“老用户”评分的处理方
式,对 B 站评分系统提出建议,使评分能更加客观、全面地
为观众提供参考。 |
关键词: |
Mann-Whitney 秩和检验;电影评分;B 站;爬虫 |
中图分类号: |
J903 |
基金项目: |
|
|