通过分析豆瓣用户电影评论数据,来对不同国家在不同时间内的电影进行情感分析,并通过云图及直方图进行效果展示。
资源链接 : /download/zhuqiuhui/85100293
分析随着时间增长,不同国家拍摄的电影类型的变化
为由用户电影评论构建 tf-idf 模型抽取的关键短语。分为正向关键短语和负向关键短语。
为由电影风格标签抽取的关联规则
通过 kmeans 算法聚类电影。样本通过 one-hot 编码为特征,然后再使用 kmeans 算法聚类。***聚4类,通过云图展示(见效果)
号v公众:方辰的博客