六盘水仿真房产证书制作不动产证件专业定制
“如果我们想让我们的应用程序在AppStore中出现,我们别无选择,”他说。 用这种模型对数据进行处理后,就能将输入的评论转换为高维向量(便于聚类分析。 数据可视化 接下来,是将这些向量可视化,更好地看清评论的分布。 但经过Transformer获得的高维向量,还不能直接可视化。 因此,需要将这些1024维向量(转换出来的高维向量,是将语义编码成1024个数字的序列,先降维成二维向量。 这里会用到一种名为UMAP (统一流形逼近和投影的技术,能将高维向量转变成二维向量。 在二维向量的可视化图中,彼此接近的点表示具有相似含义的句子,如果发生簇分离,则代表评价的内容并不相同。 如下图,经过处理后的可视化评论中,绿色代表正面评价,红色代表负面评价,颜色越深,表示负面评价的占比越大。(例如上面那些有关退款的评价,就可以组成一个退款群了 而在离集群很远的左上角,有一小撮人在“自说自话”,这群人给出的140条评价,全都是好评。 没错,这就是刚刚那群沉迷吸猫的玩家……(毕竟,连水下也能吸猫 当然,快乐吸猫只是游戏中的一个细节。 为了更全面地搜集有关游戏的整体评价,还需要对这些数据进行聚类分析。 聚类分析 聚类分析,是对评价进行整体分类的方法,也就是对这些处理后的二维向量进行分组。 例如被分到「游戏会更好」的评价组里,就会看到大量的wait、patch、better,这些词共同组成了这个评价。 |
相关新闻