从数据挖掘、数据分析 数据挖掘 数据建模和数据可视化等方面进行分析,数据新闻与精确新闻、计算机辅助报道的区别和联系

  • 对一个项目使用项目管理技术的程度主要由项目的和决定的() A.预算进度B.质量及进度

  • 对静脉穿刺困难的患者,可用()A 可使用CVCB可使用血管可视化技术C 可使用PICCD 可使用PORT

  • 多媒体技术的主要特征包括集成性.多样性.交互性和()A.活动性B.可视性C.非线性D.实时性

  • 多媒体技术的特性不包括()。A.集成性B.同步性C.可视性D.交互性

  • DBMS提供DML實现对数据的操作可以独立交互使用的DML称为()。A. 宿主型B. 独立型C. 自含型D.

  • (三)BIM技术是基于最先进的三维数字设计与工程软件所构建的可视化数芓建筑模型它可以为各方面相关

研究基于UGC的在线民宿满意度挖掘负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致实时对重庆地区在线民宿的满意度进行评测,使用Python实现了在线评论采集和情感可视化分析搭建了百度地图POI查询入口,可以进行自动化的批量查询POI信息的功能;构建了基于在线民宿语料的Word2vec主题聚类模型利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型最后选用贝叶斯模型进行情感分析,将情感分类概率分布作为情感趋势最后通过POI热力图的方式对不同地域的民宿满意度进行展示。分析流程利用机器学习有监督标记样本进行分类解决了因情感字典覆盖率不全造成分类精度低的问题。用户打分和评论不一致在满意度测評中影响比较大使用自然语言处理技术能挖掘用户情感和需求,具体的打分和评论不一致现象如下
主要功能包括在线原始评论采集、主题分类、评论情感分析与结果可视化展示等四个模块,如下所示
  1. 使用Selenium模拟浏览器点击翻页操作,并配合Request实现了携程网爬虫封锁和自动囮的采集民宿UGC内容的功能提取后的民宿地址和在线评论等信息如下。
  1. 搭建了百度地图POI查询入口可以进行自动化的批量查询POI信息的功能,信息直接存入excel中
  1. 通过高频词可视化展示归纳出评论主题
  1. 构建了基于在线民宿语料的Word2vec主题聚类模型,利用主题中心词能找出对应的主题屬性字典并使用用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型选用最优模型对提出的评价主体 进行情感分析,針对主题属性表进行主题提取后的文本进行情感分析分别得出当前主题对应的情感趋势,横坐标为所有关于主题为“环境”的情感得分纵坐标为对应的情感的条数,可以起到纵观当前“环境”主题下的情感趋势趋势往右代表当前主题评价较好,总共有{“交通”“价格”,“体验”“服务”,“特色”“环境”,“设施”“餐饮”}的主题,选取“环境”主题进行可视化之后的结果如下图所示
  1. 通过POI热力图的方式对在线民宿满意度进行展示。

我要回帖

更多关于 数据可视化 的文章

 

随机推荐