原文:http://tecdat.cn/?p=4156

 

社会化媒体的发展,吸引越来越多的目光,在这个时代社会化媒体,用户成为最优秀的企业品牌形象大使。潜在为了了解消费者的意愿,专门开发的折扣计划和优惠券为客户的每个客户的肖像,以推动客户通过语义分析系统的分析发展中产生。tecdat舆情分析系统基于 Hadoop 平台的文本分析,优化分析能力,提供快速迅捷的查询和分析。

数据分析逻辑

微博是现代网络社会沟通的重要工具 。但是,这些信息往往不能针对每个用户的喜好来发布,类似于广播一样,每一条微博是否对每个粉丝(用户)有意义,需要用户自己来过滤。

但实际上,粉丝自身发布的微博含有大量的数据信息,这些信息包含用户的个人爱好,自己年龄阶段,近期的想购买的款式,甚至是自己希望有的款式与功能等。这些数据大多数为非结构数据。

营销分析逻辑流程

方案架构

平台的文本分析

特朗普推文舆情分析 :

最近,多纳特·特朗普变得有争议。他挑衅性呼吁暂时禁止穆斯林进入美国,面临强烈的批评。社交媒体分析的许多用途中的一些是情绪分析,我们评估特定问题的帖子是积极还是消极。我们把社交媒体分析、机器学习、预测建模等集成到文本数据挖掘中。

在这篇文章中,我们挖掘tweets并分析它们的情绪并且可视化我们的结果。我们将看到tweets,城市和状态的空间 – 时间分布与最热门的tweets,我们还将挖掘tweets的情绪,帮助我们看到哪些评论被认为是积极的,哪些是负面的。 首先,让我们创建一个tweet的词云。 词云帮助我们可视化tweet中最常见的词:

我们从云中看到,tweet中最常用的词是’muslim’,’muslims’,’ban’。 这表明大多数推文是关于特朗普最近的想法,暂时禁止穆斯林进入美国。

下面的信息中心显示了所抓取的tweets数量的时间序列。 我们可以在小时和天之间更改时间单位。 随时间推移的推文数量模式有助于我们深入了解每个活动的感知变化方式。

获取tweet的地址。 下面的地图显示了我可以绘制tweets大小与每个tweet获得的转发数量成正比。

类似地,下面的仪表板显示了tweets,大小与每个tweet被转发的次数成正比。

在以下三个可视化中,显示了邮政编码、城市和州的推文数量。 在互动地图中,我们可以通过使用每个viz中显示的滚动条来更改要显示的邮政编码、城市和州的数量。 这些可视化帮助我们按邮政编码,城市和州查看tweet的分布。

情绪分析具有很多的用途。 例如,公司可以调查客户最喜欢公司产品的哪些方面,以及客户不满意的问题是什么? 当公司发布新产品时,产品是否被正面或负面情绪? 客户的情绪如何随时间和空间而变化? 在这篇文章中,我们评估唐纳德·特朗普的tweets的情绪。

下面的图显示了按地理编码分类的tweet的情绪分数。 我们看到推文在NY、NC和Tx有最高的正面情绪。

我们使用了来自包含唐纳德·特朗普的最近的tweets, 发现一些国家表现出强烈的积极情绪。 然而,在统计学上,为了得出可靠的结论,挖掘足够大的样本数据是重要的。

我们的情绪分析的准确性取决于tweets中的词语是否被包括在词典中。 此外,由于tweet可能包含俚语,行话和词典,可能不包括在词典中,情感分析需要仔细评估。

©著作权归作者所有:来自51CTO博客作者拓端小助手的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 基于Flink+Doris构建电商实时数据分析平台(PC、移动、小程序)
  2. PowerBI财报分析及综合报告制作
  3. Spring Data REST 远程代码执行漏洞(CVE-2017-8046)分析与复现
  4. WebView性能、体验分析与优化
  5. Gartner:政府CIO将在2018年增加云、网络安全和分析方面的支出
  6. 通过iptables分析OpenStack 安全组规则
  7. Docker-LinuxKit搭建及使用场景分析
  8. dubbo的spi机制分析和实战案例
  9. 【大家的项目】Rust Base62 库学习和分析

随机推荐

  1. 一个php框架的简单实现,仅实现简单路由层
  2. 关于PHP打印格式化显示利器
  3. PHP常见数组排序方法小汇总
  4. php实现断点续传大文件
  5. 数组转json后的结果是数组还是对象? (踩坑
  6. 中文分词 PHP 扩展 SCWS 安装方法
  7. 关于PHP循环读取json数据的方法
  8. 详解PHP面向对象之后期静态绑定
  9. 速看!php artisan 命令列表
  10. 或许你想去掉Response Headers中的X-Powe