HBase X-Pack是基于Apache HBase、Phoenix、Spark深度扩展,融合Solr检索等技术,支持海量数据的一站式存储、检索与分析。融合云kafka+云HBase X-Pack能够构建一体化的数据处理平台,支持风控、推荐、检索、画像、社交、物联网、时空、表单查询、离线数仓等场景,助力企业数据智能化。

下面是业界广泛应用的大数据中台架构,其中HBase&Spark选择 云HBase X-Pack产品相关用户文档:

https://help.aliyun.com/document_detail/93899.html

购买页面:

https://hbase.console.aliyun.com/hbase/cn-shenzhen/clusters

  • 消息流入:Flume、Logstash、或者在线库的binlog流入消息中间件Kafka

  • 实时计算:通过X-Pack Spark Streaming实时的消费Kafka的消息,写入到云HBase中对外提供在线查询

  • 实时存储与检索:云HBase融合solr以及phoenix sql层能够提供海量的实时存储,以及在线查询检索

  • 批处理、数仓及算法:在线存储HBase的数据可以自动归档到X-Pack Spark数仓。全量数据沉淀到Spark数仓(HiveMeta),做批处理、算法分析等复杂计算,结果回流到在线库对外提供查询。

该套方案的实践操作可以参考文章:

https://help.aliyun.com/document_detail/114567.html

同时有云HBase&Spark的样例代码库可参考:

https://github.com/aliyun/aliyun-apsaradb-hbase-demo/tree/master/spark




©著作权归作者所有:来自51CTO博客作者mb5fdb0a6739180的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. HBase神器 | BDS-HBase集群之间数据迁移同步的利器
  2. Django链接mysql数据库
  3. 视频 | 搜索引擎中的 web 数据挖掘
  4. 芝加哥诺奖Heckman开撕哈佛新星Chetty, 样本量胜过仔细的数据分
  5. Hadoop or TDengine,如何做物联网大数据平台的选型?
  6. 关于事件研究法的50篇精选paper专辑! 助力分析COVID-19的影响!
  7. “RDD女王”获2020年小诺奖!她的RD数据, 程序, GIS和博士论文可下
  8. 最全: 深度学习在经济金融管理领域的应用现状汇总与前沿瞻望, 中
  9. 打造最可靠的自动驾驶基础架构

随机推荐

  1. Android---Volley请求天气接口JSON解析
  2. 获取上周五的日期,除非今天是星期五使用T-
  3. 提供一个Android原生的Progress——Swipe
  4. Mysql替代解决方案Cassandra
  5. 使用进度条延迟加载图像会使图像在显示时
  6. SQL Server 2005递归查询在数据中有循环,
  7. Android蓝牙通讯/蓝牙聊天的实现(二)_含dem
  8. mysql随机查询若干条数据
  9. spark sql scala 开发环境搭建 以及必要j
  10. SQL注入之重新认识