您正在浏览是   网站首页  >  软件  > 正文

一文看清HBase的使用场景

发布时间 2019-07-08 17:29   
选择文字大小  

HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,是建立在Hadoop文件系统之上的分布式面向列的数据库。


1、对象存储

比如一些app的海量的图片、网页、新闻等对象,可以存储在HBase中,有些病毒公司的病毒库也可以存储在HBase中。

2、时空数据

主要是轨迹、气象网格之类,比如滴滴打车的轨迹数据主要存在HBase之中,另外大数据量的车联网企业,数据也都是存在HBase中。

比如互联网出行,智慧物流与外卖递送,传感网与实时GIS等场景。

3、时序数据

时序数据就是分布在时间上的一系列数值。HBase之上有OpenTSDB模块,可以满足时序类场景的需求。

比如我们有很多的设备、传感器,产生很多数据,如果规模不是特别大的厂家有几千个风机,每个风机有几百个指标,那么就会有一百万左右的时序数据,如果用采样每一秒会产生一百万个时间点,如果用传统数据库,那么每一秒会产生一百万次,持续地往MQ做一百万次,它会崩裂。并且查询也是个大问题,除了多维查询以外,我们还会额外地增加时间纬度,查看一段时间的数据。这时候HBase很好了满足了时序类场景的需求。

4、推荐画像

特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是构建在HBase上。用户画像有用户数据量大,用户标签多,标签统计维度不确定等特点,适合HBase特性的发挥。

5、消息/订单

在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上。

6、Feed流

Feed流,是RSS中用来接收该信息来源更新的接口,简单的说就是持续更新并呈现给用户的内容。比如微信朋友圈中看到的好友的一条条状态,微博看到的你关注的人更新的内容,App收到的一篇篇新文章的推送,都算是feed流。

7、NewSQL

HBase上有Phoenix的插件,可以满足二级索引、SQL的需求,对接传统数据需要SQL非事务的需求。从NoSQL到NewSQL,Phoenix或许是新的趋势。

更多
读图时代
更多
专题

36氪首发|「芯朴科技」完成数千万天使轮融资,北极光创投领投

36氪获悉,5G射频芯片研发商「芯朴科技」近日完成数千万元的天使轮融资,由北极光创投和其他战略投资方共同投资。芯朴科技位于上海浦东张江,成立于2018年11月,拥有完整的手机射频前端研发团队,其业务范

更多
软件

10月底前完成数据安全检查 违法违规APP将无处藏身

以解决数据过度采集滥用、非法交易及用户数据泄露等数据安全问题,加快推动构建行业网络数据安全综合保障体系。

新闻排行