平台产品

Mintaka 大数据平台

基于Hadoop的Mintaka大数据平台集成了多种语言等工具,实现对海量数据进行清洗、转化、装载,支持PB级数据的处理,并对这些数据进行处理分析,以统计出用户的位置、行为习惯及标签信息,以及深度的内容识别。

产品功能
数据采集
数据存储
数据处理
数据应用
数据采集

Mintaka大数据平台支持采集以下三种数据:

1. 网络信令数据:移动通信信令、宽带通信信令、物联网等通信信令数据。

2. 业务数据:企业CRM、EPR、生产、销售、物流等数据。

3. 互联网数据:京东、天猫、今日头条、美团等互联网应用数据。

数据存储

Mintaka可存储与计算海量数据,如用户标签/位置/行为数据等,还可实现各类数据的关联整合与统一建模,为上层应用提供统一的数据服务。采用“混搭架构”,能支撑不同业务的实时查询、统计分析、大数据分析三类数据访问需求。

数据处理

专用数据处理组件:具有海量数据的实时计算、离线计算、实时热查询等能力。

用户内容识别:对用户使用的app/网站、搜索内容进行识别,并支持识别市面85%的重点手机应用/网站,如微信、京东、淘宝等app和网站上的具体动作,增加数据来源。

智能生成用户标签:通过对客户的行为记录及位置信息进行统计,使用智能学习引擎计算出用户标签。

用户信息实时更新:从接收到的各类数据中,实时更新客户行为记录以及客户位置信息。

数据非实时处理:可根据所记录下来的所有客户位置记录及行为记录进行非实时统计,实现离线大批量的数据处理。

数据应用

多维分析:使用Apache Kylin™分布式分析引擎实现多维分析(OLAP),支持超大规模数据亚秒级快速查询。

数据治理:提供数据血缘分析以及数据追溯,以及审计日志来追踪、了解对敏感数据访问的能力。

数据科学自动化:基于Cloudera数据科学家开发平台,访问数据更容易,运用数据科学获得更多价值。

数据可视化分析:可将数据生成可视化图表,使用网页浏览器进行分析和操作,还可以将数据发布进行企业多人协作,实现了可视化的数据交互。

可视化运维管理:基于Cloudera Manager,支持对集群的管理、监控、诊断和集成功能。

核心优势

应用场景

相关推荐