发布网友 发布时间:2022-04-20 19:27
共1个回答
好二三四 时间:2022-08-12 16:53
一般的大数据平台从平台搭建到数据分析大概包括以下几个步骤:
Linux系统安装。分布式计算平台或组件安装,当前分布式系统的大多使用的是Hadoop系列开源系统。数据导入。数据分析。一般包括两个阶段:数据预处理和数据建模分析。数据预处理是为后面的建模分析做准备,主要工作时从海量数据中提取可用特征,建立大宽表。数据建模分析是针对预处理提取的特征或数据建模,得到想要的结果。结果可视化及输出API。可视化一般式对结果或部分原始数据做展示。一般有两种情况,行数据展示,和列查找展示。
热心网友 时间:2023-07-22 15:52
搭建大数据分析平台的工作是循序渐进的,不同公司要根据自身所处阶段选择合适的平台形态,没有必要过分追求平台的分析深度和服务属性,关键是能解决当下的问题。
大数据分析平台是对大数据时代的数据分析产品(或称作模块)的泛称,诸如业务报表、OLAP应用、BI工具等都属于大数据分析平台的范畴。与用户行为分析平台相比,其分析维度更集中在核心业务数据,特别是对于一些非纯线上业务的领域,例如线上电商、线下零售、物流、金融等行业。而用户行为分析平台会更集中分析与用户及用户行为相关的数据。
企业目前实现大数据分析平台的方法主要有三种:
(1)采购第三方相关数据产品
例如Tableau、Growing IO、神策、中琛魔方等。此类产品能帮助企业迅速搭建数据分析环境,不少第三方厂商还会提供专业的技术支持团队。但选择此方法,在统计数据的广度、深度和准确性上可能都有所局限。例如某些主打无埋点技术的产品,只能统计到页面上的一些通用数据。
随着企业数据化运营程度的加深,这类产品可能会力不从心。该方案适合缺少研发资源、数据运营初中期的企业。一般一些创业公司、小微企业可能会选择此方案。
(2)利用开源产品搭建大数据分析平台
对于有一定开发能力的团队,可以采用该方式快速且低成本地搭建起可用的大数据分析平台。该方案的关键是对开源产品的选择,选择正确的框架,在后续的扩展过程中会逐步体现出优势。而如果需要根据业务做一些自定义的开发,最后还是绕不过对源码的修改。
(3)完全自建大数据分析平台
对于中大型公司,在具备足够研发实力的情况下,通常还是会自己开发相关的数据产品。自建平台的优势是不言而喻的,企业可以完全根据自身业务需要定制开发,能够对业务需求进行最大化的满足。
对于平台型业务,开发此类产品也可以进行对外的商业化,为平台上的B端客户服务。例如淘宝官方推出的生意参谋就是这样一款成熟的商用数据分析产品,且与淘宝业务和平台优势有非常强的结合。
在搭建大数据分析平台之前,要先明确业务需求场景以及用户的需求,通过大数据分析平台,想要得到哪些有价值的信息,需要接入的数据有哪些,明确基于场景业务需求的大数据平台要具备的基本的功能,来决定平台搭建过程中使用的大数据处理工具和框架。