Java开发想尝试大数据和数据挖掘,如何规划学习
发布网友
发布时间:2022-04-20 10:43
我来回答
共3个回答
热心网友
时间:2023-09-30 17:40
网易有一套大数据工程师 微专业,现在三六五网络学院也有提供下载,建议你去看看。
热心网友
时间:2023-09-30 17:40
大数据是一个非常广泛的概念,网络舆情监测,消费者行为分析,数据采集等都属于这个范畴。想要学习大数据,就要从大数据的某一个方面入手,然后慢慢通过已有知识延伸到另一个方面。消费者行为分析,JD智圈等有帮助的。舆情监测和数据采集来说,要找一些这方面的舆情专家,乐思等就是尖子。学习的关键是:找到对的,和行业的领头羊作为分析对象。
热心网友
时间:2023-09-30 17:40
学习过Java之后在学习大数据相对会轻松一些,主要是要分清你要先从那个方向入手
1.大数据开发工程师,这个比较适合刚刚从Java转换过来的人员做,主要学习HDFS,MapRece,Yarn,Hive,Flume,Sqoop,Spark等技术即可转转型。
2.数仓工程师:这个需要SQL基础好一些,其他环境配置基本上公司已经完成,主要是针对Hive方向的开发和数据仓库的建模擦操作
3.实时工程师:这个主要针对的是Spark部分,SparkStreaming是老牌的实时处理,相对公司使用还是比较多的,近年来阿里收购了Flink之后,加速了Flink在国内的步伐,所以这个flink最好也要学习,Storm就可以适当的了解
4.数据挖掘:需要学习完成大数据体系,也就是大数据开发工程需要学习的,除了这些外要学会 机器学习R语言主要是为了统计分析和绘图,在Hadoop生态圈中是有自己的机器学习库的mahout提供可扩展的机器学习领域经典算法的实现,包括聚类、分类、推荐过滤、频繁子项挖掘等,且可通过Hadoop扩展,但是鉴于MapRece的性能,建议学习Spark MLlib: MLlib是Spark是常用的机器学习算法的实现库,支持二元分类,回归,聚类以及协同过滤等算法。同时也包括一个底层的梯度下降优化基础算法。除了之外,也可以学系python,python中也有一套完整的机器学习库。