想问一下图数据库neo4j和spark下面的graphx有什么区别
发布网友
发布时间:2022-04-22 16:44
我来回答
共2个回答
热心网友
时间:2022-04-08 11:31
Neo4j就是一个数据库(可以理解成一个类似HBASE的东西,不过Neo4j是几乎是单机数据库,于HBASE不同,HBASE的数据时存储在
HDFS上,由HDFS进行维护,HDFS将数据存储在exfat等单机文件系统上。Neo4j直接将数据格式化到单机文件系统)
每一个服务器保存完整的图数据。
GraphX是一个计算引擎(类似于maprece的东西),它的数据是从SHARK中使用SQL读取数据,或者RDD运算符从文件中读取,然后直接进行计算
另外数据库和计算引擎都可以进行计算任务,不过数据库的接口比较弱,只支持简单的查询
计算引擎提供了强大的计算接口,方便了编程,可以很容易的实现pagerank等图算法
GraphX做数据挖掘应该更方便,有通用的编程几口
Neo4j就需要自己写代码了 编程比较麻烦,不过性能上或许有优势
热心网友
时间:2022-04-08 12:49
spark这个大集体里不仅仅有 graphx 还有 streaming、ml 支持。
neo4j 应该只是一个图数据库吧?neo4j是图数据库,本身自带存储。
graphx是spark的一个图计算组件,基于RDD实现。
基本的图计算功能都具备,主要取决于你想用来做什么应用。