Neo4j闭源转商,成为强大图计算平台还需要几步?
长期以来,关系型数据库一直占据主要的市场份额,然而最近十年,随着社交网络、电子商务迅速崛起,交通网络、工业网络问题频现,知识图谱变成企业标配。复杂的网络和对关系分析的需求快速增长,图计算俨然成为了技术界的一块香饽饽。
Neo4j作为曾经最受欢迎的图数据库,利用其开源的优势为工程师进行图理论的研究提供了巨大的帮助,并且在开源社区中积累了人气。一边,工程师们利用图数据库开发出大量的适宜应用在实际生产环境中的软件工程;另一边,Neo4j也知道,收割的时候到了。
2018年5月,Neo4j图数据库在其AGPL许可证中添加了Commons Clause,11月初完成E轮8000万美元融资,并于12月宣布企业版闭源。从 Neo4j 3.5 版本开始,企业版将仅在商业许可下提供使用,不会再在 GitHub 上提供源代码。
对此,Google 软件工程总监 Daniel Berlin评论道:“这不是不良行为。倒是这种协议误解了开源经济模式,它只是想从中为己牟利。”
华为云图引擎 VS Neo4j
开源的优势在于建立数据库的生态,从而利用生态积累用户数,转型商用服务于企业用户则需要依靠自身的竞争力去打造图计算平台,Neo4j真的准备好了与那些在图计算领域为企业服务的专业服务商一较高下吗?我们一起来看看。
以华为云图计算平台EYWA图引擎为例。华为云图引擎EYWA是华为纯自研图计算平台,一体化集合了查询分析、计算引擎、存储管理、可视化等完整的图计算功能,为企业提供一整套解决方案。
对比Neo4j、Titan等传统数据库,从导入数据,图查询,图分析到可视化处理,借助华为云的算力优势、IaaS层能力,华为云图引擎EYWA都有显著的优势。
数据导入:用户可以通过华为云OBS将自己的数据批量导入,也可以随时增量式地导入,无需担心数据存储,实现随时存储、随时迁移、随时追溯。导入完成即可以通过集成GES 图引擎提供的SDK轻松访问图引擎,也可以通过web console 向导式的访问,即刻导入即刻查询,7x24小时受理。而Neo4j数据导入要求每个对数据的更改都需要在一个事务之内完成。
图查询:华为云图引擎EYWA兼容开源生态图,查询性能高,且完美支持业界标准语言Gremlin。相比而言,Neo4j必须使用Cypher语言操作图数据库,对开发者要求更高,上手要求更难。
图分析:图计算必须具备解决实际场景的能力,华为云EYWA图引擎支持基于属性图模型的复杂属性管理、内置了20余种拓扑度量和基本图分析算法,以及高阶图优化算法,并通过服务化API将图引擎的能力开放出去,提供全方位的关系网络洞察。凭借丰富的可视化能力,使结果直观呈现,无需开发,让业务诊断更加高效,效率提升超过30%。
EYWA图引擎还支持最新的图深度学习算法,华为云一站式AI开发平台ModelArts中的新型图神经网络子平台GraNNis(Graph Neural Network integrated system)就是利用了图引擎高并发、低延时的特点,将GNN的训练过程高度并行化,它能将边上的跳转概率估计、顶点邻域采样、负样本构建等等都化解为每个顶点的局部操作,并利用动态调度器,让这些局部操作可高度并行化执行,提升系统的总体吞吐量。
相比而言,目前Neo4j仅支持15种基础的图遍历算法。
最后,性能是图计算平台比拼的关键因素之一,这也是如今图数据库打破关系数据库的垄断,成为技术界新宠的主要原因。经过三次迭代之后,华为云图引擎终于在性能上交出了一份满意的答卷。
性能对比
EYWA与同类图数据库基础算法耗时对比
当数据量需要达到6跳以上查询时,Neo4j的反应时间已经无法跟上查询需求,并不适合数据规模巨大的图计算需求,其最高能容纳的数据规模也只有百亿,而华为云图引擎以华为云强大的算力为基础,图计算的效率已远远超越同类图数据库,并且它的最大数据规格已达万亿。
虽然Neo4j凭借着多年的开源社区积累了大量的用户,但想要成为一个功能完善、性能达标的图计算平台,如果不能在性能上展现出跨阶段的优势,那么其本身的竞争力只会逐渐流失,只有互补长短才能发挥自身最大的潜力。
了解华为云图引擎:https://www.huaweicloud.cn/product/ges.html
- 点赞
- 收藏
- 关注作者
评论(0)