常见问题

我们收集了用户使用 GraphScope 过程中的常见问题,如果在下面的列表中仍然无法找到您遇到的问题的答案,可通过提交 Issues 或者在 Discussions 与我们联系。

  1. 运行 GraphScope 系统需要的最小资源是多少?

    在通过 Python 客户端使用 GraphScope 过程中,需要的最低 Python 版本是3.6+,最低pip版本是 19.0+,GraphScope 系统支持以单机或分布式的方式部署,单机情况下,资源需求 CPU >= 4 核,内存 >= 8 G; GraphScope 在支持以下环境中运行

    • CentOS 7+

    • Ubuntu 18.04+

    • macOS 12 (Intel/Apple Silicon)

    对于分布式部署,需要用户拥有一个 Kubernetes 集群,GraphScope 在 Kubernetes version >= v1.12.0+ 的环境上测试通过。

  2. GraphScope 是否强依赖 Kubernetes?

    GraphScope 支持在单机模式安装运行。 GraphScope 的预编译包以 Python wheel 的形式分发,可以用 pip 快速安装:pip3 install graphscope

  3. 如何如查看 GraphScope 的运行时信息?

    默认情况下,GraphScope 运行不打印日志信息,你可以通过 show_log 参数开启日志输出。

    graphscope.set_option(show_log=True)
    

    如果您的GraphScope运行在k8s集群上,可以使用 kubectl describe/logs 来查看系统的当前状态,同时如果你可以访问 Pod 的磁盘,也可在 /tmp/gs/runtime/logs 目录下查看运行时日志。

  4. 为什么在使用 kubectl get pod 命令时,发现了一些多余的 Pod?

    对于其中一些失败的 Pod,只能通过手动执行命令如 kubectl delete pod <pod_name> 进行删除。 通常情况下,该问题出现在使用 Helm 部署 GraphScope 时,GraphScope 依赖一些权限来删除运行时的资源,如果用户没有正确设置 rolerolebinding 等权限,helm uninstall <release-name> 可能不能正确回收分配的资源。详细细节可以查看 Helm Support

  5. GraphScope 是图数据库吗?

    GraphScope 并不是一个图数据库,但其包含一个持久图存储的组件 graphscope-store 可以被用作数据库。

  6. GraphScope 在 Gremlin 上的兼容性如何?

    目前,GraphScope支持Gremlin语言中的大部分查询算子,可通过 该文档 查看详细的支持信息。

  7. GraphScope 看起来在运行过程中卡住了?

    如果 GraphScope 看起来像卡住,可能的原因有:

    • 在会话的拉起阶段,如果当前网络下载镜像过慢,或当前集群资源无法满足请求的资源时,会造成卡住的现象。

    • 载图阶段,可能会由于数据量过大造成短暂的卡住现象。

    • 在执行图算法分析阶段,或者使用用户自定义的算法,编译构建应用的库时会花费一些时间。

  8. 为什么载图时报找不到文件的错误?

    这通常发生在以集群方式部署运行 GraphScope 时,数据文件必须要对 engine Pod 可见。你也许需要挂载磁盘或者使用云存储提供商的服务。

    如果你的集群是使用 kind 部署的, 你应该需要设置 extra-mounts 来把本机目录挂载到 Kind 虚拟的 Node 中。

  9. k8s_vineyard_mem, vineyard_shared_memk8s_engine_mem 有什么区别,如何设置?

    • k8s_vineyard_mem: 为 vineyard 容器分配的内存。它存储由 vineyard 管理的原始数据的 的元信息,例如形状、ID、名称等。由于元数据比数据集小得多,因此在大多数情况下默认配置就足够了。 它相当于 graphscope 的 helm chart 中的 vineyard.resources.memory.requestsvineyard.resources.memory.limits

    • vineyard_shared_mem: 存储数据集的内存。我们发现将其设置为数据集在磁盘上的大小的 5 倍通常是一个合理的值。 它相当于 graphscope 的 helm chart 中的 vineyard.shared_mem

    • k8s_engine_mem`: ``engine 容器的内存大小。一般将其设置为 vineyard_shared_mem 的同样大小。它相当于 graphscope 的 helm chart 中的 engines.resources.memory.requestsengines.resources.memory.requests

  10. 导致在 Apple M1 python3.8 环境下安装 GraphScope 失败的原因可能有哪些?

    • 编译 grpcio 失败: 你可以通过 export GRPC_PYTHON_BUILD_SYSTEM_OPENSSL=True 来尝试使用系统安装的 openssl 编译 grpcio。详情可参考 grpc issue

    • 编译 scipy 失败: 你可以根据 此教程 来源码编译,或尝试通过 pip3 install --pre -i https://pypi.anaconda.org/scipy-wheels-nightly/simple scipy 来解决这个问题。

  11. 在 NFS 上分配 PV 时遇到了 Permission denied 问题,如何解决?

    • Appearance: 通常当使用 helm 的方式安装 graphscope-store 时,Pod graphscope-store-kafka-0 , graphscope-store-zookeeper-0 会报 CrashLoopBackOff 错误

    • Check: 我们通过 kubectl logs graphscope-store-zookeeper-0 来查看日志,此时日志显示 mkdir: cannot create directory '/bitnami/zookeeper/data': Permission denied

    • Solution: 通常有两种解决方式:

      1. 快速的方式是在所有相关的 PV 目录上使用 chmod 777 ,但不建议在生产环境中使用。

      2. 优雅的方法是首先创建 graphscope 用户和用户组,然后将 graphscope 上的访问权限授予相关NFS目录。

  12. 为什么在 Kubernetes 集群上拉起 GraphScope 实例时,产生超时异常?

    大多数情况下,超时的原因是因为在 Kubernetes 集群拉起 GraphScope 实例时需要下载对应镜像,这一步通常需要几分钟的时间,你可以通过 graphscope.set_option(timeout_seconds=600) 适当的增加超时等待时间来解决该问题。

  13. 启动GraphScope时由于连接v6d,etcd等组件失败而导致GraphScope启动失败?

    这可能是由于你所使用的机器(或容器)所在的企业网络内要求相应的代理设置方可正常使用网络。这些代理设置可能会导致错误的地址解析以及端口占用。为避免类似情况,可在环境变量 no_proxyNO_PROXY 中加入GraphScope相关的地址,如 hostname -i 以及 0.0.0.0 (请注意`no_proxy的前后缀规则 <https://unix.stackexchange.com/questions/23452/set-a-network-range-in-the-no-proxy-environment-variable>`_)

其他问题

您可以提交 Issues 或者在 Discussions 提出你的问题,同时,您也可以使用 SlackDingTalk 与我们联系。