我已经在带有 CUDA 10 和合适的 GPU 的 x86-64 Ubuntu 计算机上安装了 tensorflow(不是从源代码)。我的目标是拦截(使用 LD_PRELOAD)任何 tensorflow 应用程序的 CUDA 运行时 API。不幸的是,对于我的用例,我无法从源代码为不是 x86-64 的目标机器构建 tensorflow。我能够拦截我从用 C++ 编写的动态加载 cuda 运行时 API 的测试程序进行的 cudaLaunchKernel 调用,并且在第一次检查时我认为 python 应该类似地动态加载相同的 cuda .so - 我很困惑,因为 LD_PRELOAD 不是适用于在启用 cuda 的情况下运行的正常安装的 tensorflow 应用程序。我希望 tensorflow 中的 cudaLaunchKernel 调用应该被我的 LD_PRELOAD 插入库拦截。这个对吗?
添加回答
举报
0/150
提交
取消