关于CUDA:发射超时并被终止

the launch timed out and was terminated

我正在使用带有CUDA 4.2的Tesla 2075(cc 2.0)。我在非显示GPU(Tesla)上运行我的程序,但出现错误:

1
"the launch timed out and was terminated"

在非显示GPU上是否会出现此错误?

而且,如何禁用看门狗计时器?


我假设您正在Windows上运行。如果是这样,请将Tesla 2075置于TCC模式。这将允许计算访问,并且Windows将不会像显示设备那样管理它,它将摆脱看门狗计时器。如果找不到nvidia-smi,只需在Windows中搜索nvidia-smi.exe。 (它应该已经与显示驱动程序一起安装。)然后,如果C2075是系统中唯一的CUDA GPU,则命令将如下所示:nvidia-smi -g 0 -dm 1您也可以执行nvidia-smi --help以获得命令行帮助。工具。更改此设置后,可能需要重新引导系统,以使卡进入TCC模式。

另一方面,如果您在此计算机上运行linux和X-windows,则解决方案有所不同。一种方法是简单地禁用X,例如通过将运行级别设置为3并重新启动,但是还有其他方法可以执行此操作。但是,您将在另一个GPU上丢失X GUI(我假设您有另一个GPU,因为您说这是非显示GPU)。要在另一个GPU上保留X和GUI,必须修改xorg.conf文件以将X强制到显示GPU上并将其从计算(Tesla)GPU上移开。这样做的方法会有所不同,但是如果您有2个NVIDIA GPU(一个用于显示),则应使用xorg.conf文件相关"显示"部分中的BusID参数将X显示器强制显示在单个GPU上。此外,应删除任何其他"显示"部分。例如:

1
 BusID"PCI:34:0:0"

GPU的PCI ID可以通过lspci命令或nvidia-smi –a命令

您可能还希望参考NVIDIA驱动程序README文件的X配置选项附录。