这个问题可能是因为YARN上的资源限制导致的。在per-job模式下,每个任务都会分配一个独立的JVM,因此需要更多的内存和CPU资源。如果你的YARN集群上的资源不足,可能会导致任务无法正常运行。
你可以尝试增加YARN集群上的资源,或者减少任务的数量。另外,你也可以尝试在YARN集群上配置更宽松的资源限制,例如增加每个任务的内存和CPU限制。
如果你无法确定问题的原因,可以尝试查看YARN集群的资源使用情况,看看是否有其他任务在使用大量的资源。如果其他任务也在使用大量的资源,那么可能需要重新分配资源,以便给你的任务留出足够的资源。