[1]

S. Li, Y. Wu, X. Cui, H. Dong, F. Fang, and S. Russell, “Robust Multi-Agent Reinforcement Learning via Minimax Deep Deterministic Policy Gradient”, AAAI, vol. 33, no. 01, pp. 4213-4220, Jul. 2019.