OpenAI、強化学習において相撲やサッカー等の環境でセルフプレーで訓練された競争力のあるマルチエージェントが複雑な行動を生成できる提案を論文で公開