MITとIBM、映像内で何が起きているのかにラベル付けされた3秒動画の大規模データセット(100万点)を発表。AIシステムが動的な行動を理解する