同时定义第 2 个输出为单个标量的多层感知机D(x;θd)。D(x)为来自数据 (而不是pg)的x的概率。训练D来最大化为训练实例和来自G的生成样本分配正确标签的概率;同时,训练D来最小化log(1?D(G(z)))。