conv_variational_autoencoder.py

import tensorflow as tf
tf.enable_eager_execution()

class VariationalConvNetAutoEncoder(tf.keras.Model):
    def __init__(self):
        super(VariationalConvNetAutoEncoder, self).__init__()
        self.conv1 = tf.keras.layers.Conv2D(16, (3, 3), activation='relu', padding='same')
        self.maxp1 = tf.keras.layers.MaxPooling2D((2, 2), padding='same')
        self.conv2 = tf.keras.layers.Conv2D(8, (3, 3), activation='relu', padding='same')
        self.maxp2 = tf.keras.layers.MaxPooling2D((2, 2), padding='same')
        self.conv3 = tf.keras.layers.Conv2D(8, (3, 3), activation='relu', padding='same')
        
        self.mu = tf.keras.layers.MaxPooling2D((2, 2), padding='same')
        self.sigma = tf.keras.layers.MaxPooling2D((2, 2), padding='same')
        
        self.conv4 = tf.keras.layers.Conv2D(8, (3, 3), activation='relu', padding='same')
        self.upsample1 = tf.keras.layers.UpSampling2D((2, 2))
        self.conv5 = tf.keras.layers.Conv2D(8, (3, 3), activation='relu', padding='same')
        self.upsample2 = tf.keras.layers.UpSampling2D((2, 2))
        self.conv6 = tf.keras.layers.Conv2D(16, (3, 3), activation='relu')
        self.upsample3 = tf.keras.layers.UpSampling2D((2, 2))
        self.conv7 = tf.keras.layers.Conv2D(1, (3, 3), activation='sigmoid', padding='same')
        
    def encoder(self, x):
        x = self.conv1(x)
        x = self.maxp1(x)
        x = self.conv2(x)
        x = self.maxp2(x)
        x = self.conv3(x)
        mu = self.mu(x)
        sigma = self.sigma(x)
        return mu, sigma
    
    def decoder(self, x):
        x = self.conv4(x)
        x = self.upsample1(x)
        x = self.conv5(x)
        x = self.upsample2(x)
        x = self.conv6(x)
        x = self.upsample3(x)
        x = self.conv7(x)
        return x
    
    def sample_from_mu_sigma(self, mu, sigma):
        std = tf.exp(0.5 * sigma)
        eps = tf.random_normal(shape=std.shape)
        return mu + eps * std
        
    def call(self, x):
        mu, sigma = self.encoder(x)
        z = self.sample_from_mu_sigma(mu, sigma)
        y = self.decoder(z)
        return y, mu, sigma


def loss(x, x_bar, mu, sigma):
    return tf.losses.mean_squared_error(x, x_bar) - (0.5 * tf.reduce_sum(1 + sigma - tf.math.pow(mu, 2) - tf.exp(sigma)))

def grad(model, inputs, targets):
    with tf.GradientTape() as tape:
        reconstruction, mu, sigma = model(inputs)
        loss_value = loss(targets, reconstruction, mu, sigma)
    return loss_value, tape.gradient(loss_value, model.trainable_variables), reconstruction, mu, sigma

if __name__ == '__main__':

    (x_train, _), (x_test, _) = tf.keras.datasets.mnist.load_data()
    x_train = x_train.astype('float32') / 255.
    x_test = x_test.astype('float32') / 255.

    x_train = tf.reshape(x_train, (len(x_train), 28, 28, 1))
    x_test = tf.reshape(x_test, (len(x_test), 28, 28, 1))

    model = VariationalConvNetAutoEncoder()

    optimizer = tf.train.AdamOptimizer(learning_rate=0.001)
    global_step = tf.Variable(0)

    num_epochs = 50
    batch_size = 1

    for epoch in range(num_epochs):
        print("Epoch: ", epoch)
        for x in range(0, len(x_train), batch_size):
            x_inp = x_train[x : x + batch_size]
            loss_value, grads, reconstruction, mu, sigma = grad(model, x_inp, x_inp)
            optimizer.apply_gradients(zip(grads, model.trainable_variables),
                                  global_step)
            
            if global_step.numpy() % 200 == 0:
                print("Step: {},         Loss: {}".format(global_step.numpy(),
                                              loss(x_inp, reconstruction, mu, sigma).numpy()))