import os
os.environ['KERAS_BACKEND'] = 'torch'

import keras

import numpy as np
import os, random

import fidle

import modules.my_loader as my_loader
import modules.my_models as my_models
import modules.my_tools  as my_tools
from modules.my_TensorboardCallback import TensorboardCallback


# Init Fidle environment
run_id, run_dir, datasets_dir = fidle.init('K3GTSRB3')

Module my_loader loaded.
Module my_models loaded.

Version              : 2.3.0
Run id               : K3GTSRB3_2
Run dir              : ./run/K3GTSRB3_2
Datasets dir         : /gpfswork/rech/mlh/uja62cb/fidle-project/datasets-fidle
Start time           : 03/03/24 21:19:44
Hostname             : r6i0n6 (Linux)
Tensorflow log level : Warning + Error  (=1)
Update keras cache   : False
Update torch cache   : False
Save figs            : ./run/K3GTSRB3_2/figs (True)
keras                : 3.0.4
numpy                : 1.24.4
sklearn              : 1.3.2
yaml                 : 6.0.1
matplotlib           : 3.8.2
pandas               : 2.1.3
torch                : 2.1.1

** run_id has been overrided from K3GTSRB3 to K3GTSRB3_2

enhanced_dir = './data'
# enhanced_dir = f'{datasets_dir}/GTSRB/enhanced'

model_name   = 'model_01'
dataset_name = 'set-24x24-L'
batch_size   = 64
epochs       = 10
scale        = 1
fit_verbosity = 1

fidle.override('enhanced_dir', 'model_name', 'dataset_name', 'batch_size', 'epochs', 'scale', 'fit_verbosity')

** Overrided parameters : **
enhanced_dir         : /gpfswork/rech/mlh/uja62cb/fidle-project/datasets-fidle/GTSRB/enhanced
model_name           : model_02
dataset_name         : set-48x48-RGB
batch_size           : 64
epochs               : 5
scale                : 1
fit_verbosity        : 2

x_train,y_train,x_test,y_test, x_meta,y_meta = my_loader.read_dataset(enhanced_dir, dataset_name, scale)

Original shape  : (39209, 48, 48, 3) (39209,)
Datasets have been resized with a factor  1
Rescaled shape  : (39209, 48, 48, 3) (39209,)
Datasets have been shuffled.

Dataset "set-48x48-RGB" is loaded and shuffled. (1.3 Go in 0:00:00)

print("x_train : ", x_train.shape)
print("y_train : ", y_train.shape)
print("x_test  : ", x_test.shape)
print("y_test  : ", y_test.shape)

fidle.scrawler.images(x_train, y_train, range(24), columns=8, x_size=1, y_size=1, save_as='02-dataset-small')

x_train :  (39209, 48, 48, 3)
y_train :  (39209,)
x_test  :  (12630, 48, 48, 3)
y_test  :  (12630,)

(n,lx,ly,lz) = x_train.shape

model = my_models.get_model( model_name, lx,ly,lz )
model.summary()

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

Model: "sequential"

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃ Layer (type)                    ┃ Output Shape              ┃    Param # ┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━┩
│ conv2d (Conv2D)                 │ (None, 46, 46, 96)        │      2,688 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ max_pooling2d (MaxPooling2D)    │ (None, 23, 23, 96)        │          0 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ dropout (Dropout)               │ (None, 23, 23, 96)        │          0 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ conv2d_1 (Conv2D)               │ (None, 21, 21, 192)       │    166,080 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ max_pooling2d_1 (MaxPooling2D)  │ (None, 10, 10, 192)       │          0 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ dropout_1 (Dropout)             │ (None, 10, 10, 192)       │          0 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ flatten (Flatten)               │ (None, 19200)             │          0 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ dense (Dense)                   │ (None, 1500)              │ 28,801,500 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ dropout_2 (Dropout)             │ (None, 1500)              │          0 │
├─────────────────────────────────┼───────────────────────────┼────────────┤
│ dense_1 (Dense)                 │ (None, 43)                │     64,543 │
└─────────────────────────────────┴───────────────────────────┴────────────┘

 Total params: 29,034,811 (110.76 MB)

 Trainable params: 29,034,811 (110.76 MB)

 Non-trainable params: 0 (0.00 B)

fidle.utils.mkdir(run_dir + '/models')
fidle.utils.mkdir(run_dir + '/logs')

# ---- Callback for tensorboard (This one is homemade !)
#
tenseorboard_callback = TensorboardCallback(
                                log_dir=run_dir + "/logs/tb_" + fidle.Chrono.tag_now())

# ---- Callback to save best model
#
bestmodel_callback = keras.callbacks.ModelCheckpoint( 
                                filepath= run_dir + "/models/best-model.keras",
                                monitor='val_accuracy', 
                                mode='max', 
                                save_best_only=True)

# ---- Callback to save model from each epochs
#
savemodel_callback = keras.callbacks.ModelCheckpoint(
                                filepath= run_dir + "/models/{epoch:02d}.keras",
                                save_freq="epoch")

chrono=fidle.Chrono()
chrono.start()

# ---- Shuffle train data
x_train,y_train=fidle.utils.shuffle_np_dataset(x_train,y_train)

# ---- Train
# Note: To be faster in our example, we can take only 2000 values
#
history = model.fit(  x_train, y_train,
                      batch_size=batch_size,
                      epochs=epochs,
                      verbose=fit_verbosity,
                      validation_data=(x_test, y_test),
                      callbacks=[tenseorboard_callback, bestmodel_callback, savemodel_callback] )

model.save(f'{run_dir}/models/last-model.keras')

chrono.show()

Datasets have been shuffled.
Epoch 1/5
613/613 - 18s - 29ms/step - accuracy: 0.6905 - loss: 1.0766 - val_accuracy: 0.8845 - val_loss: 0.4307
Epoch 2/5
613/613 - 17s - 28ms/step - accuracy: 0.9476 - loss: 0.1791 - val_accuracy: 0.9245 - val_loss: 0.2826
Epoch 3/5
613/613 - 17s - 28ms/step - accuracy: 0.9704 - loss: 0.1040 - val_accuracy: 0.9356 - val_loss: 0.2375
Epoch 4/5
613/613 - 17s - 28ms/step - accuracy: 0.9774 - loss: 0.0750 - val_accuracy: 0.9435 - val_loss: 0.2160
Epoch 5/5
613/613 - 16s - 27ms/step - accuracy: 0.9832 - loss: 0.0579 - val_accuracy: 0.9435 - val_loss: 0.2280
Duration :  87.59 seconds

max_val_accuracy = max(history.history["val_accuracy"])
print("Max validation accuracy is : {:.4f}".format(max_val_accuracy))

Max validation accuracy is : 0.9435

score = model.evaluate(x_test, y_test, verbose=0)

print('Test loss      : {:5.4f}'.format(score[0]))
print('Test accuracy  : {:5.4f}'.format(score[1]))

Test loss      : 0.2267
Test accuracy  : 0.9435

fidle.scrawler.history(history, save_as='03-history')

y_sigmoid = model.predict(x_test, verbose=fit_verbosity)
y_pred    = np.argmax(y_sigmoid, axis=-1)

fidle.scrawler.confusion_matrix(y_test,y_pred,range(43), figsize=(12, 12),normalize=False, save_as='04-confusion-matrix')

395/395 - 2s - 4ms/step

# !ls -1rt "$run_dir"/models/

loaded_model = keras.models.load_model(f'{run_dir}/models/best-model.keras')
# loaded_model.summary()
print("Loaded.")

Loaded.

score = loaded_model.evaluate(x_test, y_test, verbose=0)

print('Test loss      : {:5.4f}'.format(score[0]))
print('Test accuracy  : {:5.4f}'.format(score[1]))

Test loss      : 0.2153
Test accuracy  : 0.9435

# ---- Pick a random image
#
i   = random.randint(1,len(x_test))
x,y = x_test[i], y_test[i]

# ---- Do prediction
#
prediction = loaded_model.predict( np.array([x]), verbose=fit_verbosity )

# ---- Show result

my_tools.show_prediction( prediction, x, y, x_meta )

1/1 - 0s - 94ms/step

[[  0.   0.   0.   0.   0.   0.   0.   0.   0.   0. 100.   0.   0.   0.   0.   0.   0.   0.
    0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.   0.
    0.   0.   0.   0.   0.   0.   0.]]

The image :               Prediction :            Real stuff:

YEEES ! that's right!

fidle.end()

[K3GTSRB3] - Training monitoring¶

Objectives :¶

What we're going to do :¶

Step 1 - Import and init¶

1.1 - Python stuffs¶

1.2 - Parameters¶

Step 2 - Load dataset¶

Step 3 - Have a look to the dataset¶

Step 4 - Get a model¶

Step 5 - Prepare callbacks¶

Step 6 - Train the model¶

Step 7 - History¶

Step 8 - Evaluation and confusion¶

Step 9 - Restore and evaluate¶

List saved models :¶

Restore a model :¶

Evaluate it :¶

Make a prediction :¶

Step 10 - To go further ;-)¶