container – un container de datasets Pandas

Une API très simple qui permet de créer ou charger des containers de données Pandas

Sans surprise la 1ere dependance est pandas

import pandas as pd
df_basic = pd.DataFrame([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]], columns=['A', 'B', 'C', 'D', 'E'])
df_basic
A B C D E
0 0 1 2 3 4
1 5 6 7 8 9

Je vais faire les tests de base avec ce dataset hyper simple


source

Container

 Container (cle:str, dataset:pandas.core.frame.DataFrame=None,
            colonnes_a_masquer:list=[], colonnes_a_conserver:list=[])

Un container de dataset qui s’initialise en passant une clé et un dataset

Type Default Details
cle str la clé du container
dataset DataFrame None le dataset
colonnes_a_masquer list [] les colonnes à masquer
colonnes_a_conserver list [] les colonnes qui ne seront pas transformées

Un exemple de création d’un container, et ce que ça affiche

basic = Container('hyper_basic', df_basic)
basic
Container for "hyper_basic" of shape (2, 5)

Egalité de 2 containers

Si la clé et la meme, et le shape du dataset également, alors on est sur le meme container

df_basic2 = pd.DataFrame([[0, 1, 3, 4], [5, 6, 8, 9]], columns=['A', 'B', 'D', 'E'])
df_basic2
A B D E
0 0 1 3 4
1 5 6 8 9

ici quelques tests d’égalité

test_eq(Container('basic', df_basic), Container('basic', df_basic))

longueur


source

Container.longueur

 Container.longueur ()

retourne le nombre de lignes du dataset

df_basic2 = pd.DataFrame([[0, 1, 3, 4], [5, 6, 8, 9]], columns=['A', 'B', 'D', 'E'])
Container('basic', df_basic2).longueur()
2