import pandas as pd
container – un container de datasets Pandas
Une API très simple qui permet de créer ou charger des containers de données Pandas
Sans surprise la 1ere dependance est pandas
= pd.DataFrame([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]], columns=['A', 'B', 'C', 'D', 'E'])
df_basic df_basic
A | B | C | D | E | |
---|---|---|---|---|---|
0 | 0 | 1 | 2 | 3 | 4 |
1 | 5 | 6 | 7 | 8 | 9 |
Je vais faire les tests de base avec ce dataset hyper simple
Container
Container (cle:str, dataset:pandas.core.frame.DataFrame=None, colonnes_a_masquer:list=[], colonnes_a_conserver:list=[])
Un container de dataset qui s’initialise en passant une clé
et un dataset
Type | Default | Details | |
---|---|---|---|
cle | str | la clé du container | |
dataset | DataFrame | None | le dataset |
colonnes_a_masquer | list | [] | les colonnes à masquer |
colonnes_a_conserver | list | [] | les colonnes qui ne seront pas transformées |
Un exemple de création d’un container, et ce que ça affiche
= Container('hyper_basic', df_basic)
basic basic
Container for "hyper_basic" of shape (2, 5)
Egalité de 2 containers
Si la clé et la meme, et le shape du dataset également, alors on est sur le meme container
= pd.DataFrame([[0, 1, 3, 4], [5, 6, 8, 9]], columns=['A', 'B', 'D', 'E'])
df_basic2 df_basic2
A | B | D | E | |
---|---|---|---|---|
0 | 0 | 1 | 3 | 4 |
1 | 5 | 6 | 8 | 9 |
ici quelques tests d’égalité
'basic', df_basic), Container('basic', df_basic)) test_eq(Container(
longueur
Container.longueur
Container.longueur ()
retourne le nombre de lignes du dataset
= pd.DataFrame([[0, 1, 3, 4], [5, 6, 8, 9]], columns=['A', 'B', 'D', 'E'])
df_basic2 'basic', df_basic2).longueur() Container(
2