Corrigé CC4
- Charger les données du fichier Donnees_M2_RD.xlsx dans une DataFrame placée dans une variable df.
import pandas
df = pandas.read_excel("Donnees_M2_RD.xlsx")
- Afficher les valeurs de la colonne Mode de df. On ne veut pas de doublon dans cet affichage.
df["Mode"].drop_duplicates()
0 Dic
50 Dio
Name: Mode, dtype: object
- Placer dans une DataFrame df_d les essais de la valeur pour Side est D.
Placer dans une DataFrame df_g les essais de la valeur pour Side est G.
df_d = df[df["Side"] == "D"]
df_g = df[df["Side"] == "G"]
df_g
|
Subject |
Name_A |
Name_B |
Dist_A |
Dist_B |
Mode |
Space |
Side |
Response |
RT |
50 |
P_ADI_331 |
4 |
0 |
3 |
4 |
Dio |
E |
G |
2 |
12853 |
51 |
P_ADI_331 |
2 |
4 |
2 |
4 |
Dio |
E |
G |
1 |
11331 |
52 |
P_ADI_331 |
2 |
0 |
3 |
5 |
Dio |
E |
G |
2 |
12316 |
53 |
P_ADI_331 |
4 |
0 |
2 |
4 |
Dio |
E |
G |
2 |
12698 |
54 |
P_ADI_331 |
2 |
3 |
1 |
2 |
Dio |
E |
G |
1 |
11060 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
9539 |
P_VAR_330 |
4 |
3 |
5 |
4 |
Dic |
I |
G |
2 |
11587 |
9540 |
P_VAR_330 |
3 |
4 |
5 |
1 |
Dic |
I |
G |
2 |
7388 |
9541 |
P_VAR_330 |
2 |
3 |
3 |
2 |
Dic |
I |
G |
2 |
5454 |
9542 |
P_VAR_330 |
0 |
2 |
4 |
5 |
Dic |
I |
G |
1 |
11399 |
9543 |
P_VAR_330 |
4 |
1 |
5 |
2 |
Dic |
I |
G |
2 |
5379 |
4797 rows × 10 columns
- Créer une Series s_name_a_d contenant la moyenne des RT par Name_A pour les essais ayant Side qui vaut D.
Créer une deuxième Series s_name_a_g sur le même principe, mais pour les essais ayant Side qui vaut G.
s_name_a_d = df_d.groupby("Name_A")["RT"].mean()
s_name_a_d = df_g.groupby("Name_A")["RT"].mean()
s_name_a_g
Name_A
0 11563.671875
1 11409.440625
2 11274.438413
3 11867.061458
4 11575.469239
Name: RT, dtype: float64
- Indiquer les Name_A dont le RT pour les essais ayant Side valant D est en moyenne inférieur à celui pour les essais ayant Side valant G.
df_gd = pandas.concat([s_name_a_g.rename("RT_G"), s_name_a_d.rename("RT_D")], axis=1)
# On affiche juste pour vérifier les données
df_gd
|
RT_G |
RT_D |
Name_A |
|
|
0 |
11563.671875 |
12746.558455 |
1 |
11409.440625 |
12360.142708 |
2 |
11274.438413 |
12216.627083 |
3 |
11867.061458 |
12803.990615 |
4 |
11575.469239 |
12683.611458 |
df_gd[df_gd["RT_G"] > df_gd["RT_D"]]