Browse Source

fix audit with the right data file

pull/62/head
brad-gh 2 years ago committed by eslopfer
parent
commit
d97b14c5ba
  1. 53
      piscine/week02/day03/ex05/audit/README.md

53
piscine/week02/day03/ex05/audit/README.md

@ -15,47 +15,44 @@ irradiat 2
dtype: int64
```
##### The question 2 is validated if the transformed test set by the `OneHotEncoder` fitted on the train set is:
##### The question 2 is validated if the transformed test set by the `OneHotEncoder` fitted on the train set is as below. Make sure the transformer takes as input a dataframe with the columns in the order defined `['node-caps' , 'breast', 'breast-quad', 'irradiat']` :
```console
First 10 rows:
array([[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
[0., 1., 1., 0., 0., 1., 0., 0., 0., 0., 1., 0., 1.],
[0., 1., 1., 0., 0., 1., 0., 0., 0., 0., 1., 1., 0.],
[1., 0., 1., 0., 0., 0., 1., 0., 0., 1., 0., 0., 1.],
[1., 0., 1., 0., 0., 0., 0., 1., 0., 1., 0., 1., 0.],
[1., 0., 0., 1., 0., 0., 0., 0., 1., 1., 0., 1., 0.],
[1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
[1., 0., 1., 0., 0., 0., 0., 1., 0., 0., 1., 0., 1.],
[1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 0., 1.]])
array([[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0.],
[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0.],
[1., 0., 1., 0., 0., 0., 0., 1., 0., 1., 0.],
[1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0.],
[1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
[1., 0., 0., 1., 0., 0., 1., 0., 0., 1., 0.],
[1., 0., 0., 1., 0., 0., 1., 0., 0., 1., 0.],
[1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0.],
[1., 0., 0., 1., 0., 0., 1., 0., 0., 1., 0.],
[0., 1., 1., 0., 0., 0., 1., 0., 0., 0., 1.]])
```
##### The question 3 is validated if the transformed test set by the `OrdinalEncoder` fitted on the train set is:
##### The question 3 is validated if the transformed test set by the `OrdinalEncoder` fitted on the train set is as below with the columns ordered as `["menopause", "age", "tumor-size","inv-nodes", "deg-malig"]`:
```console
First 10 rows:
array([[2., 2., 0., 1.],
[2., 2., 0., 0.],
[2., 4., 5., 2.],
[1., 5., 1., 1.],
[2., 5., 0., 2.],
[1., 1., 0., 1.],
[1., 8., 0., 1.],
[2., 2., 0., 0.],
[2., 5., 0., 2.],
[1., 3., 0., 0.]])
array([[1., 2., 5., 0., 1.],
[1., 3., 4., 0., 1.],
[1., 2., 4., 0., 1.],
[1., 3., 2., 0., 1.],
[1., 4., 3., 0., 1.],
[1., 4., 5., 0., 0.],
[2., 5., 4., 0., 1.],
[2., 5., 8., 0., 1.],
[0., 2., 3., 0., 2.],
[1., 3., 6., 4., 2.]])
```
##### The question 3 is validated if the column transformer transformed that is fitted on the X_train, transformed the X_test as:
##### The question 4 is validated if the column transformer transformed that is fitted on the X_train, transformed the X_test as:
```console
# First 2 rows:
array([[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0., 2., 2., 0.,
1.],
[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0., 2., 2., 0.,
0.]])
array([[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 2., 5., 0., 1.],
[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 3., 4., 0., 1.]])
```

Loading…
Cancel
Save