You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1.9 KiB

The exercice is validated is all questions of the exercice are validated
The question 1 is validated if the number of unique values per feature outputted are:
age             6
menopause       3
tumor-size     11
inv-nodes       6
node-caps       2
deg-malig       3
breast          2
breast-quad     5
irradiat        2
dtype: int64
The question 2 is validated if the transformed test set by the OneHotEncoder fitted on the train set is:
```console
First 10 rows: 

array([[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
    [1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
    [0., 1., 1., 0., 0., 1., 0., 0., 0., 0., 1., 0., 1.],
    [0., 1., 1., 0., 0., 1., 0., 0., 0., 0., 1., 1., 0.],
    [1., 0., 1., 0., 0., 0., 1., 0., 0., 1., 0., 0., 1.],
    [1., 0., 1., 0., 0., 0., 0., 1., 0., 1., 0., 1., 0.],
    [1., 0., 0., 1., 0., 0., 0., 0., 1., 1., 0., 1., 0.],
    [1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 1., 0.],
    [1., 0., 1., 0., 0., 0., 0., 1., 0., 0., 1., 0., 1.],
    [1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 0., 1.]])
```
The question 3 is validated if the transformed test set by the OrdinalEncoder fitted on the train set is:
```console
First 10 rows: 

array([[2., 2., 0., 1.],
    [2., 2., 0., 0.],
    [2., 4., 5., 2.],
    [1., 5., 1., 1.],
    [2., 5., 0., 2.],
    [1., 1., 0., 1.],
    [1., 8., 0., 1.],
    [2., 2., 0., 0.],
    [2., 5., 0., 2.],
    [1., 3., 0., 0.]])
```
The question 3 is validated if the column transformer transformed that is fitted on the X_train, transformed the X_test as:
# First 2 rows: 

array([[1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0., 2., 2., 0.,
        1.],
       [1., 0., 1., 0., 0., 1., 0., 0., 0., 1., 0., 1., 0., 2., 2., 0.,
        0.]])