how should OneHotEncoding be used? #7

flamz3d · 2020-07-22T12:38:42Z

hello, I'm trying to create a dataset and one feature I'd like to encode is WEEKDAY as a one-hot encoded vector

I tried:
engine.add(factors.filter.OneHotEncoder(factors.WEEKDAY), "weekday")
and
engine.add(factors.WEEKDAY.one_hot(), "weekday")
seems to be called and encoded properly, however I get an error saying factors cannot return multiple values.

What's the proper way to use the OneHotEncoder filter?

The text was updated successfully, but these errors were encountered:

Heerozh · 2020-07-22T13:08:13Z

OneHotEncoder factor returns multiple values by class, for example, if you encoding [1,2,2,3], it will return 3 values: [1, 0, 0, 0], [0, 1, 1, 0], [0, 0, 0, 1]

So just use slice []:

onehots = factors.WEEKDAY.one_hot()
for i in range(5):
    engine.add(onehots[i], "weekday{}".format(i+1))

btw: other factors such as RollingLinearRegression also return multiple values (slope and intercept)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

how should OneHotEncoding be used? #7

how should OneHotEncoding be used? #7

flamz3d commented Jul 22, 2020 •

edited

Heerozh commented Jul 22, 2020 •

edited

how should OneHotEncoding be used? #7

how should OneHotEncoding be used? #7

Comments

flamz3d commented Jul 22, 2020 • edited

Heerozh commented Jul 22, 2020 • edited

flamz3d commented Jul 22, 2020 •

edited

Heerozh commented Jul 22, 2020 •

edited