[BUG] SweRec labels #416

timpal0l · 2024-04-22T09:35:15Z

timpal0l
Apr 22, 2024

🐛 Describe the bug

Some of the labels of SweRec are probably wrong;

-------------
Seg och svårt att hitta alla alternativ om resor och byten.

Label: neutral, Pred: negative

-------------
Vill inte skriva något

Label: positive, Pred: neutral

-------------
Fick all hjälp jag behövde men kan tycka att det borde finnas någon att ringa på kvällstid.

Label: positive, Pred: neutral

-------------
Jag fick ej min leverans på grund av att hon som skulle leverera tårtan råkade ut för en olycka så att tårtan blev fördärvad!

Label: neutral, Pred: negative

-------------
Bra att de ha fri frakt, men det tog 9 dagar att få varan istället för 3-5 dagar som står på sibas sida. mycket besviken.

Label: neutral, Pred: negative

-------------
När man ska välja tyg och modell / fason på diverse plagg är beskrivningen,benämningen alltför fackmannamässigt eller obekant för de flesta. en ordlista med beskrivningar,förklaringar kunde vara till stor hjälp.

Label: positive, Pred: neutral

-------------
Väldigt rörigt och många turer fram och tillbaka efter att dom själva slarvat bort ett pantbrev skickat via rek-post. nu verkar det iofs som att dom löser det på ett bra sätt ändå men allt är inte klart än. dessutom blev vi fakturerade fel belopp men det åtgärdades snabbt. annars så bra pris och banken är nöjd.

Label: negative, Pred: neutral

-------------
Allt var bra men räkna in momsen i priset så den ingår!!!!!

Label: positive, Pred: neutral

Operating System

Linux

Device

CUDA GPU

Python version

3.10.x

ScandEval version

12.7.0

saattrupdan · 2024-04-23T14:19:49Z

saattrupdan
Apr 23, 2024
Maintainer

I'm sure all evaluations datasets have wrong labels, unfortunately. At least we are evaluating all models on the same datasets, so the hope is that these errors won't have an impact on the final ranking.

That being said, any SweReC-specific fixes are of course welcome, and the most appropriate place to do so would be as a PR in the original source repo. If any such PRs have been merged, then we can refresh the ScandEval SweReC dataset (and re-evaluate all models on the improved dataset).

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG] SweRec labels #416

{{title}}

{{editor}}'s edit

{{editor}}'s edit

Replies: 1 comment

{{title}}

Select a reply

[BUG] SweRec labels #416

timpal0l Apr 22, 2024

🐛 Describe the bug

Operating System

Device

Python version

ScandEval version

Replies: 1 comment

saattrupdan Apr 23, 2024 Maintainer

timpal0l
Apr 22, 2024

saattrupdan
Apr 23, 2024
Maintainer