Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Suche nach String-Fragmenten in den Tatvorwürfen #755

Open
RalphBike opened this issue Apr 11, 2024 · 7 comments
Open

Suche nach String-Fragmenten in den Tatvorwürfen #755

RalphBike opened this issue Apr 11, 2024 · 7 comments

Comments

@RalphBike
Copy link

RalphBike commented Apr 11, 2024

Die Suche nach den Tatvorwürfen ist bei der Fülle an Kandidaten nur semi-hilfreich. Bei den gefühlten 68 Einträgen findet man kaum den richtigen Kandidaten für "gehweg". Die Favoriten helfen auch nur begrenzt, da sie sich nicht an den Favoriten meines Users orientieren und auch nicht steuerbar sind.

Netter wäre eine Suche, die nicht nur den kompletten String, sondern und-verknüpft die einzelnen Fragmente des Strings sucht und gerne auch Quotes beherrscht.

Z.B.

gehweg behind => 102712, 112051, 112655, etc.
gehweg park stund => 112324, 112656, etc.
"es kam zum unfall" => Diverse Treffer
"es kam unfall" => Kein Treffer

Klingt kompliziert, ist mit Regex aber eigentlich ganz überschaubar und sogar Quotes lassen sich machen:
https://stackoverflow.com/questions/32034567/split-string-on-spaces-except-words-in-quotes

Wenn man ambitioniert genug ist, könnte man mit den Fragmenten dann sogar noch versuchen, ein paar Hilfestellungen zu geben, in dem für allgemein etablierte Begriffe auch das Behörden-Pendant gefunden wird.

z. B.

zebra => Fußgängerüberweg
halteverbot => haltverbot
ampel => lichtzeigenanlage
behinderung => behindert
roller => elektrokleinstfahrzeug
scooter => elektrokleinstfahrzeug
gesenk => absenkung
gewicht => gesamtmasse
Radfahrstreifen => Zeichen 295
mittellinie => fahrstreifenbegrenzung
@phoet
Copy link
Member

phoet commented Apr 11, 2024

Die Favoriten helfen auch nur begrenzt, da sie sich nicht an den Favoriten meines Users orientieren und auch nicht steuerbar sind.

Doch, genau das sind sie.

@RalphBike
Copy link
Author

RalphBike commented Apr 12, 2024

Oh, sorry. Wenn das schon über häufig verwendete Tatvorwürfe pro User implementiert ist, dann wundert mich das Ergebnis etwas, weil auch eher nischige Sachen in meinen Favoriten auftauchen. Daher hat sie Auswahl auf mich global oder statisch gewirkt.

Trotzdem wäre eine Suche sinnvoll, die nicht den Wortlaut der Tatvorwürfe voraussetzt.

@phoet
Copy link
Member

phoet commented Apr 12, 2024

Die Community war ganz eindeutig für die Auswahl der tatsächlichen Vergehen. Das ist nun mal kompliziert.

@phoet
Copy link
Member

phoet commented Apr 12, 2024

Nur weil die Daten pro User genutzt werden kommt es zu nischigen Einträgen. das ist statistisch garantiert

@RalphBike
Copy link
Author

Klar und an der Stelle könnte das Portal den User im Umgang mit den Tatvorwürfen besser unterstützen, dafür habe ich einen Vorschlag gemacht.

@phoet
Copy link
Member

phoet commented Apr 12, 2024

Die Daten des BKAT sind inherent schlecht strukturiert. Wenn die wenigstens eine Hierarchie hätten, dann könnte man schon wesentlich besser damit umgehen. Wir sind ja schon froh, dass wir die Daten über einen Umweg maschinell einlesen können.

@RalphBike
Copy link
Author

RalphBike commented Apr 12, 2024

Jo... ist bekannt. Die Bußgelder wirken auch komplett willkürlich. Siehe Geschichten wie 137100, 118100 und 142000.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants