/
todo.txt
42 lines (26 loc) · 1.12 KB
/
todo.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Lucene ongelmat
- kaikki haut menevät samalla serialisoinnilla
-- kaikki lowercaseksi tapaus
-- kyselystring splittaus
- tarvitaan polun pohjalta päättely onko siihen liittyvä kenttä tokenisoitu vai ei
TOKENISOITU
- "a b c" --> "a" "b" "c"
name.eq("a") --> name:a
name.eq("a b") --> name:"a b"
name.eq("a b c") --> osuu
name.eq("A B C") --> osuu --> johtuu siitä että StandardAnalyzer laittaa tokenit lowercase muodossa indeksiin
name("a-b") --> "a" "b" --> name.eq("a-b") --> name:"a-b" --> ei osu
name.eqIgnoreCase --> on sama kuin eq --> haittaako vai ei?
name.startsWith("a b") --> +name:a* +name:*b* --> osuu myös name("a cb") --> minusta bugi
name.startsWith("a-b") --> +name:a-b* --> mutta tämä ei osu mihinkään koska name("a-b") ---> "a" "b"
TOKENISOIMATTOMAT (mikään näistä ei siis nyt toimi)
name("a b") --> "a b"
name.eq("a b") --> pitäisi osua
name.eq("A B") --> ei osu
name.eqIgnoreCase("A B") --> ??
name.startsWith("a b") --> pitäisi osua
name.startsWithIgnoreCase("A B") --> ??
STEPIT
- Field nimen päättely polusta
- Tokenisoitu vai ei
@Field( index = Index.ANALYZED | NOT_ANALYZED | NO )