Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

solr索引的問題 #6

Open
benchuang11046 opened this issue Jul 6, 2016 · 2 comments
Open

solr索引的問題 #6

benchuang11046 opened this issue Jul 6, 2016 · 2 comments
Labels

Comments

@benchuang11046
Copy link

您好,
在solr做分析索引一段句子
土木水利工程界出身的副市長林陵三指出
分析索引出來為
土木 水利工程 界 出身 的 副 市长 林 陵 三 指出
當我要索引水利時,這段句子並不會出現
因此我想詢問在分析時如何不把水利工程做合併
或是分析出水利 工程,讓我能索引到水利

另一個例子是習近平政府也會變成一個nt
有沒有其他模式可以解析習近平 政府

謝謝

@benchuang11046
Copy link
Author

benchuang11046 commented Jul 7, 2016

另外再請問一個問題
schema.xml的設定

<analyzer  type = "query" >
      <tokenizer  class = "com.hankcs.lucene.HanLPTokenizerFactory"  enableIndexMode = "false" />
</analyzer>

enableIndexMode是指在query時會以索引字詞索引嗎?
如果是true會以習近平政府做索引
false會以習近平政府做索引

如果我只想要索引連在一起的詞該如何做?

謝謝

@hankcs
Copy link
Owner

hankcs commented Jul 7, 2016

如你所说,IndexMode可以细分“習近平 政府”。
你可以使用
<analyzer type = "query" ><analyzer type = "index" >
分别指定查询和索引时使用不同的分词策略。

@hankcs hankcs added the question label Jul 7, 2016
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

2 participants