[Question] How to compute precision for a retriever operating at passage-level #63

ronanki · 2024-03-03T17:43:26Z

If the retriever is operating at passage / chunk-level and hence the retrieved results can have duplicate IDs as shown below:
Top-10 retrieval list for each of the queries:

q_1: ['d_1', 'd_1', 'd_1', 'd_1', 'd_1', 'd_1', 'd_5', 'd_5', 'd_5', 'd_5']
q_2: ['d_4', 'd_4', 'd_4', 'd_4', 'd_2', 'd_2', 'd_6', 'd_6', 'd_6', 'd_6']

Encoding them into a dictionary results in:

run_dict = { "q_1": { "d_1": 0.9, "d_5": 0.8 }, 
             "q_2": { "d_4": 0.9, "d_2": 0.8, "d_6": 0.7 } }

where qrels could be:

qrels_dict = { "q_1": { "d_1": 5, "d_5": 3 },
               "q_2": { "d_4": 6, "d_6": 1 } }

Considering above scenario, the precision@10 would yield very low score, even though it is not the case. How can we fix this issue?

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Question] How to compute precision for a retriever operating at passage-level #63

[Question] How to compute precision for a retriever operating at passage-level #63

ronanki commented Mar 3, 2024

[Question] How to compute precision for a retriever operating at passage-level #63

[Question] How to compute precision for a retriever operating at passage-level #63

Comments

ronanki commented Mar 3, 2024