feat: 支持使用AI对数据库内容做归纳总结以及查询 #111

welann · 2024-01-31T09:17:55Z

效果是这样的：

体验：
https://app.shokichan.com/c/tg/bookshelf_in_storageroom?anchor=49c40b9c-51ef-4d6c-bcc6-dcf453a16574

有了AI之后，或许会更强大？
这种功能应该也有人实现过了（~~抄一遍就好~~

如果没有相关计划的话我倒是可以试试，但是可能会烂尾

welann · 2024-01-31T10:53:44Z

又看了一下已经有人再写了，棒(๑•̀ㅂ•́)و✧

Antonoko · 2024-01-31T12:25:41Z

谢谢好建议！感觉如果要做还是个挺大的坑，不过未来也可以一试（目前和 AI 强相关的可能只有这个语义搜索图片的pr https://github.com/yuka-friends/Windrecorder/pull/89）

我想目前比较大的实现问题是采集的数据还不足，现在只记录了画面的绝对时间和 OCR 信息，交给文本窗口很大的 LLM 可能也难以有较好判断与准确度。如果能加入对前台程序名的记录、甚至像 Rewind 一样加入对浏览器浏览网页 meta 信息（网址、标题）的记录，结合 RAG 语义检索 + LLM 生成 sql，还是有搞头的。

（工程上想想还是有很多要做，比如 LLM 的用户场景策略和行为可能有哪些、需要用什么策略召回哪些数据、召回数据怎么筛选清洗使用加工（比如统计不同行为时间段…）、是否引入图像语义的多模态描述…… 要做好还是太深坑啦

（不过我想到，如果想快速验证，其实也可以用类似插件的形态先解决具体的需求。比如做一个“我今天做了什么”的插件，运行就能根据既定策略总结内容，甚至作为一种“时间级”的标注给每天都生成一段文本总结附加上去，这样在回溯时就能马上知道这天做了什么了）

ps: 参考效果很酷

welann closed this as completed Jan 31, 2024

Antonoko reopened this Jan 31, 2024

Antonoko mentioned this issue Feb 2, 2024

相同的程序，但是有LLM，尽快接入LLM api? #114

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: 支持使用AI对数据库内容做归纳总结以及查询 #111

feat: 支持使用AI对数据库内容做归纳总结以及查询 #111

welann commented Jan 31, 2024

welann commented Jan 31, 2024

Antonoko commented Jan 31, 2024 •

edited

feat: 支持使用AI对数据库内容做归纳总结以及查询 #111

feat: 支持使用AI对数据库内容做归纳总结以及查询 #111

Comments

welann commented Jan 31, 2024

welann commented Jan 31, 2024

Antonoko commented Jan 31, 2024 • edited

Antonoko commented Jan 31, 2024 •

edited