Skip to content

Latest commit

 

History

History
141 lines (100 loc) · 5.93 KB

README.zh.md

File metadata and controls

141 lines (100 loc) · 5.93 KB

Hover

通过向量降维, 极速探索和批量标注数据, 并用作模型训练或其它用途.

en zh

PyPI Version Conda Version Downloads Main Build Status Nightly Build Status Codacy Grade Codacy Coverage

hover 是一个批量标注数据的工具, 只需数据能被向量表示.

  • 标注过程很简单, 如同给散点图上色.
  • 通过移动鼠标和框选, 来观察数据(在降维后的)点簇.
  • 使用小工具(如搜索/过滤/规则/主动学习)来提升精度.
  • 输入合适的标签, 并点击"Apply"按钮, 即可标注!

GIF Demo

🚀 在线演示

  • 查看含代码的教程, 可在浏览器中编辑和运行, 无需安装依赖.
  • 跳过所有代码, 进入托管在Binder上的标注界面.

✨ 具体功能

🔭 将向量降维得到二维数据散点图, 并配有

提示框 来显示具体数据内容
表格来 批量检视 选中的数据
切换按钮来 区分数据子集
文本/正则匹配 来定向搜寻数据

🔬 与标注界面同步的辅助模式

`Finder`: 以匹配条件来 过滤 选中的数据
`SoftLabel`: 主动学习 用模型打分过滤选中的数据
`Snorkel`: 自定义函数 来过滤数据或直接打标

🧰 更多的补充工具

降维时保留 更多维度 (3D? 4D?) 并动态选择观察的平面
跨界面/跨维度地进行 持续选取/反选 以达到更高精度
剔除选中数据中的异类 以及 修订发现的误标

📦 Install

Python: 3.8+

OS: Linux & Mac & Windows

PyPI: pip install hover

Conda: conda install -c conda-forge hover

📖 资料

🎏 新动态

  • Jan 21, 2023 新版本 0.8.0 已就绪, 可查看 changelog 获悉详情 🥳.

🔔 其它说明

鸣谢和推荐

  • 我们推荐 Bokeh 可视化框架, hover正是基于它的图表同步和回调函数来实现非常重要的功能.
  • 感谢 Philip Vollethover的迭代早期 无偿地帮助在开源社区内推广.

提供贡献

  • 我们欢迎任何反馈, 特别是使用中的痛点!
  • ./requirements-dev.txt 列出了开发者所需的依赖.
  • 我们建议在提交PR前启用.pre-commit-config.yaml中列出的pre-commit hook.

引用

如果hover对您的工作有帮助, 请告诉我们或引用 🤗

@misc{hover,
  title={{hover}: label data at scale},
  url={https://github.com/phurwicz/hover},
  note={Open software from https://github.com/phurwicz/hover},
  author={
    Pavel Hurwicz and
    Haochuan Wei},
  year={2021},
}