-
Notifications
You must be signed in to change notification settings - Fork 33
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
使用窗口去切分句子有相关的参考材料吗? #2
Comments
用滑动窗口去切句子是一种比较常见的做法,但是我在比赛中用到的方法有一点点不一样,不清楚是否有在别的 Paper 中出现过。 |
您好。您能说一下您的程序每个部分是干嘛的吗?对于原始数据集做处理的部分的程序有吗?具体在什么地方呢?每个部分的程序的大概说一下他的功能是干嘛的呢? |
数据处理部分的代码请参考
因为我们的模型是对一个句子做预测,但是你提交结果是对一篇文章提交结果。因此这里就涉及到 譬如一个 Document 有 20 个字 [w0, w1, ..., w19],两个 Entities,坐标分别是 (3, 5), (12, 15)。如果把这个 Document 切分成两个 Sentence 的话,有 Sentence 1 - text: [w0, w1, ..., w9], entities: [(3, 5)], offset: 0 通过记录 sentence 在 document 中的偏移量 |
好的。谢谢。您好。可以加一下您的QQ吗?我想复现一下您的这个项目。 |
您好,请问一下最终的图谱您有没有构造出来?对于这种实体数目比较小的图谱该怎么构造?谢谢~ |
这个比赛没有要求真的去构造知识图谱。您可以考虑一下图数据库,比如 TigerGraph, ArangoDB 或者 Neo4j |
为啥是5的长度嘞? |
长度为5只是举例子 |
我想问一下你的用窗口去切分句子是自己想的还是看Paper的啊?如果是看Paper可以分享一下Paper的链接吗?
The text was updated successfully, but these errors were encountered: