Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于nlu.json数据格式的两点问题。 #84

Open
YYGe01 opened this issue Jun 15, 2020 · 0 comments
Open

关于nlu.json数据格式的两点问题。 #84

YYGe01 opened this issue Jun 15, 2020 · 0 comments

Comments

@YYGe01
Copy link

YYGe01 commented Jun 15, 2020

作者您好,关于数据格式有几个疑问,希望能帮忙看下,谢谢!
1、data/nlu/nlu.json 数据中有很大一部分样本存在空格现象,不知道会不会对训练有影响。
如 "喂 请 看下 四月 流量 多少流量"。
chatito_gen_nlu_data代码仓库增强数据集的方式里发现可以取消空格。
如:[greet] [greet?]可以改成[greet][greet?],生成的样本不会有空格。

2、data/nlu/nlu.json 数据中我看定义了很多的From intent。
intent:inform_item
intent:inform_current_phone
intent:inform_other_phone
intent:inform_package
intent:inform_time
我想问的是,这是5个intent,还是只有1个intent呢。
我认为如果这样定义名字训练的时候当作5个不同的intent单独训练了。
另外,我看rasa官方文档里的案例,是把一个intent里所有的样本都放在一起了。examples/formbot

非常感谢作者提供的项目,谢谢!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant