Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请问是否可以使用自己的数据进行模型训练 #85

Open
jiangzihan2002 opened this issue Feb 27, 2024 · 4 comments
Open

请问是否可以使用自己的数据进行模型训练 #85

jiangzihan2002 opened this issue Feb 27, 2024 · 4 comments

Comments

@jiangzihan2002
Copy link

具体应该怎样调用接口呢

@Columbine21
Copy link
Collaborator

您好,当前框架支持使用自己的数据集进行训练,具体做法是在

DATASET_MAP = {
中增加对应数据集的初始化函数,类似于其他数据集。如果还有什么具体问题可以继续提问

@jiangzihan2002
Copy link
Author

您好,当前框架支持使用自己的数据集进行训练,具体做法是在

DATASET_MAP = {

中增加对应数据集的初始化函数,类似于其他数据集。如果还有什么具体问题可以继续提问

您好,我尝试使用了自己的数据集抽取了特征,文件组织与配置如下,请问(1)为什么label.csv的内容好像并没有读取到,即并没有抽取文本的特征,且生成了error.csv空白文件(2)我能通过修改[MMSA/src/MMSA/data_loader.py]直接对抽取出来的特征进行训练吗,特征的抽取方式和维度是否会对代码运行有影响,谢谢!!!
Snipaste_2024-03-03_16-38-00
Snipaste_2024-03-03_16-38-50
Snipaste_2024-03-03_16-38-58

@Columbine21
Copy link
Collaborator

对于Q-1:我目前不太能通过提供的信息判断是什么原因。

对于 Q-2 : 我能通过修改[MMSA/src/MMSA/data_loader.py]直接对抽取出来的特征进行训练吗,特征的抽取方式和维度是否会对代码运行有影响,

这个问题,一般来说抽出的特征需要做一下归一化(否则训练会不收敛),其他MMSA框架是完全支持的。

@jiangzihan2002
Copy link
Author

jiangzihan2002 commented Mar 3, 2024 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants