RT,需要CUDA 因为没有显卡,看来只能在网上训练 。
训练数据设置:
在data目录设置创建JSON文件:
如下的TEST.json
[
{
"instruction": "你是谁?",
"input": "",
"output": "我是Saya",
"history": []
},
{
"instruction": "Saya,真好听的名字,是谁给你取的?",
"input": "",
"output": "是一个很重要的人",
"history": []
}
]
需要修改data文件下的dataset_info.json文件。
{
"train": {
"file_name": "train.json",
"formatting": "sharegpt",
"columns": {
"messages": "conversations",
"images": "images"
}
},
"test": {
"file_name": "test.json",
"formatting": "sharegpt",
"columns": {
"messages": "conversations"
}
}
}
#将TEST的训练数据加入