LLAMA_factory训练数据设置，需要CUDA

发表于2024年11月14日由admin

RT，需要CUDA 因为没有显卡，看来只能在网上训练。

训练数据设置：
在data目录设置创建JSON文件：
如下的TEST.json

[
    {
      "instruction": "你是谁？",
      "input": "",
      "output": "我是Saya",
      "history": []
    },
    {
        "instruction": "Saya,真好听的名字，是谁给你取的？",
        "input": "",
        "output": "是一个很重要的人",
        "history": []
      }
  ]

需要修改data文件下的dataset_info.json文件。

{
  "train": {
    "file_name": "train.json",
    "formatting": "sharegpt",
    "columns": {
      "messages": "conversations",
      "images": "images"
    }
  },
  "test": {
    "file_name": "test.json",
    "formatting": "sharegpt",
    "columns": {
      "messages": "conversations"
    }
  }
}
#将TEST的训练数据加入

此条目发表在None分类目录。将固定链接加入收藏夹。

发表回复取消回复

要发表评论，您必须先登录。