月度归档:2024年11月

MAC下的大模型微调 数据格式 三种 chat completion text(CoT)

要义 MLX 针对mac的ARM处理器优化的大模型训练架构

看了那么多资料主要还是PIP安装 huggingface_hub mlx-lm transformers torch numpy

然后对应大模型文件微调

针对数据 Completion(问答类型,一问一答) chat(角色问答) text(单文本类型,训练特定文本) 三种类型 都是JSON格式

chat解析:

{
  "messages": [
    {
      "role": "user",
      "content": "How do I use this product?"
    },
    {
      "role": "assistantA",
      "content": "To use this product, first insert the batteries and then press the power button."
    },
    {
      "role": "assistantB",
      "content": "To operate this product, make sure it's charged, and then follow the instructions in the manual."
    }
  ]
}

message包裹下为信息,role为user的content为询问,assistantB和assistantA给出不同的content

completion解析

[{
  "prompt": "What is the capital of France?",
  "completion": "Paris."
},
{
  "prompt": "A?",
  "completion": "BBBB"
}]

TEXT格式

{"text": "table: 1-1000181-1\ncolumns: State/territory, Text/background colour, Format, Current slogan, Current series, Notes\nQ: Tell me what the notes are for South Australia \nA: SELECT Notes FROM 1-1000181-1 WHERE Current slogan = 'SOUTH AUSTRALIA'"}

部署

部署

四要素

人员:组建服务团队,培训教程库的建设和知识的转移方法

内部调岗(谈判),外部招聘 关注人员的能力 经验 知识

资源:
服务台的初始化,工具的部署上线,备件库的初始化,知识库的初始化 。

工具:工具清单, 测试环境 测试,试运行,参数的调整和优化,正式的部署上线

技术

技术手册的发布,SOP操作规范的制定,应急方案的制定,知识的转移

技术手册, 发布流程 审核 ,保存到配置库中 ,发布管理员 通过邮件的形式将技术手册的相关详细的描述信息,使用场景,下载地址等

过程

过程的制定与发布,过程的电子化与数据的初始化定义,体系试运营

过程的电子化与数据的初始化定义 将已经制定的工作流程过程通过IT系统的方式进行电子化,流程的初始化定义 重点关注以下事项

与其他工具互联互通    服务器来电后请求后自动生成事件

与其他过程做好接口   在某一时间大量同类事情制动生成问题

与过程KPI结合   IT服务系统可以自动生成服务的电子数据表格

过程与知识库关联     事件处理后自动生成一条相关的知识

2 IT服务部署的方法

部署一触而就的,需要经历以下三个阶段

服务部署实施计划阶段

生成一个计划,sla协议和服务部署设计方案    编写计划   服务部署的实施目标,里程碑,岗位职责 验收标准开会确认。

服务部署实施 执行阶段

启动会   明确工作任务和重点,搭建测试环境;工具 流程测试 工作,备件库 服务台 知识库 流程数据的初始化。做了管理工作;质量保证 风险识别 ; 为验收提供保障

服务部署实施验收阶段

服务部署实施的成功移交给运营团队进入运营

工具 知识库 流程 技术文档等。

成功交付后,总结大会,实施绩效 遇到的问题解决方案 遗留的问题 形成 IT服务部署实施报告

双方签字确认,部署工作的完成,正式进入运营