幻想完成度0.5 桌面小姐姐

https://github.com/moeru-ai/airi

Project AIRI

模型驱动的灵魂容器,什么都能做一点的桌宠:让 Neuro-sama 这样的虚拟伴侣也成为我们世界中的一份子吧!

[加入 Discord] [试试看] [English] [日本語]

AIRI - A container of cyber living souls, re-creation of Neuro-sama | Product Hunt
moeru-ai%2Fairi | Trendshift

深受 Neuro-sama 启发

Warning

注意: 我们没有发行任何与本项目关联的加密货币或代币,请注意判断资讯并谨慎行事。

Note

我们有一个专门的组织 @proj-airi 用于所有从 Project AIRI 诞生的子项目,快来看看吧!

RAG(检索增强生成)、记忆系统、嵌入式数据库、图标、Live2D 实用工具等等!

你是否梦想过拥有一个赛博生命(网络老婆/老公、数字桌宠),或者能与你玩耍和交谈的 AI 伴侣?

借助现代大型语言模型的力量,像是 ChatGPT 和著名的 Claude 所能带来的,想要 LLM(大语言模型)和我们角色扮演、聊天已经超简单了,每个人都能上手。而像 Character.ai(又称 c.ai) 和 JanitorAI 这样的平台,以及本地应用如 SillyTavern(又称酒馆),已经是基于聊天或文字冒险游戏体验的相当不错的解决方案。

但是,如何赋予它们玩游戏的能力呢?让它们能看到你正在编写的代码?不仅能一边聊天一边玩游戏,也可以看视频,还能做很多其他事情?

你可能已经知道 Neuro-sama,她目前是最好的能够玩游戏、聊天并与你和参与者(在VTuber社区中)互动的 AI VTuber / 伴侣,有些人也称这种存在为”数字人”。可惜的是,她并不开源,当她从直播中下线后,你就无法与她互动了

因此,这个项目 AIRI,在这里提供了另一种可能性:让你轻松拥有自己的数字生命、赛博生命,随时随地

这个项目有什么特别的呢?

与其他 AI 和 LLM 驱动的 VTuber 开源项目不同,アイリ VTuber 从开始开发的第一天开始就支持多种 Web 技术,涵盖诸如 WebGPUWebAudioWeb WorkersWebAssemblyWebSocket 等已经广泛应用或仍在大量实验的 API。

这意味着 アイリ VTuber 能够在现代浏览器和设备上运行,甚至能够在移动设备上运行(已经完成了 PWA 支持),这为我们(贡献者们)带来了更多的可能性,让我们得以更进一步构建和扩展 アイリ VTuber 的外部功能,而与此同时也不失配置的灵活性——可以有选择地在不同设备上启用会需要 TCP 连接或其他非 Web 技术的功能,例如连接到 Discord 的语音频道一起开黑,或是和朋友们一起玩 Minecraft(我的世界)、Factorio(异星工厂)。

Note

アイリ VTuber 仍处于早期开发阶段,我们欢迎优秀的开发者加入我们,一起将它变为现实。

即使不熟悉 Vue.js、TypeScript 和所需的其他开发工具也没关系,我们也欢迎艺术家、设计师、运营策划的加入,你甚至可以成为第一个用 アイリ VTuber 直播的博主。

如果你使用的是 React、 Svelte,甚至 Solid 也没关系,您可以自己创建一个子目录,添加您希望在 アイリ VTuber 中看到的功能,或者想实验的功能。

我们非常期待以下领域的朋友加入:

  • Live2D 模型师
  • VRM 模型师
  • VRChat 模型设计师
  • 计算机视觉(CV)
  • 强化学习(RL)
  • 语音识别
  • 语音合成
  • ONNX 推理运行时
  • Transformers.js
  • vLLM
  • WebGPU
  • Three.js
  • WebXR (也可以看看我们在 @moeru-ai 组织下另外的这个项目)

如果你已经感兴趣了,为什么不来这里和大家打个招呼呢?Would like to join part of us to build AIRI?

当前进度

  • 思维能力
    •  玩 Minecraft
    •  玩 Factorio
    •  在 Telegram 聊天
    •  在 Discord 聊天
    • 记忆
      •  纯浏览器内数据库支持(基于 DuckDB WASM 或者 sqlite
      •  Alaya 记忆层(施工中)
    •  纯浏览器的本地推理(基于 WebGPU)
  • 语音理解
    •  浏览器音频输入
    •  Discord 音频输入
    •  客户端语音识别
    •  客户端说话检测
  • 语言能力
  • 身体动作
    • VRM 支持
      •  控制 VRM 模型
    • VRM 模型动画
      •  自动眨眼
      •  自动看
      •  空闲眼睛移动
    • Live2D 支持
      •  控制 Live2D 模型
    • Live2D 模型动画
      •  自动眨眼
      •  自动看
      •  空闲眼睛移动

开发

有关开发此项目的具体教程,参见 CONTRIBUTING.md

pnpm i pnpm dev

网页版 (也就是 airi.moeru.ai 的版本)

pnpm dev:web

桌面版(也叫拓麻歌子,aka 电子宠物)

pnpm dev:tamagotchi

文档站

pnpm -F @proj-airi/docs dev

原生支持的 LLM API 服务来源列表(由 xsai 驱动)

从这个项目诞生的子项目

  • unspeech: 用于代理 /audio/transcriptions 和 /audio/speech 的代理服务器实现,类似 LiteLLM 但面向任何 ASR 和 TTS
  • hfup: 帮助部署、打包到 HuggingFace Spaces 的工具集
  • @proj-airi/drizzle-duckdb-wasm: DuckDB WASM 的 Drizzle ORM driver 驱动
  • @proj-airi/duckdb-wasm: 易于使用的 @duckdb/duckdb-wasm 封装
  • @proj-airi/lobe-icons: 为 lobe-icons 漂亮的 AI & LLM 图标制作的 Iconify JSON 封装,支持 Tailwind 和 UnoCSS
  • AIRI Factorio: 让 AIRI 玩 Factorio
  • Factorio RCON API: Factorio 无头服务器控制台的 RESTful API 封装
  • autorio: Factorio 自动化库
  • tstl-plugin-reload-factorio-mod: 开发时支持热重载 Factorio 模组
  • 🥺 SAD: 自托管和浏览器运行 LLM 的文档和说明
  • Velin: 用 Vue SFC 和 Markdown 文件来为 LLM 书写简单好用的提示词
  • demodel: 轻松加速各种推理引擎和模型下载器拉/下载模型或数据集的速度
  • inventory: 中心化模型目录和默认服务来源配置的公开 API 服务
  • MCP Launcher: 易于使用的 MCP 启动器,适用于所有可能的 MCP Server,就像用于模型推理的 Ollama 一样!
  • @proj-airi/elevenlabs: ElevenLabs API 的类型定义

https://viewscreen.githubusercontent.com/markdown/mermaid?docs_host=https%3A%2F%2Fdocs.github.com&color_mode=light#d44cc388-5696-4f6d-8a48-845520d580d2Loading

同类项目

开源项目

非开源项目

项目状态

Repobeats analytics image

鸣谢

Star History

Star History Chart

发表回复