└── README.md


/README.md:
--------------------------------------------------------------------------------
 1 | ## OneClickLLAMA
 2 | - 一键运行 [Qwen3](https://github.com/QwenLM/Qwen3) [SakuraLLM](https://github.com/SakuraLLM/SakuraLLM)  等本地 LLM 模型
 3 | - 可与众多支持 OpenAI 格式的翻译器、分析器应用搭配使用，包括但是不限于：
 4 |   - [LinguaGacha](https://github.com/neavo/LinguaGacha) `使用 AI 能力一键翻译小说、游戏、字幕的次世代翻译器` `推荐` 👈👈
 5 |   - [KeywordGacha](https://github.com/neavo/KeywordGacha) `使用 AI 能力一键生成术语表的次世代翻译辅助工具` `推荐` 👈👈
 6 |   - [AiNiee](https://github.com/NEKOparapa/AiNiee)
 7 |   - [GalTransl](https://github.com/xd2333/GalTransl)
 8 |   - [绿站（轻小说翻译机器人）](https://books.fishhawk.top/workspace/sakura)
 9 | - 配合本页中的各应用的设置指南，可以得到最优化的性能，相较于默认设置可提升 3-5 倍
10 | 
11 | ## 要求
12 | - 至少 8G 显存的独立显卡，NVIDIA 显卡最佳，其他显卡很慢
13 | - 确保安装了 `最新版本` 的显卡驱动程序
14 | 
15 | ## 步骤
16 | - 从 [发布页](https://github.com/neavo/OneClickLLAMA/releases) 下载最新版本的 `OneClickLLAMA` 并解压缩
17 |   - `OneClickLLAMA_NV` 是 NVIDIA 专用的版本
18 |   - `OneClickLLAMA_VULKAN` 是 所有显卡 通用的版本
19 | - 根据用途和显存大小下载适合的模型并放入 `OneClickLLAMA` 文件夹
20 | 
21 | ## 对应表格
22 | - 日文翻译到中文
23 |   
24 | | 显存大小         | 模型规模    | 启动脚本        | 下载链接                                                   |
25 | |:---------------:|:-----------:|:--------------:|:---------------------------------------------------------:|
26 | | 8G/10G/11G      | 7B          | 01_2K_NP6.bat  | [sakura-7b-qwen2.5-v1.0-iq4xs.gguf](https://huggingface.co/SakuraLLM/Sakura-7B-Qwen2.5-v1.0-GGUF/blob/main/sakura-7b-qwen2.5-v1.0-iq4xs.gguf) |
27 | | 12G             | 14B         | 01_2K_NP6.bat  | [sakura-14b-qwen2.5-v1.0-iq4xs.gguf](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2.5-v1.0-GGUF/blob/main/sakura-14b-qwen2.5-v1.0-iq4xs.gguf) |
28 | | 16G             | 14B         | 01_2K_NP12.bat | [sakura-14b-qwen2.5-v1.0-iq4xs.gguf](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2.5-v1.0-GGUF/blob/main/sakura-14b-qwen2.5-v1.0-iq4xs.gguf) |
29 | | 24G             | 14B         | 01_2K_NP16.bat | [sakura-14b-qwen2.5-v1.0-q6k.gguf](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2.5-v1.0-GGUF/blob/main/sakura-14b-qwen2.5-v1.0-q6k.gguf) |
30 | 
31 | - 其他语言之间的互译（8B 效果很差，14B 勉勉强强，最好使用在线API）
32 | - 搭配 KeywordGacha 抓取实体词语表
33 | 
34 | | 显存大小         | 模型规模    | 启动脚本        | 下载链接                                                   |
35 | |:---------------:|:-----------:|:--------------:|:---------------------------------------------------------:|
36 | | 8G/10G/11G      | 8B          | 01_2K_NP6.bat  | [Qwen3-8B-IQ4_XS.gguf](https://huggingface.co/unsloth/Qwen3-8B-GGUF/blob/main/Qwen3-8B-IQ4_XS.gguf) |
37 | | 12G             | 14B         | 01_2K_NP6.bat  | [Qwen3-14B-IQ4_XS.gguf](https://huggingface.co/unsloth/Qwen3-14B-GGUF/blob/main/Qwen3-14B-IQ4_XS.gguf) |
38 | | 16G             | 14B         | 01_2K_NP12.bat | [Qwen3-14B-IQ4_XS.gguf](https://huggingface.co/unsloth/Qwen3-14B-GGUF/blob/main/Qwen3-14B-IQ4_XS.gguf) |
39 | | 24G             | 14B         | 01_2K_NP16.bat | [Qwen3-14B-Q6_K.gguf](https://huggingface.co/unsloth/Qwen3-14B-GGUF/blob/main/Qwen3-14B-Q6_K.gguf) |
40 | 
41 | ## 启动
42 | - 现在你的文件结构应该类似于：
43 | ```
44 |   OneClickLLAMA\llama\...
45 |                     \00_Core.bat
46 |                     \01_2K_NP16.bat
47 |                     \sakura-14b-qwen2.5-v1.0-iq4xs.gguf
48 |                     \...
49 | ```
50 | - 根据 `你的显存和模型的搭配组合` 选择对应的启动脚本，双击启动即可
51 |   
52 | ## 应用设置
53 | - 根据你的需求和使用的应用查看对应设置教程
54 |   - 搭配 [LinguaGacha](https://github.com/neavo/LinguaGacha) 进行日中翻译 [Wiki - LinguaGacha_Sakura](https://github.com/neavo/OneClickLLAMA/wiki/LinguaGacha_Sakura)  `推荐` 👈👈
55 |   - 搭配 [LinguaGacha](https://github.com/neavo/LinguaGacha) 进行其他语言翻译 [Wiki - LinguaGacha](https://github.com/neavo/OneClickLLAMA/wiki/LinguaGacha)  `推荐` 👈👈
56 |   - 搭配 [KeywordGacha](https://github.com/neavo/KeywordGacha) 进行文本分析 [Wiki - KeywordGacha](https://github.com/neavo/OneClickLLAMA/wiki/KeywordGacha)  `推荐` 👈👈
57 |   - 搭配 [AiNiee](https://github.com/NEKOparapa/AiNiee) 进行日中翻译 [Wiki - AiNiee_Sakura](https://github.com/neavo/OneClickLLAMA/wiki/AiNiee_Sakura)
58 |   - 搭配 [轻小说翻译机器人（绿站）](https://books.fishhawk.top/) 进行日中翻译 [Wiki - AutoNovel_Sakura](https://github.com/neavo/OneClickLLAMA/wiki/AutoNovel_Sakura)
59 | 
60 | ## 常见问题
61 | - 什么是 `爆显存`，会导致什么问题？
62 |   - 系统需求的显存超过了显卡实际的物理显存大小，称之为 `爆显存`
63 |   - `爆显存` 时，翻译的速度和结果都会出现异常，基本丧失可用性，所以要避免这种情况
64 |     
65 | - 如何判断是否 `爆显存`
66 |   - 如果爆的比较厉害，程序会直接报错或者退出
67 |   - 爆了一点又没有完全爆比较难判断
68 |   - 一个可参考的方式是通过第三方软件监测显卡功耗
69 |   - 满载执行任务时，显卡实际功耗应为最大功耗的 `70%-80%` 或者更高
70 |   - 如果显存接近用完，但是显卡实际功耗很低，则大概率是爆显存了
71 | 
72 | - 如何避免 `爆显存`
73 |   - 在模型启动后，模型占用的显存大小是固定的，不会变化，但是系统中的其他应用也会占用显存
74 |   - 本项目中的脚本都预留了一定的冗余空间，但如果开启过多应用，依然可能导致显存消耗完
75 |   - 所以在使用时，应尽量减少开启其他消耗显存的应用
76 |   - 比如 `浏览器`、`动态壁纸`、`视频播放器` 或 `QQNT`、`VSCODE` 等基于浏览器内核的应用
77 | 


--------------------------------------------------------------------------------