chuan/WebAI2API

Fork 0

mirror of https://github.com/foxhui/WebAI2API.git synced 2026-06-16 21:03:59 +08:00

Files

T

foxhui 55377de092 docs: update project documentation in README.md

2025-11-24 02:08:54 +08:00

10 KiB

Raw Blame History

LMArenaImagenAutomator - 使用文档

📝 项目简介

LMArenaImagenAutomator 是一个基于 Puppeteer 的自动化图像生成工具，通过模拟人类操作与 LMArena 网站交互，提供图像生成服务。

项目支持两种运行模式：

OpenAI 兼容模式：提供标准的 OpenAI API 接口，便于集成到现有应用
Queue 队列模式：使用 Server-Sent Events (SSE) 实时推送生成状态

✨ 主要特性

🎭 拟人化操作：使用贝塞尔曲线模拟真实鼠标移动轨迹
🤖 智能输入：模拟人类打字速度和错误纠正行为
🖼️ 多图支持：最多支持同时上传 5 张参考图片
🔐 安全认证：基于 Bearer Token 的 API 鉴权
📊 队列管理：智能任务队列，防止请求过载
🌐 代理支持：支持 HTTP 和 SOCKS5 代理配置

🚀 快速开始

系统要求

Node.js: 16.0 或更高版本
操作系统: Windows、Linux 或 macOS
浏览器: Google Chrome 或 Chromium (可选，Puppeteer 会自动下载)

安装步骤

克隆项目（如果从仓库获取）或解压项目文件
安装依赖
```
pnpm install
```
生成 API 密钥
```
npm run genkey
```
此命令会生成一个安全的随机密钥，请保存并配置到 config.yaml 中。

⚙️ 配置说明

config.yaml 配置文件

配置文件位于项目根目录下的 config.yaml，包含以下主要配置项：

服务器配置

server:
  # 运行模式: 'openai' (OpenAI 兼容) 或 'queue' (SSE 队列)
  type: queue
  # 监听端口
  port: 3000
  # API 鉴权密钥 (使用 npm run genkey 生成)
  auth: sk-change-me-to-your-secure-key

浏览器配置

chrome:
  # Chrome 可执行文件路径 (留空使用 Puppeteer 内置版本)
  # Windows 示例: "C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe"
  # Linux 示例: "/usr/bin/chromium"
  path: ""
  
  # 是否启用无头模式 (true = 后台运行，false = 显示浏览器)
  headless: false
  
  # 是否启用 GPU 加速 (无显卡服务器设为 false)
  gpu: false

代理配置

chrome:
  proxy:
    # 是否启用代理
    enable: false
    # 代理类型: 'http' 或 'socks5'
    type: http
    # 代理服务器地址
    host: 127.0.0.1
    # 代理端口
    port: 7890
    # 代理认证 (可选)
    # user: username
    # passwd: password

重要配置建议

配置项	建议值	说明
`server.type`	`queue`	使用队列模式可获得实时状态反馈
`server.auth`	强密钥	务必修改默认值，使用 `npm run genkey` 生成
`chrome.headless`	`false` / `true`	建议保持非无头模式（true已映射为new模式）
`chrome.gpu`	`false` / `true`	无显卡环境强烈建议关闭

📖 使用方法

首次使用重要指引

1. 首次启动与登录

关闭无头模式：第一次启动程序时，请务必关闭无头模式。（Linux无界面用户请参阅文档结尾）
完成账号登录：等待网页加载完毕后，请手动登录您的账号，以避免后续使用中弹出登录界面。

2. 验证流程

触发验证：在输入框中输入任意内容并发送，等待服务条款和CloudFlare Turnstile验证码弹出。
通过验证：点击验证码并同意服务条款，然后再次点击发送。此过程可能会弹出reCAPTCHA验证码，请一并完成。

3. 后续运行建议

模式选择：完成上述步骤后，您可以选择切换为无头模式运行。
推荐模式：为减少触发人机验证的频率，建议仍保持非无头模式运行。

方式一：使用 HTTP API

启动服务器

npm start

OpenAI 兼容模式

Warning

由于模拟真实浏览器操作，每次只能处理一个任务，其余任务将进入队列等待。为避免客户端超时影响体验，若当前任务数已达3个，后续请求将直接返回错误。因此，强烈推荐使用队列模式（queue），该模式下服务器会向客户端发送心跳包以确保连接持续活跃。

配置文件设置

server:
  type: openai
  port: 3000
  auth: your-secret-key

API 请求示例

curl -X POST http://127.0.0.1:3000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-secret-key" \
  -d '{
    "messages": [
      {
        "type": "text",
        "text": "generate a cat"
      }
    ]
  }'

响应格式

{
  "id": "chatcmpl-1732374740123",
  "object": "chat.completion",
  "created": 1732374740,
  "model": "lmarena-image",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "![generated](data:image/jpeg;base64,/9j/4AAQ...)"
    },
    "finish_reason": "stop"
  }]
}

Queue 队列模式（SSE）（推荐）

配置文件设置

server:
  type: queue

请求端点

POST http://127.0.0.1:3000/v1/queue/join

SSE 事件类型

事件类型	数据格式	说明
`status`	`{status: "queued", position: 1}`	任务已入队
`status`	`{status: "processing"}`	开始处理
`result`	`{status: "completed", image: "base64..."}`	生成成功
`result`	`{status: "error", msg: "错误信息"}`	生成失败
`heartbeat`	时间戳	保持连接
`done`	`"[DONE]"`	流结束

Node.js 示例代码

import http from 'http';

const options = {
  hostname: '127.0.0.1',
  port: 3000,
  path: '/v1/queue/join',
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer your-secret-key'
  }
};

const req = http.request(options, (res) => {
  res.on('data', (chunk) => {
    const lines = chunk.toString().split('\n');
    for (const line of lines) {
      if (line.startsWith('event: ')) {
        const event = line.substring(7).trim();
        console.log('事件类型:', event);
      } else if (line.startsWith('data: ')) {
        const data = JSON.parse(line.substring(6));
        console.log('数据:', data);
      }
    }
  });
});

req.write(JSON.stringify({
  messages: [{ role: "user", content: "a cute cat" }]
}));
req.end();

带图片的请求

支持格式：PNG、JPEG、GIF、WebP
最大数量：5 张图片
数据格式：Base64 编码

请求示例

{
  "messages": [{
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": "make it more colorful"
      },
      {
        "type": "image_url",
        "image_url": {
          "url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAA..."
        }
      }
    ]
  }]
}

方式二：使用CLI客户端脚本

启动CLI工具

npm test

根据指引填写图片路径和提示词即可

📁 项目结构

lmarena/
├── server.js          # HTTP 服务器 (主入口)
├── config.yaml        # 配置文件
├── package.json       # 项目依赖
├── lib/
│   ├── lmarena.js     # 核心生图逻辑 (Puppeteer 操作)
│   ├── config.js      # 配置加载器
│   ├── genApiKey.js   # API 密钥生成工具
│   └── test.js        # 功能测试脚本
└── data/
    ├── chromeUserData/  # Chrome 用户数据 (自动创建)
    └── temp/            # 临时图片存储

🔧 常见问题

浏览器启动失败

问题: Error: Failed to launch the browser process

解决方案:

确保已安装 Chrome 或 Chromium
- 大陆地区设备可能因网络原因 Puppeteer 自动安装失败
- 可尝试手动安装后填写 chrome.path (Linux 可使用 which 指令检索路径)
检查 config.yaml 中的 chrome.path 是否正确
尝试删除 data/chromeUserData 目录后重新运行

GPU 相关错误

问题: 无显卡服务器运行时出现 GPU 错误

解决方案:

该报错并不会影响程序运行，但是强烈建议在无显卡的设备上关闭GPU加速

chrome:
  gpu: false  # 禁用 GPU 加速

请求被拒绝 (429 Too Many Requests)

问题: 并发请求过多

解决方案:

该问题仅存在于OpenAI兼容模式
当前限制：1 个并发 + 2 个排队 (总计 3 个)
修改 server.js 中的 MAX_CONCURRENT 和 MAX_QUEUE_SIZE (不建议，应为大多数客户端HTTP请求是有超时时间的)
等待当前任务完成后再提交新任务

reCAPTCHA 验证失败

问题: 返回 recaptcha validation failed

解决方案:

这是 LMArena 的人机验证机制
建议：
- 降低请求频率
- 首次使用时手动完成一次验证 (关闭 headless 模式)
- 使用稳定和纯净的 IP 地址 (可使用 ping0.cc 查询IP地址纯净度)

图像生成超时

问题: 任务超过 120 秒未完成

解决方案:

检查网络连接是否稳定
某些复杂提示词可能需要更长时间

Linux 环境下非无头模式运行

问题: 需要在 Linux 服务器上显示浏览器界面（如手动过验证码）

解决方案:

方法一：X11 转发 (轻量级)

推荐使用 WindTerm 等终端工具，开启 X-Server 功能
在 SSH 会话设置中启用 X11 转发 (Forward X11)

方法二：Xvfb + X11VNC (推荐) 使用虚拟显示器运行程序，并通过 VNC 远程查看。

启动虚拟显示器并运行程序 (屏幕号 99 可按需修改):

xvfb-run --server-num=99 --server-args="-ac -screen 0 1280x720x16" npm start

将虚拟显示器映射至 VNC:

x11vnc -display :99 -localhost -nopw -once -noxdamage -ncache 10

建立 SSH 隧道连接 VNC (安全推荐):

# 在本地终端运行，将服务器 5900 端口映射到本地
ssh -L 5900:127.0.0.1:5900 root@服务器IP

随后使用 VNC 客户端连接 127.0.0.1:5900 即可。

📊 设备配置

资源	最低配置	推荐配置
CPU	1核	2核及以上
内存	1GB	2GB 及以上

经测试，本项目可在以下环境中稳定运行：

Oracle 免费机：1C1G 配置，基于 Debian 系统。
阿里云轻量应用服务器：2C2G 配置，基于 Debian 系统。

📄 许可证

本项目采用 MIT License 开源。

注意: 本项目仅供学习和研究使用，请遵守 LMArena.ai 的使用条款。

感谢使用 LMArena 图像生成服务！ 🎉

10 KiB Raw Blame History Unescape Escape

LMArenaImagenAutomator - 使用文档

📝 项目简介

✨ 主要特性

🚀 快速开始

系统要求

安装步骤

⚙️ 配置说明

config.yaml 配置文件

服务器配置

浏览器配置

代理配置

重要配置建议

📖 使用方法

首次使用重要指引

1. 首次启动与登录

2. 验证流程

3. 后续运行建议

方式一：使用 HTTP API

OpenAI 兼容模式

Queue 队列模式（SSE）（推荐）

带图片的请求

方式二：使用CLI客户端脚本

📁 项目结构

🔧 常见问题

浏览器启动失败

GPU 相关错误

请求被拒绝 (429 Too Many Requests)

reCAPTCHA 验证失败

图像生成超时

Linux 环境下非无头模式运行

📊 设备配置

📄 许可证

10 KiB

Raw Blame History