chuan/WebAI2API

Fork 0

mirror of https://github.com/foxhui/WebAI2API.git synced 2026-06-16 21:03:59 +08:00

Files

T

foxhui c410f08101 docs: 改进文档

2025-11-28 22:49:17 +08:00

12 KiB

Raw Permalink Blame History

LMArenaImagenAutomator

📝 项目简介

LMArenaImagenAutomator 是一个基于 Puppeteer 的自动化图像生成工具，通过模拟人类操作与 LMArena、Gemini Enterprise 网站交互，提供图像生成服务。(未来可能支持更多支持免费生图的网站)

项目支持两种运行模式：

OpenAI 兼容模式：提供标准的 OpenAI API 接口，便于集成到现有应用
Queue 队列模式：使用 Server-Sent Events (SSE) 实时推送生成状态

✨ 主要特性

💁‍♂️ 拟人操作：模拟人类鼠标移动轨迹和抖动
🤖 智能输入：模拟人类打字速度和错误纠正行为
🖼️ 多图支持：最多支持同时上传 10 张参考图片
📊 队列管理：智能任务队列，防止请求过载
🌐 代理支持：支持 HTTP 和 SOCKS5 代理配置
🎭 特征伪装：尽量伪装成真人操作的浏览器

🚀 快速开始

系统要求

Node.js: 16.0 或更高版本
操作系统: Windows、Linux 或 macOS
浏览器: Google Chrome (推荐) 或 Chromium

安装步骤

克隆项目 或下载解压项目文件
安装依赖
```
pnpm install
```
生成配置文件 首次运行会自动生成配置文件，也可以手动复制模板
```
cp config.example.yaml config.yaml
```

启动程序

# 标准模式
npm start

# 登录模式 (用于手动登录，该模式会自动禁用自动程序和无头模式)
# 如 Google 账号登录时出现浏览器不安全的提示可切换该模式登录后再使用默认模式启动
npm start -- -login

# 测试模式
npm test (-- -login)

📖 使用方法

⚠️ 首次使用重要指引

1. 启动与登录

关闭无头模式：首次启动务必关闭无头模式。推荐使用 登录模式。（Linux 命令行用户请参阅文档结尾）
手动登录：网页加载完毕后，请手动完成账号登录，避免后续流程中断。

2. 验证流程

触发验证：在输入框输入任意内容并发送，触发服务条款及 CloudFlare Turnstile 验证。
完成验证：点击验证码并通过（可能包含 reCAPTCHA），同意条款后再次点击发送确保流程通畅。

3. 运行建议

模式选择：完成上述初始化后，可切换至无头模式运行。
最佳实践：为降低风控概率，强烈建议保持非无头模式（有界面）运行。

接口使用说明

1. OpenAI 兼容模式

Warning

由于模拟真实浏览器操作，每次只能处理一个任务，其余任务将进入队列等待。为避免客户端超时影响体验，若当前任务数已达3个，后续请求将直接返回错误。因此，强烈推荐使用队列模式（queue），该模式下服务器会向客户端发送心跳包以确保连接持续活跃。

请求端点

POST http://127.0.0.1:3000/v1/chat/completions

📄 查看API请求示例

请求示例

curl -X POST http://127.0.0.1:3000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-secret-key" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "messages": [
      {
        "type": "text",
        "text": "generate a cat"
      }
    ]
  }'

响应格式

{
  "id": "chatcmpl-1732374740123",
  "object": "chat.completion",
  "created": 1732374740,
  "model": "lmarena-image",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "![generated](data:image/jpeg;base64,/9j/4AAQ...)"
    },
    "finish_reason": "stop"
  }]
}

关于 model 参数：

必填：必须填写支持的模型名称，否则将使用 LMArena 网页默认模型

查看可用模型：

方式 1：访问 /v1/models 接口查询

方式 2：直接查看 lib/backend/models.js 文件

示例模型：gemini-3-pro-image-preview、seedream-4-high-res-fal、dall-e-3 等

2. Queue 队列模式 (SSE) (推荐)

请求端点

POST http://127.0.0.1:3000/v1/queue/join

SSE 事件类型

事件类型	数据格式	说明
`status`	`{status: "queued", position: 1}`	任务已入队
`status`	`{status: "processing"}`	开始处理
`result`	`{status: "completed", image: "base64..."}`	生成成功
`result`	`{status: "error", msg: "错误信息"}`	生成失败
`heartbeat`	时间戳	保持连接
`done`	`"[DONE]"`	流结束

📄 查看 Node.js 示例代码

import http from 'http';

const options = {
  hostname: '127.0.0.1',
  port: 3000,
  path: '/v1/queue/join',
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer your-secret-key'
  }
};

const req = http.request(options, (res) => {
  res.on('data', (chunk) => {
    const lines = chunk.toString().split('\n');
    for (const line of lines) {
      if (line.startsWith('event: ')) {
        const event = line.substring(7).trim();
        console.log('事件类型:', event);
      } else if (line.startsWith('data: ')) {
        const data = JSON.parse(line.substring(6));
        console.log('数据:', data);
      }
    }
  });
});

req.write(JSON.stringify({
  model: "gemini-3-pro-image-preview",
  messages: [{ role: "user", content: "a cute cat" }]
}));
req.end();

提示：Queue 模式同样支持 model 参数，用法与 OpenAI 兼容模式一致。

3. 获取可用模型列表

请求端点

GET http://127.0.0.1:3000/v1/models

📄 查看API请求示例

请求示例

curl -X GET http://127.0.0.1:3000/v1/models \
  -H "Authorization: Bearer your-secret-key"

响应格式

{
  "object": "list",
  "data": [
    {
      "id": "seedream-4-high-res-fal",
      "object": "model",
      "created": 1732456789,
      "owned_by": "lmarena"
    },
    {
      "id": "gemini-3-pro-image-preview",
      "object": "model",
      "created": 1732456789,
      "owned_by": "lmarena"
    }
  ]
}

说明：

此接口在 OpenAI 兼容模式 和 Queue 队列模式 下均可用

created 字段为当前请求时的时间戳

完整模型列表可在 lib/backend/models.js 文件中查看

4. 带图片的请求说明

支持格式：PNG、JPEG、GIF、WebP
最大数量：5 张图片
数据格式：Base64 编码

📄 查看API请求示例

请求示例

{
  "model": "gemini-3-pro-image-preview",
  "messages": [{
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": "make it more colorful"
      },
      {
        "type": "image_url",
        "image_url": {
          "url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAA..."
        }
      }
    ]
  }]
}

🔧 常见问题

❌ 浏览器启动失败

问题: Error: Failed to launch the browser process

解决方案:

确保已安装 Chrome 或 Chromium
- 大陆地区设备可能因网络原因 Puppeteer 自动安装失败
- 可尝试手动安装后填写 chrome.path (Linux 可使用 which 指令检索路径)
检查 config.yaml 中的 chrome.path 是否正确
尝试删除 data 目录后重新运行

❌ GPU 相关错误

问题: 无显卡服务器运行时出现 GPU 错误

解决方案:

该报错并不会影响程序运行，但是强烈建议在无显卡的设备上关闭GPU加速
修改 config.yaml 中的chrome.gpu为false

❌ 请求被拒绝 (429 Too Many Requests)

问题: 并发请求过多

解决方案:

该问题仅存在于OpenAI兼容模式
队列限制：1 个并发 + 2 个排队 (总计 3 个)
修改 config.yaml 中的queue.maxQueueSize (不建议)
等待当前任务完成后再提交新任务

❌ reCAPTCHA 验证失败

问题: 返回 recaptcha validation failed

解决方案:

这是 LMArena 的人机验证机制
建议：
- 降低请求频率
- 首次使用时手动完成一次验证 (关闭 headless 模式)
- 使用稳定和纯净的 IP 地址 (可使用 ping0.cc 查询IP地址纯净度)

❌ 图像生成超时

问题: 任务超过 120 秒未完成

解决方案:

检查网络连接是否稳定
某些复杂提示词可能需要更长时间

🐧 【Linux 环境下非无头模式运行】

问题: 需要在 Linux 服务器上显示浏览器界面（如手动过验证码）

解决方案:

方法一：X11 转发

推荐使用 WindTerm 等终端工具，开启 X-Server 功能
在 SSH 会话设置中启用 X11 转发 (Forward X11)

方法二：Xvfb + X11VNC (推荐) 使用虚拟显示器运行程序，并通过 VNC 远程查看。

启动虚拟显示器并运行程序 (屏幕号 99 可按需修改):

xvfb-run --server-num=99 --server-args="-ac -screen 0 1280x720x24" npm start

将虚拟显示器映射至 VNC:

x11vnc -display :99 -localhost -nopw -once -noxdamage -ncache 10 -forever

建立 SSH 隧道连接 VNC (安全推荐):

# 在本地终端运行，将服务器 5900 端口映射到本地
ssh -L 5900:127.0.0.1:5900 root@服务器IP

随后使用 VNC 客户端连接 127.0.0.1:5900 即可。

🎭 【浏览器特征伪装】

问题: 如何优化浏览器特征伪装，减少验证码弹出频率？

欢迎了解相关内容的前辈基于改进建议

浏览器指纹伪装状态:

Windows 10 (官方 Chrome):
- 针对 Windows 10 原生 Chrome 环境优化指纹，已在 antibot 和 CreepJS 测试中无红色高危警告
Linux 环境:
- ⚠️ 未完全通过 CreepJS 测试，但实际使用中影响较小，检测严格程度可能低于测试工具。

进一步优化建议:

完成后，可有效缓解验证码的弹出频率。

1. 使用官方 Chrome（推荐）

不推荐使用 Chromium，因为它缺少 MP4/H.264 解码器等插件，且被大量爬虫使用，会成为明显特征。

# 从 Google 官方下载 Chrome DEB安装包
# 大陆服务器可手动下载安装包 https://www.google.com/chrome/?platform=linux
curl -LO https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
apt install ./google-chrome-stable_current_amd64.deb -y

配置方式:

修改 config.yaml，可使用which google-chrome指令查询路径

chrome:
  path: "/usr/bin/google-chrome"

使用环境变量可跳过 Puppeteer 自动下载 Chromium

export PUPPETEER_SKIP_CHROMIUM_DOWNLOAD="true"

2. 优化字体指纹

Linux 服务器通常只安装了极少量字体（甚至没有中文），这会增加指纹特征。

安装常用字体:

# 安装中文字体（必备，否则中文提示词将显示方框）
sudo apt install fonts-wqy-zenhei fonts-wqy-microhei

# 安装微软核心字体（减少字体指纹差异）
sudo apt install ttf-mscorefonts-installer

📊 设备配置

资源	最低配置	推荐配置
CPU	1核	2核及以上
内存	1GB	2GB 及以上

经测试，本项目可在以下环境中稳定运行：

Oracle 免费机：1C1G 配置，基于 Debian 12 系统。
阿里云轻量应用服务器：2C2G 配置，基于 Debian 11 系统。

📄 许可证和免责声明

本项目采用 MIT License 开源。

免责声明: 本项目仅供学习交流使用。如果因使用该项目造成的任何后果（包括但不仅限于账号被禁用），作者和该项目均不承担任何责任。请遵守相关网站和服务的使用条款，以及相关数据的备份工作。

📋 更新日志

查看完整的版本历史和更新内容，请访问 CHANGELOG.md。

感谢 LMArena 提供图像生成服务！ 🎉

12 KiB Raw Permalink Blame History Unescape Escape

LMArenaImagenAutomator

📝 项目简介

✨ 主要特性

🚀 快速开始

系统要求

安装步骤

📖 使用方法

⚠️ 首次使用重要指引

1. 启动与登录

2. 验证流程

3. 运行建议

接口使用说明

1. OpenAI 兼容模式

2. Queue 队列模式 (SSE) (推荐)

3. 获取可用模型列表

4. 带图片的请求说明

🔧 常见问题

📊 设备配置

📄 许可证和免责声明

📋 更新日志

12 KiB

Raw Permalink Blame History