LMArenaImagenAutomator

📝 项目简介

LMArenaImagenAutomator 是一个基于 Playwright + Camoufox 的自动化图像生成工具,通过模拟人类操作与 LMArena、Gemini 等网站交互提供图像生成服务到OpenAI格式的接口。(未来可能支持更多支持免费生图的网站)

当前支持的网站:

  • LMArena
  • Gemini Enterprise Business
  • Nano Banana Free

主要特性

  • 💁‍♂️ 拟人操作:模拟人类鼠标移动轨迹和抖动行为
  • 🤖 智能输入:模拟人类打字速度和错误纠正行为
  • 🖼️ 多图支持:最多支持同时上传 10 张参考图片
  • 📊 队列管理:支持任务队列,防止请求过载或超时
  • 🌐 代理支持:支持 HTTP 和 SOCKS5 代理配置
  • 🎭 特征伪装:尽量伪装成非自动程序控制的浏览器
  • 🔗 流式保活:复用标准接口的流式模式发送心跳包

Image


🚀 快速开始

系统要求

  • Node.js: 20.0.0 或更高版本 (ABI 115+)
  • 操作系统: Windows、Linux 或 MacOS
  • 浏览器: Camoufox (经过反检测处理的FireFox浏览器)

开发环境参考

  • Node.js v22.20.0 ( Windows 10 )
  • Node.js v20.19.0 ( Debian 12 )

安装步骤

  1. 克隆项目 或下载解压项目文件

  2. 配置文件 复制配置文件模板进行配置文件的修改

    cp config.example.yaml config.yaml
    
  3. 安装依赖

    # 安装 NPM 基本依赖
    pnpm install
    
    # 安装所需额外依赖
    # 自动下载安装所需的浏览器和NPM预编译文件
    # 若网络无法连接 GitHub,请提前在配置文件中设置可用代理
    npm run init
    
  4. 启动程序

    # 标准模式
    npm start
    
    # 登录模式 (用于手动登录,该模式会自动禁用自动化和无头模式)
    npm start -- -login
    
  5. 测试程序 (可选) 用于快速测试服务器接口

    npm test
    

📖 使用方法

⚠️ 首次使用重要指引

1. 启动与登录

  • 关闭无头模式:首次启动务必关闭无头模式。推荐使用 登录模式。(Linux 命令行用户请参阅文档结尾)
  • 手动登录:网页加载完毕后,请手动完成账号登录。

2. 验证流程

  • 触发验证:在输入框输入任意内容并发送,触发服务条款及 CloudFlare Turnstile 验证。
  • 完成验证:点击验证码并通过(可能包含 reCAPTCHA),同意条款后再次点击发送确保流程通畅。

3. 运行建议

  • 模式选择:完成上述初始化后,可切换至无头模式运行。
  • 最佳实践:为降低风控概率,强烈建议保持非无头模式运行。

接口使用说明

1. OpenAI 兼容接口

Warning

由于模拟真实浏览器操作,每次只能处理一个任务,其余任务将进入队列等待。为避免客户端超时影响体验,若当前任务数已达3个,后续请求将直接返回错误。因此,强烈推荐开启流式保活,该模式下服务器会向客户端发送保活注释或者心跳包以确保连接持续活跃。

请求端点

POST http://127.0.0.1:3000/v1/chat/completions
📄 查看API请求示例

请求示例(非流式)

curl -X POST http://127.0.0.1:3000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-secret-key" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "generate a cat"
          }
      ]
      }
    ]
  }'

响应格式(非流式)

{
  "id": "chatcmpl-1732374740123",
  "object": "chat.completion",
  "created": 1732374740,
  "model": "gemini-3-pro-image-preview",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "![generated](data:image/jpeg;base64,/9j/4AAQ...)"
    },
    "finish_reason": "stop"
  }]
}

请求示例(流式 - 推荐)

curl -X POST http://127.0.0.1:3000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-secret-key" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "stream": true,
    "messages": [
      {
        "role": "user",
        "content": "generate a cat"
      }
    ]
  }'

响应格式(流式)

data: {"id":"chatcmpl-1732374740123","object":"chat.completion.chunk","created":1732374740,"model":"gemini-3-pro-image-preview","choices":[{"index":0,"delta":{"role":"assistant","content":""},"finish_reason":null}]}

: keep-alive
: keep-alive

data: {"id":"chatcmpl-1732374740123","object":"chat.completion.chunk","created":1732374740,"model":"gemini-3-pro-image-preview","choices":[{"index":0,"delta":{"content":"![generated](data:image/jpeg;base64,/9j/4AAQ...)"},"finish_reason":"stop"}]}

data: [DONE]

关于 model 参数

  • 必填:必须填写支持的模型名称,否则将使用目标网站的默认模型
  • 查看可用模型
    • 方式 1:访问 /v1/models 接口查询
    • 方式 2:直接查看 lib/backend/models.js 文件
  • 示例模型gemini-3-pro-image-previewseedream-4-high-res-faldall-e-3

关于流式保活的心跳模式

  • 主要分为两种方式,可自行在配置文档中根据所需切换
    • comment模式: 发送 :keepalive 注释。不污染数据,绝大多数 SDK 支持,不会影响接口标准
    • content模式: 在 choices[0].delta.content = "" 中发送空字符串(仅当你使用的客户端非常特殊,必须收到 data JSON 包才重置超时时使用)

2. 获取可用模型列表

请求端点

GET http://127.0.0.1:3000/v1/models
📄 查看API请求示例

请求示例

curl -X GET http://127.0.0.1:3000/v1/models \
  -H "Authorization: Bearer your-secret-key"

响应格式

{
  "object": "list",
  "data": [
    {
      "id": "seedream-4-high-res-fal",
      "object": "model",
      "created": 1732456789,
      "owned_by": "lmarena"
    },
    {
      "id": "gemini-3-pro-image-preview",
      "object": "model",
      "created": 1732456789,
      "owned_by": "lmarena"
    }
  ]
}

3. 带图片的请求说明

支持格式PNG、JPEG、GIF、WebP
最大数量5 张图片
数据格式Base64 编码

📄 查看API请求示例

请求示例

{
  "model": "gemini-3-pro-image-preview",
  "messages": [{
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": "make it more colorful"
      },
      {
        "type": "image_url",
        "image_url": {
          "url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAA..."
        }
      }
    ]
  }]
}

🔧 常见问题

请求被拒绝 (429 Too Many Requests)

问题: 并发请求过多

解决方案:

  • 该问题仅存在未开启流式保活时出现
  • 队列限制:1 个并发 + 2 个排队 (总计 3 个)
  • 修改 config.yaml 中的queue.maxQueueSize (不建议)
  • 等待当前任务完成后再提交新任务
reCAPTCHA 验证失败

问题: 返回 recaptcha validation failed

解决方案:

  • 这是 LMArena 的人机验证机制
  • 建议:
    • 降低请求频率
    • 首次使用时手动完成一次验证 (关闭 headless 模式)
    • 使用稳定和纯净的 IP 地址 (可使用 ping0.cc 查询IP地址纯净度)
图像生成超时

问题: 任务超过 120 秒未完成

解决方案:

  • 启用流式保活确保客户端不会主动断开连接
  • 检查网络连接是否稳定
  • 某些复杂提示词可能需要更长时间
🐧 【Linux 环境下非无头模式运行】

问题: 需要在 Linux 服务器上显示浏览器界面(如手动过验证码)

解决方案:

方法一:X11 转发

  • 推荐使用 WindTerm 等终端工具,开启 X-Server 功能
  • 在 SSH 会话设置中启用 X11 转发 (Forward X11)

方法二:Xvfb + X11VNC (推荐) 使用虚拟显示器运行程序,并通过 VNC 远程查看。

  1. 启动虚拟显示器并运行程序 (屏幕号 99 可按需修改):

    xvfb-run --server-num=99 --server-args="-ac -screen 0 1920x1080x24" npm start
    
  2. 将虚拟显示器映射至 VNC:

    x11vnc -display :99 -localhost -nopw -once -noxdamage -ncache 10 -forever
    
  3. 建立 SSH 隧道连接 VNC (安全推荐):

    # 在本地终端运行,将服务器 5900 端口映射到本地
    ssh -L 5900:127.0.0.1:5900 root@服务器IP
    

    随后使用 VNC 客户端连接 127.0.0.1:5900 即可。


📊 设备配置

资源 最低配置 推荐配置
CPU 1核 2核及以上
内存 1GB 2GB 及以上

经测试,本项目可在以下环境中运行:

  • Oracle 免费机(有些卡顿,勉强能用):1C1G 配置,基于 Debian 12 系统。
  • 阿里云轻量应用服务器(开发测试所用):2C2G 配置,基于 Debian 11 系统。

📄 许可证和免责声明

本项目采用 MIT License 开源。

免责声明: 本项目仅供学习交流使用。如果因使用该项目造成的任何后果(包括但不仅限于账号被禁用),作者和该项目均不承担任何责任。请遵守相关网站和服务的使用条款,以及相关数据的备份工作。


📋 更新日志

查看完整的版本历史和更新内容,请访问 CHANGELOG.md

迁移前的 Puppeteer 版本已在分支中保留,但不影响使用的情况下不会再进行更新和修复!


感谢 LMArena 、Gemini 等网站提供图像生成服务! 🎉

Languages
JavaScript 76.9%
Vue 23%
Dockerfile 0.1%