采集管理后台

使用说明

1. 首次配置

在服务器上编辑 collector/.env 文件，填入以下信息：

# 168sou 登录账号
SOU_EMAIL=你的邮箱
SOU_PASSWORD=你的密码

# 百度网盘账号
BAIDU_USERNAME=你的百度账号
BAIDU_PASSWORD=你的百度密码

# 主站 API
SITE_API_URL=http://bxbxb.cn/api/collector.php
SITE_API_TOKEN=hc_collector_2026_secure_token

# 管理后台密码
ADMIN_PASSWORD=admin123

# 浏览器模式（首次测试填 false，确认后改 true）
BROWSER_HEADLESS=false

2. 启动采集器

# 安装依赖
cd /www/wwwroot/collector
npm install

# 安装浏览器
npx playwright install chromium

# 启动（含管理后台）
node index.js

# 后台运行
pm2 start index.js --name collector

3. 管理后台访问

浏览器打开 http://你的服务器IP:3000

默认密码：admin123（在 .env 中修改 ADMIN_PASSWORD）

4. 采集流程

登录 168sou（Cookie 自动保存，过期自动重登）
遍历中创网/冒泡网/福缘网分类列表
逐篇采集标题、封面、正文、网盘链接
百度网盘转存 → 删广告 → 插广告 → 生成新链接
通过 API 推送到主站，自动入库展示

5. 主站需要的改动（仅一次）

主站只需要 2 个改动：

上传 api/collector.php 文件（接收采集数据）
数据库执行 SQL：ALTER TABLE resources ADD COLUMN source_url VARCHAR(500), ADD COLUMN source_site VARCHAR(50);

6. 常用命令

pm2 status              # 查看状态
pm2 logs collector      # 查看日志
pm2 restart collector   # 重启
pm2 stop collector      # 停止
node index.js --once    # 跑一次
node index.js --dry-run # 只采集不发布

7. 注意事项

首次运行建议 BROWSER_HEADLESS=false，方便观察和输验证码
采集器完全独立运行，不影响主站
采集数据通过 API 推送，主站只需一个接口文件
管理后台端口 3000，可在 .env 中修改 ADMIN_PORT

仪表盘

近 7 天采集趋势

来源统计

最近采集

广告过滤关键词

广告文件扩展名

分类映射

调度设置

百度网盘设置

主站连接

使用说明

1. 首次配置

2. 启动采集器

3. 管理后台访问

4. 采集流程

5. 主站需要的改动（仅一次）

6. 常用命令

7. 注意事项