采集管理后台

请输入管理密码

仪表盘

累计采集
-
今日采集
-
最后运行
-
运行状态
-

近 7 天采集趋势

来源统计

最近采集

标题 来源 分类 状态 时间

广告过滤关键词

包含这些关键词的文件名将被删除

广告文件扩展名

这些扩展名的文件将被删除

分类映射

调度设置

百度网盘设置

主站连接

使用说明

1. 首次配置

在服务器上编辑 collector/.env 文件,填入以下信息:

# 168sou 登录账号
SOU_EMAIL=你的邮箱
SOU_PASSWORD=你的密码

# 百度网盘账号
BAIDU_USERNAME=你的百度账号
BAIDU_PASSWORD=你的百度密码

# 主站 API
SITE_API_URL=http://bxbxb.cn/api/collector.php
SITE_API_TOKEN=hc_collector_2026_secure_token

# 管理后台密码
ADMIN_PASSWORD=admin123

# 浏览器模式(首次测试填 false,确认后改 true)
BROWSER_HEADLESS=false

2. 启动采集器

# 安装依赖
cd /www/wwwroot/collector
npm install

# 安装浏览器
npx playwright install chromium

# 启动(含管理后台)
node index.js

# 后台运行
pm2 start index.js --name collector

3. 管理后台访问

浏览器打开 http://你的服务器IP:3000

默认密码:admin123(在 .env 中修改 ADMIN_PASSWORD)

4. 采集流程

  1. 登录 168sou(Cookie 自动保存,过期自动重登)
  2. 遍历中创网/冒泡网/福缘网分类列表
  3. 逐篇采集标题、封面、正文、网盘链接
  4. 百度网盘转存 → 删广告 → 插广告 → 生成新链接
  5. 通过 API 推送到主站,自动入库展示

5. 主站需要的改动(仅一次)

主站只需要 2 个改动:

  • 上传 api/collector.php 文件(接收采集数据)
  • 数据库执行 SQL:ALTER TABLE resources ADD COLUMN source_url VARCHAR(500), ADD COLUMN source_site VARCHAR(50);

6. 常用命令

pm2 status              # 查看状态
pm2 logs collector      # 查看日志
pm2 restart collector   # 重启
pm2 stop collector      # 停止
node index.js --once    # 跑一次
node index.js --dry-run # 只采集不发布

7. 注意事项

  • 首次运行建议 BROWSER_HEADLESS=false,方便观察和输验证码
  • 采集器完全独立运行,不影响主站
  • 采集数据通过 API 推送,主站只需一个接口文件
  • 管理后台端口 3000,可在 .env 中修改 ADMIN_PORT