仪表盘
累计采集
-
今日采集
-
最后运行
-
运行状态
-
近 7 天采集趋势
来源统计
最近采集
| 标题 | 来源 | 分类 | 状态 | 时间 |
|---|
广告过滤关键词
包含这些关键词的文件名将被删除
广告文件扩展名
这些扩展名的文件将被删除
分类映射
调度设置
时
时
百度网盘设置
主站连接
使用说明
1. 首次配置
在服务器上编辑 collector/.env 文件,填入以下信息:
# 168sou 登录账号 SOU_EMAIL=你的邮箱 SOU_PASSWORD=你的密码 # 百度网盘账号 BAIDU_USERNAME=你的百度账号 BAIDU_PASSWORD=你的百度密码 # 主站 API SITE_API_URL=http://bxbxb.cn/api/collector.php SITE_API_TOKEN=hc_collector_2026_secure_token # 管理后台密码 ADMIN_PASSWORD=admin123 # 浏览器模式(首次测试填 false,确认后改 true) BROWSER_HEADLESS=false
2. 启动采集器
# 安装依赖 cd /www/wwwroot/collector npm install # 安装浏览器 npx playwright install chromium # 启动(含管理后台) node index.js # 后台运行 pm2 start index.js --name collector
3. 管理后台访问
浏览器打开 http://你的服务器IP:3000
默认密码:admin123(在 .env 中修改 ADMIN_PASSWORD)
4. 采集流程
- 登录 168sou(Cookie 自动保存,过期自动重登)
- 遍历中创网/冒泡网/福缘网分类列表
- 逐篇采集标题、封面、正文、网盘链接
- 百度网盘转存 → 删广告 → 插广告 → 生成新链接
- 通过 API 推送到主站,自动入库展示
5. 主站需要的改动(仅一次)
主站只需要 2 个改动:
- 上传
api/collector.php文件(接收采集数据) - 数据库执行 SQL:
ALTER TABLE resources ADD COLUMN source_url VARCHAR(500), ADD COLUMN source_site VARCHAR(50);
6. 常用命令
pm2 status # 查看状态 pm2 logs collector # 查看日志 pm2 restart collector # 重启 pm2 stop collector # 停止 node index.js --once # 跑一次 node index.js --dry-run # 只采集不发布
7. 注意事项
- 首次运行建议
BROWSER_HEADLESS=false,方便观察和输验证码 - 采集器完全独立运行,不影响主站
- 采集数据通过 API 推送,主站只需一个接口文件
- 管理后台端口 3000,可在 .env 中修改 ADMIN_PORT