项目作者: PerrorOne

项目描述 :
SpiderMan Based on Scrapy, scrapyd, scrapy-API, tornado spider distributed management framework.
高级语言: Python
项目地址: git://github.com/PerrorOne/SpiderMan.git
创建时间: 2018-03-17T06:07:22Z
项目社区:https://github.com/PerrorOne/SpiderMan

开源协议:Apache License 2.0

下载


SpiderMan

本库已经放弃维护, 您可以尝试功能更加齐全的管理系统:
https://github.com/crawlab-team/crawlab

English | 中文

目录

声明

SpiderManWeb 页面使用了大量 百度图片的无标注版权图片, 如有涉嫌侵权请联系我!

背景介绍

SpiderMan 基于Scrapy、scrapyd、Scrapyd_API、tornado 爬虫分布式管理框架。

SpiderMan功能包括爬虫调度,Web端的代码编辑器和新建Scrapy项目等。

项目介绍

SpiderMan 的设计初衷是给大家提供一个便捷的分布式爬虫管理框架

SpiderMan 是基于scrapyd api 来开发, 不会对现有爬虫代码做任何的侵入

SpiderMan 嵌入了web编辑器这样一来就可以在web页面中编写代码,发布代码,部署新的爬虫项目至指定服务器

SpiderMan 目前仅仅利用tornado.ioloop.PeriodicCallback 来完成定时任务, 对各个服务器上单个爬虫进行定时调度

使用说明

获取代码

使用实例

界面

  • 首页 由于首页我实在是不知道到底应该放一些什么东西, 但是如果没有首页的话,总是感觉觉怪怪的!
    Shurnim icon
  • 服务器 主要是用于对scrapyd 服务器的管理包括了: 添加新的服务器、调度服务器指定的蜘蛛、删除指定服务器的项目
  • 项目 新建本地项目部署至指定服务器, 该页面包含了: 添加新的项目, 删除项目, 编辑项目代码, 部署项目

界面样式

  • 首页
    Shurnim icon
  • 服务器
    Shurnim icon
  • 项目
    Shurnim icon
  • 还有一些子页面…..

部署

  1. 克隆项目至本地
  2. git clone https://github.com/PerrorOne/SpiderMan.git
  3. cd SpiderMan
  4. python setup.py install
  5. # 初始化项目
  6. SpiderMan init
  7. # 创建管理员账号
  8. SpiderMan admin
  9. #=================使用docker部署======================
  10. git clone https://github.com/PerrorOne/SpiderMan.git
  11. cd SpiderMan
  12. docker build -t spiderman:v1 .
  13. # 进入系统创建admin用户
  14. docker run -it -p 8080:8080 spiderman:v1 /bin/bash
  15. # sh
  16. /root/anaconda3/envs/spderman/bin/SpiderMan init
  17. # 启动
  18. docker run -d -p 8080:8659 spiderman:v1
  19. # 支持从环境变量中读取配置
  20. --env MYSQL_PORT=3306
  21. --env MYSQL_HOST=127.0.0.1
  22. --env MYSQL_USER=root
  23. --env MYSQL_PASS=99999
  24. --env ADMIN_USER=perror // 创建管理员
  25. --env ADMIN_PASS=123456 // 管理员密码
  26. --env CMD=1 // 由于某些原因这个参数是必需的
  27. # 示例:
  28. docker run -d -p 8080:8659 --env MYSQL_PORT=3306 --env MYSQL_HOST=127.0.0.1 \
  29. --env MYSQL_USER=root --env MYSQL_PASS=99999 --env ADMIN_USER=perror \
  30. --env ADMIN_PASS=123456 --env CMD=1 spiderman:v1
  31. # 浏览器中输入:127.0.0.1:8080

其他

由于本人编程水平有限并且只有我一个人在开发,

页面没有实现国际化, 定时任务程序过于简单,等等…

如果各位朋友有更好的想法、更好的实现或是发现bug.欢迎fork修改!

最后祝各位生活愉快!
Shurnim icon