iHealth 项目的内容爬虫(一个基于 python 和 MongoDB 的医疗咨询爬虫)
iHealth 项目的内容爬虫
开启 MongoDB 权限认证:在配置文件中加入 auth = true
创建管理员用户(如果你是第一次使用 MongoDB)
use admindb.createUser({user:"admin",pwd:"admin123",roles:["userAdminAnyDatabase"]})
管理员用户用来创建其他数据库和用户
使用管理员账户远程登录
C:\Users\cs>mongo [your_ip]:27017> use adminswitched to db admin> db.auth('admin','admin123')1
创建 iHealth 数据库,以及操作该数据库的用户
use iHealth // 创建数据库,并作为认证数据库db.createUser({user:'admin', // 用户名pwd:'admin123', // 用户密码roles:[{role:'readWrite',db:'iHealth'}] // 为该用户赋予数据库的读写权限})
使用该用户远程登录 iHealth 数据库
C:\Users\cs>mongo [your_ip]:27017> use iHealthswitched to db iHealth> db.auth('admin','admin123')1> db.getCollectionNames()[ ]
数据库刚刚创建,所以没有数据
安装环境:Python 环境和依赖 + MongoDB 配置
配置 common.py 中的数据库信息
# 数据库配置mongo_dbname = 'iHealth'mongo_host = 'your_ip' # mongodb 主机地址mongo_port = 27017 # mongodb 主机端口mongo_user = 'your_user' # mongodb 登陆用户mongo_pwd = 'your_password' # mongodb 用户密码
运行
python iHealth_crawler.py
sh server.sh start
Usages: sh server.sh [start|stop|restart|status|log]