一、基础知识
使用Python编写爬虫,当然至少得了解Python基本的语法,了解:
基本数据结构
数据类型
控制流
函数的使用
模块的使用
不需要过多过深的Python知识,仅此而已。
个人推荐《Python简明教程》#/abyteofpython_cn/、Python官方的《Python教程》#/translate/python_352/tutorial/index.html
二、开发环境、
操作系统:Windows 7
Python版本:Python 3.4
代码编辑运行环境:个人推荐PyCharm社区版,当然,Python自带的IDLE也行,Notepad++亦可,只要自己使用得习惯。
三、第三方依赖库
requests:一个方便、简洁、高效且人性化的HTTP请求库
BeautifulSoup:HTML解析库
pymongo:MongoDB的Python封装模块
selenium:一个Web自动化测试框架,用于模拟登录和获取JS动态数据
pytesseract:一个OCR识别模块,用于验证码识别
Pillow:Python图像处理模块
以上就是潍坊IT培训给大家做的内容详解,更多关于IT知识的学习,请继续关注潍坊IT培训。