职位详情

爬虫工程师

10-15K

北京

1-3年

本科

职位详情

岗位职责： 1、负责开发网络爬虫系统以及优化爬虫策略，进行多平台信息的抓取和分析； 2、完成数据采集与爬取、解析处理、入库等数据日常工作； 3、积极主动思考探索爬虫在实际业务中的价值，参与设计数据有效利用策略，从数据合理性、完整性角度提供建议； 4、把握网络爬虫核心技术研究方向，研究优化方向，提升爬虫系统的稳定性、可扩展性； 5、设计爬虫策略和防屏蔽规则，提升网页抓取的效率和质量。任职要求： 1. 统招本科以上学历，2年以上爬虫项目经验，计算机相关专业，具备良好的计算机专业知识 2. 熟悉python语言，具备扎实的编程功底，具有良好的程序设计能力 3. 熟悉爬虫原理，熟悉Scrapy、pyspider等主流爬虫框架框架，能够解决封账号、封IP、验证码、网页限制爬取等问题，且有实际经验 4. 熟练使用 python request、xpath、BeautifulSoup、正则等模块 5. 基本了解Django、flask等web框架的使用 6. 熟练使用MySQL、MongoDB，Redis了解Hadoop、hbase等技术 7. 业务理解和分析转化能力较强，富有进取精神及团队合作精神，责任心强，善于合作沟通，能够承受压力

收起

立即沟通