职位详情

Python爬虫工程师(中高级)
20-40K
深圳 南山区
3-5年
本科
职位详情
爬虫工程师
Python
Scrapy
爬虫开发经验
反爬策略和实践经验
JS逆向
分布式爬虫架构
大规模数据采集
产品自研,非外包 岗位职责: 1.主导和参与大规模爬虫系统的架构设计、规划、 2.负责核心模块开发及优化,如面向主流社交平台博文的大规模、分布式爬虫开发 3.持续维护并优化系统设计及系统性能,提升大规模爬取效率 4.负责进行大规模分布式爬虫系统相关的前沿技术研究 任职资格: 1.本科学历,计算机及工科相关专业,3年以上爬虫开发经验,工作年限4-7 2.熟练掌握python,掌握selenium、scrapy等爬虫相关框架 3.有大型分布式爬虫平台设计、开发经验 4.熟练掌握MongoDB,有过数据库调优和海量数据存储经验优先 5.熟悉前沿的反爬风控手段,对社交媒体平台的反爬对抗有深入的理解;了解常见的反爬策略,能解决ip封禁、参数加密、验证码、账号封禁等问题 6.精通JS防护、混淆、逆向分析等技能,熟悉各种浏览器检测/反检测手段 5.熟悉各类代理的使用,有海量代理池搭建经验 优先考虑: 1.有大规模分布式系统设计与开发经验优先 2.有APP逆向方面经验优先
收起
深圳市东信时代信息技术有限公司
深圳市 · 移动互联网 · 100-499人
高新技术企业