职位详情

Python爬虫工程师
12-20K
深圳 南山区
3-5年
本科
职位详情
分布式技术
网络爬虫技术
多线程
Linux
Scrapy
岗位职责: 1. 参与分布式爬虫和数据采集系统的架构设计和开发; 2. 负责网络数据抓取规划、增量爬取指定渠道的数据; 3. 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; 4. 参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析; 5. 实现数据提取、清洗、结构化、入库、统计分析等需求; 6. 研究优化算法,提升爬虫系统的稳定性、可扩展性。 职位要求: 1. 本科或以上学历,计算机或相关专业;2年或以上python爬虫开发相关工作经验; 2. 扎实的python基础,熟悉Python的多线程/进程/协程等操作,有良好的编码习惯,掌握面向对象设计原则,可熟练运用常见的设计模式; 3. 熟悉Oracle,mysql等常见数据库; 4. 熟悉爬虫开发,熟悉常用爬虫框架如Scrapy、Requests、XPath等, 并了解原理和机制。了解常见的反爬手段及其应对措施; 4. 熟悉WEB到后端的数据链路和交互,有linux/unix下项目开发以及程序调试经验; 5. 善于沟通和逻辑表达,良好团队合作精神和积极主动的沟通意识,有项目管理经验优先; 6. 有强烈的上进心和求知欲,善于学习和运用新知识; 7. 熟悉java/kotlin/php 等其它语言者优先。
收起
深圳市图灵机器人有限公司
深圳市 · 计算机软件 · 20-99人
高新技术企业
小微企业
科技型中小企业