理脉网/ 公富信息

北京 ·法律 ·20-99人

Python爬虫工程师

15-30K·14薪

北京

3-5年

本科

全职

职位描述
岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台、不同维度信息的抓取和分析;
2、反爬虫策略研究,实时监控爬虫的进度和预警处理,保障数据获取能力;
3、负责持续跟踪分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进,提升公司相关产品与服务的竞争力;

任职要求:
1、有从事网络爬虫、网页去重、网页信息抽取的经验,精通网页抓取原理及技术,有两年及以上爬虫经验;
2、熟练使用常见爬虫框架(xpath/scrapy/scrapy-redis/pyspider等);
3、能处理常见反扒问题能力(代理/app抓包/web反扒);
4、掌握常用js混淆的调试分析。
5、熟练使用 mongo,redis,mysql 等数据库;
6、精通信息抓取和整合技术,从结构化的和非结构化的数据中获取信息,掌握正则表达式;具备一定的信息检索和web挖掘能力者优先;
7、计算机相关专业本科以上学历,能承受一定工作压力,以解决技术难题为乐趣,有想法,敢于挑战;
公司介绍
理脉Legal Miner是一家全球性数据咨询公司。理脉数据专家团队基于多年咨询服务经验,利用自主研发的科法智能数据技术,对跨行业、跨领域的法商数据进行清洗与结构化处理,以咨询服务+SaaS系统的方式为企业提供专业化、综合性的商业管理解决方案,满足客户业务开发、风险评估、合规管理与尽职调查等各项需求,助力企业降本增效,把握机遇,取得非凡成就。
北京朝阳区环球金融中心东塔2层201室
面试经验

匿名用户

面试理脉网/ 公的Java·北京

感觉靠谱
面试官们很专业,问的
面试官们很专业,问的技术相关问题都在点上(虽然有的没答上来吧),然后问了问职业规划、个人发展方向什么的,整体都挺好的。办公环境也不错,是在CBD,高楼大厦哈哈。 ...查看全文
查看更多面经(4)
相似职位