上海兰姆达数据科技有限公司

上海 ·IT/互联网 ·20-99人

高级爬虫工程师

15-25K

上海

3-5年

本科

全职

职位描述
岗位职责
1、参与公司汽车和电商行业舆情大数据系统建设,主要负责数据爬取
2、参与分布式爬虫系统的设计和开发
3、负责PC和APP端的数据爬取,数据范围覆盖行业垂媒,社交媒体,主流电商和短视频APP等
4、在爬虫任务不多的时候,也可参与大数据平台开发,算法开发等方向工作,有大量学习机会。

任职要求
1、本科及以上学历,计算机软件相关专业,3年以上爬虫经验
2、熟练掌握Java/Python开发语言,精通使用各种爬虫相关技术
3、有APP开发背景或APP爬虫开发经验佳,有逆向经验尤佳
4、能够有效的解决封账号、封IP等问题
5、精通高并发、高性能的分布式系统的设计及应用
6、有汽车垂媒,社交平台,电商,短视频APP等爬虫经验者优先
公司介绍
【兰姆达寓意】
兰姆达是lambda(λ)的音译,物理学中λ表示波长,线性代数中λ表示特征根,Python编程中λ表示匿名函数,大数据有lambda架构。兰姆达数据科技有限公司,正是要秉承λ内涵,希望在数据智能领域开创一番成就。

【公司业务】
官网:www.lanmudata.com
兰姆达数据的定位是为企业提供专业的数据智能软件和服务,目前聚焦在汽车和电商零售行业。主要业务包括三部分:
(1)预测营销云平台
(2)网络舆情大数据分析平台
(3)自动化客户预测建模工具
(4)数据分析和数据挖掘建模服务

【公司客户】
目前主要服务客户包括:汽车主机厂和经销:如一汽大众,别克,广汽传祺;知名电商零售品牌:如Nike,Net-A-Porter,Lining,Fila等

【技术栈】
后端开发:Java,微服务,Docker
前端框架:Vue,React
大数据平台:阿里云E-MapReduce(Hadoop,Spark),数据湖
数据库:阿里云RDS,AnalyticDB MySQL,Greenplum
机器学习:Python,Sklearn,CatBoost,XGBoost,TensorFlow,NLP,CV

【创始团队】
兰姆达团队主要由大数据,机器学习,软件开发等领域的资深专家构成。创始人段勇是连续创业者:前杭州数云联合创始人CTO(获红杉资本和阿里巴巴投资),华院计算研发总监及董事,WiFi万能钥匙大数据专家,A+实验室(http://aicademy.org)创始人。
上海静安区上海招商局广场南楼2417
相似职位