1. 负责字节系广告相关内容理解,包括文案、图片、视频、OCR文本、ASR文本等;
2. 负责相关模型构建,如语义匹配模型、分类模型、少样本学习、数据增强等;
3. 负责文本相关策略构建,包括关键词挖掘、规则挖掘等;
4. 参与基础NLP能力建设,如LLM、长/短文本分类、seq2seq、NER、关键词挖掘、Embedding与Attention等相关技术。
职位要求
1. 硕士及以上计算机、数学、自动化等相关学科
2.优秀的编程和算法基础,熟悉python/c++等主流编程语言;
3. 熟悉NLP相关任务,并在NLP一个或多个领域有一定实践经验和技术积累;
4. 熟悉深度学习与机器学习理论基础,如GPT、Bert、Transformer、Electra、LSTM、LR、SVM、HMM、CRF、Decision Tree、Random Forest等;
5. 熟悉常见模型训练框架,如tensorflow、pytorch、mxnet等
6. 具备良好的逻辑思维能力、沟通协作能力,保持对新事物的好奇心;在AI顶会顶刊发表过高水平论文的优先