微信-大模型后训练算法专家Apply |
|
Job Source |
腾讯集团 |
Location |
China, Beijing |
Salary |
Negotiable |
Designation |
Full Stack Developer |
Job Type |
Full Time |
Language |
|
Job Posted Date |
29-09-2025 |
Job Description |
|
1.负责大语言模型(LLM)推理能力的核心技术研发,包括数学推理、逻辑推理、知识推理和通用任务(如问答、翻译等)的算法研发、优化与创新,提升大模型在复杂场景下的高阶推理能力;
2.跟踪推理领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用。 |
|
Job Requirements |
|
1.计算机科学、数学、人工智能等相关专业硕士及以上学历;
2.具备良好的数理基础和 NLP 技术基础,能够熟练使用 HuggingFace,Megatron,DeepSpeed,PyTorch 等框架至少一种,深入理解Transformer、GPT等模型架构; 3.在Post-training方向有一定研究基础,熟悉SFT/DPO/PPO/GRPO/Reward Model等; 4.具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用; 5.对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力。。加分项:1.主导过推理任务优化项目(如数学解题、代码生成、逻辑问答),在权威推理评测(如AIME、MATH、HumanEval等)中取得过显著效果提升; 2.以第一作者身份发表过 NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL 等论文; 3.了解GPU硬件架构,有CUDA编程经验,熟悉各种网络底层算子实现细节。 |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !