混元大语言模型算法工程师-大模型推理能力方向-深圳/北京Apply |
|
Job Source |
腾讯集团 |
Location |
China, Shenzhen |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力;
2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。 |
|
Job Requirements |
|
1.有过大模型代码/数学/reasoning方向的研发经历;
2.在post-training方向有一定研究基础,熟悉SFT/DPO/PPO/Reward Model等pipeline; 3.较强的工程实现能力,熟练使用Python语言,有实际编程项目经验,熟悉DeepSpeed、Megatron等分布式训练框架,熟练使用pytorch深度学习框架; 4.计算机科学、机器学习、统计学、应用数学等相关专业在校硕士、博士生; 5.在高水平国际会议和学术期刊发表过相关论文,或有高水平竞赛获奖经历优先。。加分项: |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !