← 返回职位

大模型算法工程师

杭州Junior / Senior全职1 个月前

你的工作将包括

  • 参与 Al native OS 中的大模型推理 pipeline、多模态任务、认知架构等方向研发,持续提升模型在真实任务中的表现。
  • 设计数据方案,完成大规模图文/文本数据的清洗、生成与质量评估。
  • 独立或协作完成大模型的后训练,重点包括强化学习(RLHF/ DPO / GRPO 等)和多模态能力提升,并能在多卡/分布式环境下稳定调优。
  • 与工程团队协作,将模型能力集成至产品,关注推理延迟、吞吐、可扩展性等工程指标,确保稳定运行。
  • 探索多模态架构(如 LLaVA、Qwen-VL 等)、强化学习对齐方法、推理加速等新技术,并鼓励将有价值的数据集、模型权重、实验文档以开源或内部共享方式沉淀。
  • 围绕模型训练目标(如强化多模态理解能力、推理性能等),设计并构建高质量的评估基准(Benchmark),建立可持续追踪的评估流程,用于指导模型迭代与版本对比。

我们在寻找这样的你

  • 硕士及以上学历,计算机、数学、通信等相关专业。
  • 熟练掌握 PyTorch, Hugging Face Transformers 等工具, 精通 Python.
  • 有大模型 Post-Training (SFT、RLHF / DPO / GRPO)和多卡/分布式训练经验。
  • 有多模态 LLM(如 LLaVA 系列、Qwen-VL 系列)或 RAG类项目的完整落地经验(从数据到评估到部署)。

加分项

• 有CCFA/ 中科院1区等高水平论文发表经历。 • 有开源模型权重或高质量数据集的实际贡献经历(如 GitHub、Hugging Face)。 • 熟悉推理加速工具(量化、LORA、DeepSpeed)。 • 熟悉 VLM 架构及多模态数据-训练-测试全流程。 • 对强化学习对齐方法(DPO/ GRPO/PPO等)有深入理解和实践经验。 • 能独立完成英文论文复现与技术报告撰与。

你将获得

  • 极具竞争力的薪酬:25-50k.16薪,尊重技术贡献。
  • 双休、五险一金、弹性工作:近地铁,拒绝无效内卷。
  • 与创始人/技术负责人并肩工作,你的模型设计、数据方案、论文思路会被认真对待。
  • 硅谷式但更务实的文化:平等、开放、远离 PUA,鼓励技术深度与工程落地并重。
了解这群人
Humanify
Humanify AI is an AI-first company that brings intelligence back to what matters most—people. We design AI solutions that amplify human decision-making, transform complex data into meaningful insight, and create more intuitive, human-centered experiences across your business.
11-50 人·杭州