大模型算法工程师
杭州Junior / Senior全职1 个月前
你的工作将包括
- 参与 Al native OS 中的大模型推理 pipeline、多模态任务、认知架构等方向研发,持续提升模型在真实任务中的表现。
- 设计数据方案,完成大规模图文/文本数据的清洗、生成与质量评估。
- 独立或协作完成大模型的后训练,重点包括强化学习(RLHF/ DPO / GRPO 等)和多模态能力提升,并能在多卡/分布式环境下稳定调优。
- 与工程团队协作,将模型能力集成至产品,关注推理延迟、吞吐、可扩展性等工程指标,确保稳定运行。
- 探索多模态架构(如 LLaVA、Qwen-VL 等)、强化学习对齐方法、推理加速等新技术,并鼓励将有价值的数据集、模型权重、实验文档以开源或内部共享方式沉淀。
- 围绕模型训练目标(如强化多模态理解能力、推理性能等),设计并构建高质量的评估基准(Benchmark),建立可持续追踪的评估流程,用于指导模型迭代与版本对比。
我们在寻找这样的你
- 硕士及以上学历,计算机、数学、通信等相关专业。
- 熟练掌握 PyTorch, Hugging Face Transformers 等工具, 精通 Python.
- 有大模型 Post-Training (SFT、RLHF / DPO / GRPO)和多卡/分布式训练经验。
- 有多模态 LLM(如 LLaVA 系列、Qwen-VL 系列)或 RAG类项目的完整落地经验(从数据到评估到部署)。
加分项
• 有CCFA/ 中科院1区等高水平论文发表经历。 • 有开源模型权重或高质量数据集的实际贡献经历(如 GitHub、Hugging Face)。 • 熟悉推理加速工具(量化、LORA、DeepSpeed)。 • 熟悉 VLM 架构及多模态数据-训练-测试全流程。 • 对强化学习对齐方法(DPO/ GRPO/PPO等)有深入理解和实践经验。 • 能独立完成英文论文复现与技术报告撰与。
你将获得
- 极具竞争力的薪酬:25-50k.16薪,尊重技术贡献。
- 双休、五险一金、弹性工作:近地铁,拒绝无效内卷。
- 与创始人/技术负责人并肩工作,你的模型设计、数据方案、论文思路会被认真对待。
- 硅谷式但更务实的文化:平等、开放、远离 PUA,鼓励技术深度与工程落地并重。
了解这群人

Humanify
Humanify AI is an AI-first company that brings intelligence back to what matters most—people. We design AI solutions that amplify human decision-making, transform complex data into meaningful insight, and create more intuitive, human-centered experiences across your business.
11-50 人·杭州