← 返回职位

大模型算法工程师

杭州Junior / Senior全职1 个月前

你的工作将包括

参与 Al native OS 中的大模型推理 pipeline、多模态任务、认知架构等方向研发，持续提升模型在真实任务中的表现。
设计数据方案，完成大规模图文/文本数据的清洗、生成与质量评估。
独立或协作完成大模型的后训练，重点包括强化学习（RLHF/ DPO / GRPO 等）和多模态能力提升，并能在多卡/分布式环境下稳定调优。
与工程团队协作，将模型能力集成至产品，关注推理延迟、吞吐、可扩展性等工程指标，确保稳定运行。
探索多模态架构（如 LLaVA、Qwen-VL 等）、强化学习对齐方法、推理加速等新技术，并鼓励将有价值的数据集、模型权重、实验文档以开源或内部共享方式沉淀。
围绕模型训练目标（如强化多模态理解能力、推理性能等），设计并构建高质量的评估基准（Benchmark），建立可持续追踪的评估流程，用于指导模型迭代与版本对比。

我们在寻找这样的你

硕士及以上学历，计算机、数学、通信等相关专业。
熟练掌握 PyTorch, Hugging Face Transformers 等工具, 精通 Python.
有大模型 Post-Training （SFT、RLHF / DPO / GRPO）和多卡/分布式训练经验。
有多模态 LLM（如 LLaVA 系列、Qwen-VL 系列）或 RAG类项目的完整落地经验（从数据到评估到部署）。

加分项

• 有CCFA/ 中科院1区等高水平论文发表经历。 • 有开源模型权重或高质量数据集的实际贡献经历（如 GitHub、Hugging Face）。 • 熟悉推理加速工具（量化、LORA、DeepSpeed）。 • 熟悉 VLM 架构及多模态数据-训练-测试全流程。 • 对强化学习对齐方法（DPO/ GRPO/PPO等）有深入理解和实践经验。 • 能独立完成英文论文复现与技术报告撰与。

你将获得

极具竞争力的薪酬：25-50k．16薪，尊重技术贡献。
双休、五险一金、弹性工作：近地铁，拒绝无效内卷。
与创始人/技术负责人并肩工作，你的模型设计、数据方案、论文思路会被认真对待。
硅谷式但更务实的文化：平等、开放、远离 PUA，鼓励技术深度与工程落地并重。

了解这群人

Humanify AI is an AI-first company that brings intelligence back to what matters most—people. We design AI solutions that amplify human decision-making, transform complex data into meaningful insight, and create more intuitive, human-centered experiences across your business.

11-50 人·杭州