← 返回职位

语音算法实习生

北京 · 远程实习全职2 天前

我们在做下一代语音交互入口:实时、有情绪、带 3D 沉浸音效、always-on的端到端语音对话系统,对标海外标杆 Sesame 与 Thinking Machines Lab。 我们相信语音是 Agent 真正贴近人的入口 —— 现在的 AI 都是人去适应机器,打字、写 prompt;我们想反过来,让 Agent 适配人的交互带宽,给 AI 真正的声音身体感与空间环境感。

🏆 团队和投资

奇绩创坛 2026 春季营(S26)项目,全场万份申请录取率约 1%,陆奇博士旗下顶级 AI 创业加速营 核心班底来自百度文心、字节扣子与豆包团队,完整经历过大模型从 0 到 1 的全链路落地 语音算法负责人为顶尖博士,累计发表音频顶会论文 20 余篇,技术深度行业一线 团队覆盖模型训练、Agent 工程、硬件落地全链条,是能真正把技术做进产品的实战派

💻 核心职责

  • 模型训练:端到端语音对话模型的训练与优化(大语言模型 + 语音模型全链路)
  • 数据构建:设计对话数据标注体系,搭建大规模训练数据管线
  • 语音交互:探索并实现主动话语权、自然话轮切换等核心交互能力

📋 任职要求与技术栈

NLP / 语音 / AI 相关方向,有扎实的算法基础 有 Qwen/Llama 等开源大模型完整训练与调优经验 有 ASR/TTS/ 语音端点检测(VAD)等语音模型训练经验 深入理解对话系统逻辑,对话轮控制、主动话语权有认知 熟练使用 PyTorch、DeepSpeed、CosyVoice 等技术工具

💰 薪资:500-1500 元 / 天,能力匹配者上不封顶,面议可谈 📍 北京海淀线下优先,优秀者可远程

了解这群人
Lulula
做中文世界顶级的实时语音 Agent——一个实时、有情绪、带 3D 沉浸音效、always-on 的端到端语音对话系统,对标海外标杆 Sesame 与 Thinking Machines Lab。
2-10 人·北京海淀