返回到找工地图

Lulula

做中文世界顶级的实时语音 Agent——一个实时、有情绪、带 3D 沉浸音效、always-on 的端到端语音对话系统,对标海外标杆 Sesame 与 Thinking Machines Lab。

2-10 人办公室或远程北京海淀端到端语音3D 空间音效全双工对话
创始团队
孙长昊
Founder & CEO
Dr.Sam
首席语音科学家 & 语音模型负责人
孙靖凯
Co-founder & 核心工程负责人
团队哲学

让 Agent 适配人的交互带宽

反转人机关系

现在的 AI 都是人去适应机器——打字、写 prompt。Lulula 想反过来,让 Agent 适配人的交互带宽,给 AI 真正的声音、身体感与空间环境感。

端到端「活人感」

不是拼接 ASR + LLM + TTS 的管线,而是端到端大模型同时生成语音、动作声、行为——能在对话中主动打断、给出即时回应(back channel),像真人一样自然交互。

声音即空间

除了视觉,Lulula 用 3D 沉浸听觉让 AI 的存在感「如在身边」——开心时拍手、cheers 时碰杯,带空间与时间的逻辑关系。

Fun facts

🎓 奇绩创坛 S26

Lulula 入选奇绩创坛 2026 春季营(S26),在路演日亮相。

🎤 字节系班底

创始团队多为字节前同事,核心成员分别来自百度文心、字节扣子与豆包团队,语音算法负责人为顶尖博士,累计发表音频顶会论文 20 余篇。

🔊 强 Persona

Lulula 的 Agent 性格鲜明,能与用户自然互动甚至会「怼」用户,交互行为自然涌现——不只是语音助手,更像一个有态度的 AI 伙伴。

技术栈

端到端语音对话系统,核心指标:

  • 延迟:250ms 响应,全双工实时对话
  • 空间音频:15° 空间分辨率,40 种环境声场景
  • 情感合成:25 种情绪 × 32 种语气词
  • 架构:本地隐私 + 云端路由混合架构
  • 能力覆盖:模型训练、Agent 工程、硬件落地全链路
  • 团队来源:百度文心一言、字节 Coze & 豆包 Agent 平台核心成员
最近新闻
创始团队
孙长昊
Founder & CEO

字节 Coze 早期核心成员,百度文心一言创始团队核心成员;曾在腾讯、旷视负责 AI 产品与智能硬件业务,主导/参与 10+ AI 产品从 0 到 1

孙靖凯
Co-founder & 核心工程负责人

前百度 MEG AIGC 创作研发组核心成员

Dr.Sam
首席语音科学家 & 语音模型负责人

顶尖博士,累计发表音频顶会论文 20 余篇

Brick
业务架构师 & 语音工程化负责人

前滴滴语音工程负责人

fancyteams.com / lulula
由 Bonjour! 驱动 · 本周更新