Your search has found 2 jobs

Ready to architect the future of human-computer voice interaction?

Join an established conversational AI company as they transition from traditional cascaded speech systems to cutting-edge E2E speech-to-speech technology. You'll lead this transformation, building multimodal systems that will redefine how millions interact with AI.

The opportunity

You'll be leading the development of speech technology that directly impacts real users at massive scale. The company processes millions of daily interactions across major enterprise clients, meaning your research will shape real-world conversational experiences.

You'll spearhead the development of full-duplex speech systems, creating truly natural AI conversations that go far beyond current capabilities.

Your impact

  • Design and build next-generation multimodal speech LLM architecture from the ground up
  • Drive breakthroughs in speech-to-speech modeling and full-duplex conversation systems
  • Tackle turn-taking, interruption handling, and simultaneous speech processing
  • Bridge cutting-edge research with enterprise-grade production systems
  • Lead a growing team focused on SOTA speech-to-speech breakthroughs and own the development end-to-end

What you'll bring

  • Deep understanding of SOTA speech models and neural audio processing
  • Experience building speech language models/multimodal systems
  • Strong background in speech AI research and modern speech architectures

This is all underpinned by access to a large corpus of real enterprise conversational data and serious GPU infrastructure.

The company has built everything in-house, giving you complete technical control and the freedom to explore any approach that delivers value.

With their established market position and proven track record, you'll have the resources and real-world testing ground to make transformative impact with your research. 

Location

Remote (Must be within EU timezone).

Location: Remote
Job type: Permanent
Emp type: Full-time
Salary type: Annual
Salary: negotiable
Job published: 30/04/2026
Job ID: 33350

Looking to push the boundaries of generative AI for real-time interaction?

You'll be joining a well- funded startup working on multimodal AI where voice, vision, and language come together. 

They're building generative models for natural conversational experiences that need to perform in real-time.

There's no limitations with resources here, they have plenty of compute for you to run experiments at scale. You'll be working alongside a well known open-source leader, as well as a very strong speech R&D team from leading companies. 

Your mission

You'll be building and optimising diffusion or flow-matching models that power their speech and audio generation. This means developing production-ready architectures that can generate controllable, high-quality output at scale.

You'll own the full research-to-production pipeline - from architecture design and training through deployment and optimisation. 

Your work will directly impact how millions of AI characters sound and interact.

Your focus

  • Design and train large-scale diffusion or flow-matching models

  • Develop novel architectures and training techniques to improve controllability and quality

  • Build evaluation systems to measure generation quality and model behaviour

  • Work from low-level performance optimisations to high-level model design

What you'll bring

  • Proven track record building diffusion models or flow-matching systems (this can be applied to other modalities)

  • Experience training large models (3B+ parameters) with distributed systems

  • Hands-on experience with streaming or distillation of diffusion models

Nice to have

  • Experience with audio or speech generation

  • Publications or open-source contributions in diffusion models or generative AI

Remote in Europe. Base salary is between €140-200K DOE (with some flex for the right person). Plus generous stock. 

Location: Remote
Job type: Permanent
Emp type: Full-time
Salary type: Annual
Salary: negotiable
Job published: 26/01/2026
Job ID: 34280