Senior AI-Engineer / Agent-Architekt (m/w/d)
Source: Arbeitnow
Tailor your resume to this posting—match keywords and layout for recruiters. Try Resume.io before you apply.
Job Description
NeuraPlox sucht den Engineer, der unsere AI-Agent-Plattform für Enterprise-Kunden in regulierten Branchen baut. Kein Tutorial-LLM, kein Vibe-Engineering, keine Demo-RAGs, die bei 10k Embeddings auseinanderfallen. Wir bauen explainable AI mit Audit-Lineage, Decision-Provenance und pgvector at scale, weil unsere Kunden ihre KI-Outputs nicht nur erklären wollen, sondern müssen. Investor-backed, München-Region. Aufgaben Was du bei uns baust Production-grade AI-Agent-Plattform mit PydanticAI, LiteLLM, Langfuse RAG-Pipelines mit pgvector at scale (Multi-Tenant-Isolation, Index-Rebuild-Strategie, Hybrid Search) Multi-Tenant Token-Quota-Service plus Eval-Frameworks pro Tenant MCP (Model Context Protocol) Tool-Integration als First-Class-Citizen Explainable Outputs, lückenlose Auditierbarkeit von Prompt bis Output für regulierte Branchen Architektur-Entscheidungen, die im Bank-, Versicherungs- und Pharma-Kontext halten Wie wir arbeiten Eval-driven, nicht Vibe-driven. Jeder Agent-Change geht durch eine Eval-Suite. ADRs für jede relevante Architektur-Entscheidung, nicht im Slack-Thread vergraben LLM-Calls werden gemessen, nicht geraten - Langfuse von Tag eins Re-Ranking, pgvector-Sizing und Retrieval-Quality werden empirisch entschieden Direkter Draht zum Founding-Team, kein Layer aus Project Managern dazwischen Qualifikation Was wir suchen 5+ Jahre Python-Production-Engineering Echte Production-LLM-Erfahrung mit Tokens, Latenz, Cost und Eval als täglicher Realität RAG-Engineering mit pgvector-Sizing und Re-Ranking, nicht nur "ich kenne LangChain" LangGraph, PydanticAI oder vergleichbares Agent-Framework in Produktion eingesetzt LiteLLM, Langfuse, MCP - oder Bereitschaft, dich in 2 Wochen einzuarbeiten Tech-Stack: Python, FastAPI, PydanticAI, LangGraph, LiteLLM, Langfuse, pgvector, MCP, Kubernetes-Grundlagen. Benefits Du willst endlich unter gleichgesinnten, echten Profis an einer richtig performanten Lösung arbeiten - nicht nur was dir von oben aufgedrückt wird. Bei uns arbeitest du nach technischer Best Practices - nicht was im Management gut ankommt. Tolles Team, viel Freiraum bei deiner Arbeit. Du bestimmst, echter Impact! Was wir bieten VSOP als Investor-backed Startup für Schlüsselpositionen Voll-remote möglich, Wohnsitz Deutschland - Team-Entwicklungstage ca. 1xMonat im Munich-Office Du reportest direkt an Christoph Knöll (Founder/CEO) und arbeitest eng mit unserem Head of AI Senior-Hire für das AI-Layer, du prägst die Agent-Architektur, nicht "tunest Prompts" CV plus 3 Sätze, warum genau diese Rolle. Kein Anschreiben-Template. Wir lesen jede Bewerbung selbst. Find Jobs in Germany on Arbeitnow
Full Description
NeuraPlox sucht den Engineer, der unsere AI-Agent-Plattform für Enterprise-Kunden in regulierten Branchen baut. Kein Tutorial-LLM, kein Vibe-Engineering, keine Demo-RAGs, die bei 10k Embeddings auseinanderfallen. Wir bauen explainable AI mit Audit-Lineage, Decision-Provenance und pgvector at scale, weil unsere Kunden ihre KI-Outputs nicht nur erklären wollen, sondern müssen. Investor-backed, München-Region. Aufgaben Was du bei uns baust Production-grade AI-Agent-Plattform mit PydanticAI, LiteLLM, Langfuse RAG-Pipelines mit pgvector at scale (Multi-Tenant-Isolation, Index-Rebuild-Strategie, Hybrid Search) Multi-Tenant Token-Quota-Service plus Eval-Frameworks pro Tenant MCP (Model Context Protocol) Tool-Integration als First-Class-Citizen Explainable Outputs, lückenlose Auditierbarkeit von Prompt bis Output für regulierte Branchen Architektur-Entscheidungen, die im Bank-, Versicherungs- und Pharma-Kontext halten Wie wir arbeiten Eval-driven, nicht Vibe-driven. Jeder Agent-Change geht durch eine Eval-Suite. ADRs für jede relevante Architektur-Entscheidung, nicht im Slack-Thread vergraben LLM-Calls werden gemessen, nicht geraten - Langfuse von Tag eins Re-Ranking, pgvector-Sizing und Retrieval-Quality werden empirisch entschieden Direkter Draht zum Founding-Team, kein Layer aus Project Managern dazwischen Qualifikation Was wir suchen 5+ Jahre Python-Production-Engineering Echte Production-LLM-Erfahrung mit Tokens, Latenz, Cost und Eval als täglicher Realität RAG-Engineering mit pgvector-Sizing und Re-Ranking, nicht nur "ich kenne LangChain" LangGraph, PydanticAI oder vergleichbares Agent-Framework in Produktion eingesetzt LiteLLM, Langfuse, MCP - oder Bereitschaft, dich in 2 Wochen einzuarbeiten Tech-Stack: Python, FastAPI, PydanticAI, LangGraph, LiteLLM, Langfuse, pgvector, MCP, Kubernetes-Grundlagen. Benefits Du willst endlich unter gleichgesinnten, echten Profis an einer richtig performanten Lösung arbeiten - nicht nur was dir von oben aufgedrückt wird. Bei uns arbeitest du nach technischer Best Practices - nicht was im Management gut ankommt. Tolles Team, viel Freiraum bei deiner Arbeit. Du bestimmst, echter Impact! Was wir bieten VSOP als Investor-backed Startup für Schlüsselpositionen Voll-remote möglich, Wohnsitz Deutschland - Team-Entwicklungstage ca. 1xMonat im Munich-Office Du reportest direkt an Christoph Knöll (Founder/CEO) und arbeitest eng mit unserem Head of AI Senior-Hire für das AI-Layer, du prägst die Agent-Architektur, nicht "tunest Prompts" CV plus 3 Sätze, warum genau diese Rolle. Kein Anschreiben-Template. Wir lesen jede Bewerbung selbst. Find Jobs in Germany on Arbeitnow