Data Engineer/Analyst (m/w/d) @ EvoLogics GmbH [43.000 - 72.000 €]
Source: GermanTechJobs
AI Summary Powered by Gemini
EvoLogics GmbH is seeking a Data Engineer/Analyst to develop data pipelines and automate ML workflows. The role requires a degree in Computer Science or a related field, strong Python and SQL skills, and experience with ETL/ELT processes and cloud data platforms.
Job Description
Salary: 43.000 - 72.000 € per year Requirements: Ein abgeschlossenes Studium im Bereich Informatik, Ingenieurwesen oder vergleichbarer Fachrichtung Erfahrung mit Python für Datenverarbeitung, Pipeline-Entwicklung und Automatisierung von ML-Workflows Vertrautheit mit SQL und allgemeinen Datenbankkonzepten (ausreichend zum Abfragen, Transformieren und Validieren von Daten) Praxisnahe Erfahrung mit ETL/ELT-Prozessen und Orchestrierungs-Tools (Airflow, dbt, Prefect etc.) Erfahrung mit Cloud-Datendie
Full Description
Salary: 43.000 - 72.000 € per year Requirements: Ein abgeschlossenes Studium im Bereich Informatik, Ingenieurwesen oder vergleichbarer Fachrichtung Erfahrung mit Python für Datenverarbeitung, Pipeline-Entwicklung und Automatisierung von ML-Workflows Vertrautheit mit SQL und allgemeinen Datenbankkonzepten (ausreichend zum Abfragen, Transformieren und Validieren von Daten) Praxisnahe Erfahrung mit ETL/ELT-Prozessen und Orchestrierungs-Tools (Airflow, dbt, Prefect etc.) Erfahrung mit Cloud-Datendiensten und verteilten Datenverarbeitungs-Frameworks Kenntnisse in Active-Learning-Prinzipien, Datenlabeling-Strategien und Annotations-Tools Verständnis grundlegender ML-Konzepte – Modelllebenszyklus, Feature-Pipelines, Evaluationsmethoden und Datenanforderungen für überwachtes Lernen Erfahrung mit MLOps-Konzepten wie Modell-/Datenversionierung, Monitoring und Reproduzierbarkeit Erfahrung mit CI/CD-Praktiken und Infrastructure-as-Code-Tools (Terraform, CloudFormation) Responsibilities: Entwerfen, erstellen und warten von skalierbaren Datenpipelines sowie ETL/ELT-Workflows Implementieren von Active-Learning-Workflows, Pre-Labelling-Pipelines und Feedback-Loops zur Verbesserung der Annotationseffizienz Integrieren von Daten aus verschiedenen Quellen bei gleichzeitiger Sicherstellung von Datenqualität, Zuverlässigkeit und Verfügbarkeit Entwickeln automatisierter Validierungs-, Monitoring- und Observability-Mechanismen für daten- und ML-gestützte Labeling-Prozesse Zusammenarbeit mit Analytics-, ML- und Produktteams zur Bereitstellung kuratierter Datensätze für Reporting und Modellentwicklung Automatisieren von Deployments, Workflow-Orchestrierung und Dateninfrastruktur unter Nutzung von DataOps-Best-Practices Beheben von Pipeline-Problemen, Durchführen von Root-Cause-Analysen und Sicherstellen einer kontinuierlichen Verbesserung der Datensysteme Technologies: Airflow CI/CD Cloud ETL Python SQL Terraform dbt More: EvoLogics ist ein innovatives High-Tech-Unternehmen mit Sitz in Berlin. Wir entwickeln und vermarkten weltweit Produkte und Schlüsseltechnologien in der maritimen und Offshore-Technik. Unsere Expertise umfasst Robotik, High-Tech-Sensorik, künstliche Intelligenz, fortgeschrittene Informatik und Kommunikationstechnologie. Wir bieten ein angenehmes Arbeitsumfeld in einem hoch motivierten Team, abwechslungsreiche Aufgaben mit hoher Eigenverantwortung, ein unbefristetes Arbeitsverhältnis mit flexiblen Arbeitszeiten, ein attraktives Gehaltspaket inklusive betrieblicher Altersvorsorge sowie Weiterbildungsmöglichkeiten und regelmäßige Team-Events und Workshops. last updated 5 week of 2026