Wie können Händler mit KI und Automatisierung Produktdaten aus mehreren Lieferantenquellen anreichern und normalisieren?

Import, Normalisierung, KI-Anreicherung und Ausspielung — der komplette Workflow, plus ein konkreter n8n-DIY-Aufbau und wo ein spezialisiertes PIM übernimmt.

Jakob Feinböck, Productbay26. Juni 202612 Min. Lesezeit
☝️Das Wichtigste in Kürze
  • Vier Schritte machen aus chaotischen Lieferantendaten kanalfertige Kataloge: Import, Normalisierung, KI-Anreicherung, Ausspielung.
  • Eine schlanke Variante lässt sich mit n8n + LLM-API selbst bauen — gut zum Prototyping, aber im Maßstab oft inkonsistent.
  • Versteckte Varianten im Artikelnamen (z. B. GT1D RH SPEEDER 40 R 9.0) müssen in eigene Attribute geparst werden.
  • Ein für Händler gebautes PIM liefert das mit Review-Queue und bis zu 95 % weniger Handarbeit.

Wer Produkte von mehr als einer Handvoll Lieferanten verkauft, kennt das Problem: Jeder Lieferant schickt eine andere Datei, mit anderen Spaltennamen, anderen Einheiten, anderer Kategorielogik – und die Hälfte der Beschreibungen fehlt. Jemand im Team verbringt Tage mit Copy-Paste in Tabellen, bevor ein einziges Produkt live geht.

Dieser Guide zeigt Schritt für Schritt, wie KI und Automatisierung das lösen – erst der Workflow, dann ein konkreter DIY-Aufbau mit n8n, dann, wo ein spezialisiertes Tool übernimmt.

Warum sind Produktdaten aus mehreren Lieferantenquellen so schwer zu handhaben?

Der Schmerz liegt nicht allein in der Menge – sondern in der Inkonsistenz im großen Maßstab. Mit jedem neuen Lieferanten wiederholt sich dasselbe:

  • Unterschiedliche Formate: Excel, CSV-Feed, FTP-Drop, API.
  • Unterschiedliche Attributnamen: "Color" vs. "Colour" vs. "Farbe" vs. "Var_1".
  • Unterschiedliche Einheiten & Schreibweisen: 1,5 kg vs. 1.5kg vs. 1500g; EAN-Codes als wissenschaftliche Notation verstümmelt.
  • Varianten stecken im Artikelnamen statt in Spalten: Eigenschaften wie Ausführung, Hand, Flex oder Loft sind im Titel versteckt – z. B. GT1D RH SPEEDER 40 R 9.0 (Rechtshand, Flex R, Loft 9.0) – statt als saubere, einzeln filterbare Attribute. Ohne sie herauszulösen entstehen keine echten Varianten, und Kunden können nicht nach „Linkshand" oder „Flex R" filtern.
  • Fehlende Daten: keine Beschreibungen, keine Kategorien, kein SEO-Text, schlechte Bilder.
  • Keine einzige Quelle der Wahrheit: die "Master"-Version lebt im Kopf einer Person und in drei Tabellen.

Das von Hand zu machen, skaliert nicht. Sobald du einen Lieferanten oder Kanal hinzufügst, vervielfacht sich der Aufwand.

Der 4-Schritte-KI-Workflow für saubere, kanalfertige Daten

Schritt 1 — Import automatisieren (Data In)

Jede Quelle einmal anbinden statt jede Datei herunterzuladen und umzuformatieren:

  • CSV-/Excel-Import mit definierten Feldtypen (Text, Single-/Multi-Select, Integer, Decimal, Boolean, Datum, URL, Bilder).
  • Remote-Importe per Feed-URL oder FTP nach Zeitplan – z. B. Bestände und Preise jeden Morgen um 6:00 Uhr aus dem ERP ziehen.
  • API-Anbindungen, wo vorhanden.

Produkte über SKU oder EAN abgleichen: Bestehendes wird aktualisiert, Neues automatisch angelegt.

Schritt 2 — In ein Schema normalisieren

Normalisierung verwandelt Chaos in einen Katalog: Jedes Produkt landet – egal von welchem Lieferanten – in einer konsistenten Struktur.

  • Attribut-Mapping: "Colour / Farbe / Var_1" jedes Lieferanten → dein einziges Attribut Farbe.
  • Werte-Mapping: XL des einen und extra-large des anderen werden ein kanonischer Wert.
  • Einheiten- & Formatkonsistenz: Dezimalstellen, Trennzeichen, EAN/GTIN als Text.
  • Varianten aus dem Titel herauslösen: Im Artikelnamen versteckte Eigenschaften (GT1D RH SPEEDER 40 R 9.0 → Hand = Rechts, Flex = R, Loft = 9.0) per Regel/KI in eigene Attribute parsen.
  • Variantenlogik: Eine Parent-SKU gruppiert die so entstandenen Varianten (Größe, Farbe, Flex, Hand …) darunter.

Schritt 3 — Mit KI anreichern (der Differenzierer)

Statt Beschreibungen zu schreiben und Kategorien von Hand zuzuweisen, generiert KI sie aus deinen Produktdaten plus vertrauenswürdigen Web-Quellen:

  • Beschreibungen — kurz (Listings) und lang (Produktseiten), in deiner Markenstimme.
  • Kategorisierung — automatisch anhand von Attributen, Beschreibungen und Bildern.
  • Fehlende Attribute — aus Produktdaten und freigeschalteten Hersteller-Quellen.
  • Übersetzung — mehrsprachige Kataloge per DeepL.
  • Bilder — Hintergrund entfernen für saubere Marktplatzbilder; KI-Moodbilder, wenn Lieferantenfotos fehlen.

Entscheidend: Das im Bulk zu tun – und KI-Output immer zu prüfen, bevor er live geht.

Schritt 4 — In jeden Kanal ausspielen (Data Out)

Jeder Kanal hat eigene Regeln – Amazon braucht spezifische Bullet-Formate und Brand-Registry-Felder, OTTO ein eigenes Schema, dein Shop SEO-Text.

  • Direkte Integrationen (REST API): Shopify und Shopware zwei-Wege; ERPs wie Xentral und weclapp.
  • Feed-basierte Exporte (CSV/XML): Amazon, OTTO, Kaufland.
  • Kanalspezifische Transformationen: Suchen & Ersetzen, Attribute kombinieren ({{brand}} - {{title}} in {{color}}), Werte-Mapping (XLX-Large), Mathematik (Margenpreise).

Wie eine DIY-Anreicherungs-Pipeline funktioniert

Du brauchst kein PIM, um zu starten. Mit einem No-Code-Automatisierungstool kannst du dieselben Stufen selbst aneinanderreihen — sinnvoll für ein paar hundert bis ein paar tausend SKUs. Die Bausteine:

  • Ein Automatisierungstool (n8n, Make oder Zapier) als Orchestrator.
  • Ein Zwischenspeicher für die Daten — eine Tabelle oder einfache Datenbank als „Single Version".
  • Ein KI-Modell für die Anreicherung, DeepL für die Übersetzung und ein Freisteller-Dienst für Bilder.

Die Pipeline, Stufe für Stufe:

  1. Ingest — jeden Lieferanten-Feed (CSV, XML, FTP oder API) automatisch und zeitgesteuert ziehen.
  2. Normalisieren — die Spalten jedes Lieferanten auf deine Felder mappen und die Werte vereinheitlichen: z. B. werden „Colour", „Farbe" und „Var_1" alle dein eines Feld Farbe; 1,5 kg wird 1.5; eine EAN bleibt exakt als Text.
  3. Matchen — jede Zeile über SKU oder EAN mit deinem Katalog abgleichen: neu oder Update?
  4. Anreichern — die KI fehlende Beschreibungen schreiben und Kategorien zuordnen lassen, in Batches.
  5. Übersetzen — die Textfelder per DeepL in deine Zielmärkte bringen.
  6. Bilder — Hintergründe automatisch entfernen für saubere, marktplatzfertige Bilder.
  7. Veröffentlichen — die fertigen Daten in den Shop pushen oder als Feed für die Marktplätze exportieren.

Ein paar praktische Leitplanken:

  • Die KI in kleinen Batches verarbeiten und bei Fehlern erneut versuchen — Lieferanten-Feeds fallen manchmal aus.
  • Die KI-Anweisungen konsistent halten — kleine Wortänderungen verschieben den Output stark.
  • Einen manuellen „freigegeben?"-Schritt einbauen, damit nichts ungeprüft live geht.

Wo der DIY-Weg an Grenzen stößt

Der n8n-Aufbau ist top, um das Konzept zu beweisen – stößt aber beim Wachsen an Wände:

  • Keine Review-/Freigabe-Oberfläche für ein nicht-technisches Team – Marketing kann keinen Node-Graphen bedienen.
  • Bulk im großen Maßstab ist hart – 100.000+ SKUs bedeuten echtes Queueing, Fehlerbehandlung und Idempotenz, die du selbst bauen und warten musst.
  • Kein Audit-Trail – welches Feld war KI-generiert vs. vom Lieferanten? Später kaum nachvollziehbar.
  • Prompt- & Kontext-Management – Golden Examples, Prompts pro Attribut, Quellen-Whitelisting werden alle zu Custom Code.
  • Wartungslast – jede Lieferanten-Formatänderung, jeder API-Versionssprung, jeder neue Kanal ist Dev-Arbeit.

Die ehrliche Realität, die wir ständig hören: Die meisten Teams, die den reinen n8n-Weg gehen, bekommen am Ende etwas, das halb funktioniert – und „halb" ist der schlechteste Ort zum Stehenbleiben. Beispiel, ein Sporthändler, mit dem wir arbeiten: ~10.000 SKUs, eine n8n-Pipeline, an der sie wochenlang geschraubt hatten. Sie lief – Beschreibungen wurden generiert, Produkte syncten – aber das Ergebnis war nie konsistent genug zum Veröffentlichen. Schaft-Titel wie GT1D RH SPEEDER 40 R 9.0 parsten bei einem Lieferanten sauber in Flex/Hand/Loft-Attribute und beim nächsten zu Matsch; Beschreibungen lasen sich bei 80 % des Sortiments gut und beim Rest schlicht falsch; ein Attribut war in einem Batch sauber und im nächsten Müll. Am Ende hatten sie Daten, denen sie nicht trauen konnten, und besserten wieder Zeilen von Hand nach – genau das Problem, das sie eigentlich abschaffen wollten. Genau dann hörten sie auf, Skripte zu babysitten, und kamen zu uns – für ein System, das saubere, konsistente, veröffentlichungsfertige Daten liefert.

Wann stattdessen ein spezialisiertes PIM?

Ein PIM für Händler erledigt all das oben als Konfiguration statt Code – und ergänzt die Teile, die im DIY schmerzhaft sind:

  • Bulk-KI-Anreicherung mit eingebauter Review-Queue — nach tausenden Produkten filtern, AI Autofill laufen lassen, in einer Ansicht freigeben/verwerfen; KI-befüllte Felder mit Roboter-Icon markiert.
  • Konfigurierbarer Kontext — eigene Prompts pro Attribut, Golden Examples, URL-Whitelisting/Blacklisting – ohne Code.
  • Von Marketing bedienbar — nicht nur von Entwicklern.
  • Direkter Channel- + ERP-Sync — Shopify, Shopware, Xentral, weclapp plus Marktplatz-Feeds.

Productbay ist genau dafür gebaut – für Fachhändler mit Multi-Lieferanten-, Multi-Kanal-Katalogen, vom mittelständischen Betrieb bis zu großen Filialisten. KI-nativ ab Tag eins, schnell ausgerollt ohne die schweren IT-Projekte, die Enterprise-PIMs verlangen – und es kann ein bestehendes PIM als KI-Anreicherungsschicht ergänzen statt ersetzen.

DIY (n8n + LLM-API)Spezialisiertes PIM (z. B. Productbay)
Zeit bis zum ersten ErgebnisTage (wenn technisch)Einige Wochen (sauberes Setup)
Von Marketing bedienbarNeinJa
Review-/Freigabe-QueueSelbst bauenEingebaut
Skaliert auf 100k+ SKUsHartJa
WartungLaufende Dev-ArbeitVom Anbieter übernommen
Am besten fürPrototyping, kleine KatalogeHändler, die das produktiv betreiben

Häufige Fragen

Produktdaten anreichern — ohne Skript-Babysitting?

Sehen Sie in einer 30-minütigen Demo, wie Productbay Import, Anreicherung und Ausspielung für Ihren Katalog automatisiert.

Jetzt starten