CSV-Lieferantenimport automatisch bereinigen: So sparen Händler Stunden pro Woche

CSV-Dateien von Lieferanten sehen einfach aus. In der Praxis macht es jeder Lieferant anders – und die Kosten der manuellen Bereinigung summieren sich auf Stunden jede Woche. So automatisieren Sie das.

Productbay Team17. März 20268 Min. Lesezeit
☝️Das Wichtigste in Kürze
  • CSV-Dateien von verschiedenen Lieferanten haben unterschiedliche Encodings, Trennzeichen, Spaltennamen und Datenformate – manuelle Bereinigung ist ohne Automatisierung unvermeidlich.
  • Die häufigsten Probleme: Encoding-Fehler (UTF-8 vs. Latin-1), inkonsistente Spaltenbezeichnungen, fehlende Pflichtfelder, doppelte SKUs, falsche Dezimaltrennzeichen.
  • Automatisierte Bereinigungsregeln, die beim Import angewendet werden, eliminieren dieselbe manuelle Arbeit jede Woche – einmal konfiguriert, für immer angewendet.
  • Productbay normalisiert, validiert und dedupliziert CSV-Daten von jedem Lieferanten bevor sie Ihren Katalog erreichen.

Warum CSV-Importe schwieriger sind als sie aussehen

CSV steht für „Comma-Separated Values" – aber in der Praxis verwenden Lieferanten-CSV-Dateien Semikolons, Tabulatoren und Pipe-Zeichen als Trennzeichen. Das Format ist einfach; die Realität ist es nicht. Das ERP-System jedes Lieferanten generiert CSV-Exporte nach eigener Logik, und das Ergebnis ist ein Format, das theoretisch standardisiert, aber praktisch über jede Datenquelle hinweg inkonsistent ist.

Für einen Händler, der Daten von 5 oder 10 Lieferanten empfängt, bedeutet das 5 oder 10 verschiedene Bereinigungsroutinen, die jedes Mal ausgeführt werden müssen, wenn eine neue Datei eintrifft. Multipliziert mit wöchentlichen Update-Zyklen ergibt das eine erhebliche, wiederkehrende Zeitverschwendung – die keinen Geschäftswert produziert, sondern nur den Betrieb aufrechterhält.

Die sechs häufigsten CSV-Probleme von Lieferanten

1. Encoding-Fehler: UTF-8 vs. Latin-1

Das ist das frustrierendste CSV-Problem für DACH-Händler, weil es unsichtbar ist, bis es Probleme verursacht. Deutsche Umlaute – ä, ö, ü, ß – werden in UTF-8 und Latin-1 (auch ISO-8859-1 genannt) unterschiedlich kodiert. Wenn eine in Latin-1 exportierte Datei von Ihrem Importsystem als UTF-8 gelesen wird, werden die Umlaute unleserlich: „Möbel" wird zu „Möbel", „Größe" wird zu „Größe".

Die Ursache ist, dass ältere ERP-Systeme – insbesondere ältere Versionen von SAP, Navision und deutscher Buchhaltungssoftware – standardmäßig Latin-1-Kodierung verwenden. Moderne Systeme nutzen UTF-8. Wenn ein Lieferant sein System aktualisiert, kann sich die Kodierung ohne Vorankündigung ändern und einen Importprozess unterbrechen, der jahrelang einwandfrei funktioniert hat.

Automatisierte Lösung: Encoding-Erkennung beim Import. Productbay erkennt automatisch, ob eine Datei UTF-8, Latin-1 oder eine andere Kodierung verwendet, und konvertiert sie korrekt – keine manuelle Vorverarbeitung erforderlich.

2. Inkonsistente Spaltennamen zwischen Lieferanten

Sie haben ein internes Produktattributschema. Ihre Lieferanten kennen es nicht und kümmern sich nicht darum. Lieferant A nennt es „Artikelnummer", Lieferant B „Art_Nr", Lieferant C „SKU", Lieferant D „ProductID". Alle vier meinen dasselbe – Ihr internes Feld „sku".

In einem manuellen Workflow erledigen Sie diese Übersetzung jedes Mal in Excel. In einem automatisierten Workflow definieren Sie das Mapping einmal pro Lieferant: „Artikelnummer" von Lieferant A wird auf „sku" gemappt. Von diesem Moment an verwendet jeder Import von Lieferant A dieses Mapping automatisch.

3. Fehlende Pflichtfelder

Lieferanten-CSV-Dateien lassen häufig Felder aus, die Ihr Shop benötigt – EAN-Codes, Produktkategorien, Gewicht oder Ursprungsland. Der Lieferant sammelt diese Daten einfach nicht, oder er fügt sie in einem anderen Feld ein, oder er teilt sie auf mehrere Spalten auf.

Automatisiertes Handling: Konfigurierbare Importregeln, die fehlende Pflichtfelder identifizieren und sie entweder aus abgeleiteten Daten befüllen (z.B. EAN-Prüfziffer berechnen, wenn sie fehlt), Standardwerte anwenden, wo angemessen, oder das Produkt vor der Veröffentlichung zur manuellen Ergänzung markieren.

4. Doppelte SKUs

Lieferantenkataloge enthalten oft doppelte Einträge – dieselbe SKU erscheint mehrmals mit leicht unterschiedlichen Daten. Das passiert, wenn Lieferanten mehrere Produktvarianten in einer Zeile haben, wenn sie nicht mehr aktive Produkte neben aktiven einschließen, oder einfach aufgrund von Datenfehlern in ihrem eigenen System.

Ohne Duplikaterkennung beim Import landen Sie mit widersprüchlichen Produktdatensätzen in Ihrem Katalog – verschiedene Preise, verschiedene Beschreibungen, verschiedene Lagerbestände für dieselbe SKU. Automatisierte Deduplizierung identifiziert diese Konflikte und behandelt sie nach konfigurierbaren Merge-Regeln, bevor sie Ihren Live-Katalog erreichen.

5. Falsche Dezimaltrennzeichen

Deutschland verwendet ein Komma als Dezimaltrennzeichen (1,99 €), während viele internationale Systeme einen Punkt verwenden (1.99). Wenn das System eines Lieferanten eine CSV mit Komma-Trennzeichen generiert und diese Datei Kommas sowohl als Feldtrennzeichen als auch als Dezimaltrennzeichen verwendet, sind die Daten kaputt: Ein Preis von „1,99" in einer kommagetrennnten CSV wird zu zwei Feldern – „1" und „99" – statt einem.

Das ist ein besonders schädlicher Fehler, weil er oft erste Format-Checks passiert, aber falsche Preise in Ihrem Katalog produziert. Automatisierte Normalisierung erkennt und korrigiert Dezimaltrennzeichen-Inkonsistenzen, bevor sie Preisfehler verursachen.

6. HTML und Formatierung in Textfeldern

Produktbeschreibungen von Lieferanten enthalten oft HTML-Tags (<p>, <br>, <strong>, &nbsp;), Sonderzeichen (&amp;, &uuml;) oder Formatierungsartefakte aus Textverarbeitungsprogrammen. Wenn Sie diese direkt in Ihren Shop veröffentlichen, erscheint das rohe HTML als sichtbarer Text – oder bricht das Layout.

Automatisiertes Bereinigen entfernt HTML-Tags, konvertiert HTML-Entities in korrekte Zeichen und normalisiert Leerzeichen, bevor Produktbeschreibungen Ihren Katalog erreichen.

Wie Productbay CSV-Bereinigung automatisiert

Die Import-Pipeline von Productbay wendet Bereinigungsregeln auf jeder Stufe automatisch an. Der Workflow:

  1. Encoding-Erkennung: Dateikodierung wird identifiziert und vor jeder Verarbeitung in UTF-8 konvertiert
  2. Trennzeichen-Erkennung: Das Trennzeichen der Datei (Komma, Semikolon, Tabulator) wird automatisch erkannt – keine Konfiguration notwendig
  3. Spalten-Mapping: Lieferantenspalten werden mit gespeicherten Lieferanten-Mappings auf Ihr internes Schema gemappt
  4. Datennormalisierung: Dezimaltrennzeichen, Datumsformate, Einheitenkonvertierungen und Wertnormalisierung werden angewendet
  5. Textbereinigung: HTML-Tags entfernt, Entities dekodiert, Leerzeichen normalisiert
  6. Duplikaterkennung: SKU- und EAN-Deduplizierung mit konfigurierbarem Merge-Verhalten
  7. Validierung: Pflichtfelder, Formatprüfungen und benutzerdefinierte Regeln – nicht bestehende Produkte werden zur Prüfung in die Warteschlange gestellt

All das passiert automatisch, jedes Mal. Die Regeln, die Sie für einen Lieferanten beim ersten Import konfigurieren, gelten weiterhin bei jedem nachfolgenden Import von diesem Lieferanten – ohne manuellen Eingriff.

Praktische Tipps für den Umgang mit Lieferanten-CSV-Dateien

  • Bitten Sie immer um UTF-8-Kodierung von Lieferanten, wenn Sie Einfluss auf deren Exporteinstellungen haben – das eliminiert die häufigste Quelle von Importfehlern.
  • Fragen Sie nach konsistenten Spaltenüberschriften in jedem Export. Auch wenn sich das Datenformat ändert, ermöglichen konsistente Überschriften die korrekte Anwendung Ihrer Mapping-Regeln.
  • Öffnen Sie Lieferanten-CSV-Dateien niemals vor dem Import in Excel – Excel konvertiert EAN-Codes (die wie große Zahlen aussehen) oft in wissenschaftliche Notation und beschädigt die Daten dauerhaft.
  • Testen Sie Ihre Import-Pipeline mit Grenzfällen: Leere Zeilen, Produkte mit nur teilweisen Daten und Preisfelder mit verschiedenen Formaten sind häufige Schwachpunkte bei manuellen Prozessen.

Die Geschäftslogik für Automatisierung

Manuelle CSV-Bereinigung für einen Händler mit 5 Lieferanten und wöchentlichen Update-Zyklen dauert typischerweise 2–4 Stunden pro Lieferant pro Woche. Das sind 10–20 Stunden pro Woche reiner Overhead – kein Mehrwert geschaffen, nur Daten von einem Format in ein anderes übertragen.

Mit automatisierten PIM-Import-Pipelines werden diese 10–20 Stunden null. Dieselbe Bereinigungslogik, die Ihr Team jede Woche manuell anwendet, läuft automatisch, korrekt, jedes Mal – ohne das Risiko menschlicher Fehler, ohne Zeitkosten und ohne die Frustration, Encoding-Fehler kurz vor einem Produktstart zu entdecken.

Das Ziel ist nicht, CSV-Dateien schneller zu bereinigen. Das Ziel ist, CSV-Dateien nie wieder manuell zu bereinigen. Automatisierung wandelt wiederkehrende Zeitkosten in eine einmalige Konfiguration um.

Häufige Fragen

CSV-Importe jetzt automatisieren

Productbay bereinigt, normalisiert und validiert CSV-Importe von jedem Lieferanten automatisch. Demo kostenlos buchen.

Jetzt starten