Betrugserkennung in Auktionsdaten

mittels Vektoranalyse und KI-Validierung

Version 1.0 — September 2025

1. Executive Summary

Dieses Whitepaper stellt ein vollautomatisches System zur Erkennung von Bieterkollusion in Online-Auktionen vor – basierend auf Pinecone Vektor-Similarity-Search und LLaMA 3.3 über Groq.

Erreichte Leistung (statische Testdaten):

  • Recall: 60,0 % (9 von 15 kollusiven Paaren erkannt)
  • Optimale Hyperparameter automatisch via Grid Search
  • False Positives durch KI-Validierung massiv reduziert
graph TD A[Auktionsdaten] --> B[Vektorisierung] B --> C[Pinecone Index] D[Query LowBet<br/>Query HighBet] --> E[Vektorisierung] E --> C C --> F[Similarity Search] F --> G[Paaranalyse + Grid Search] G --> H[Verdächtige Paare] H --> I[LLaMA 3.3 Validierung] I --> J[Finale Report-Liste] style J fill:#0050b3,stroke:#fff,color:#fff

2. Architektonisches Framework

Das System basiert auf einer dreistufigen Pipeline:

Architektur der Betrugserkennung

3. Grid Search Optimierung

graph TD A[Parameter-Raster] --> B[S_Threshold: 0.35, 0.33, 0.30, 0.28, 0.25] A --> C[A_Threshold: 2, 3] B --> D[Test auf Ground Truth] C --> D D --> E[Recall berechnen] E --> F[Beste Kombination<br/>S=0.35 / A=2] style F fill:#27ae60,color:white

3.4 Ergebnisse

ParameterRecallTrue PositivesFalse Positives
S=0.35 / A=2 (optimal)60,0 %9 / 1512
S=0.30 / A=253,3 %8 / 1518
S=0.35 / A=346,7 %7 / 156

4. KI-Validierung mit LLaMA 3.3

„Bewerte das folgende Bieterpaar auf Kollusionswahrscheinlichkeit. Begründe in einem Satz.“

Ergebnis: 9 Paare hochverdächtig · 12 Paare unverdächtig → starke Reduktion der False Positives

Loading

0% geladen...