top.webp

UMK

1About

Mit semantischer Suche den öffentlichen Zugang zu Informationen verbessern

Profil Software arbeitete mit der Stadt Krakau zusammen, um ihr öffentliches Informationsbulletin (BIP) zu verbessern, das über 1,6 Millionen Dokumente in verschiedenen Formaten (HTML, Word, PDF) enthält. Die bestehende Suchmaschine ermöglichte den Benutzern die Eingabe von Schlüsselwörtern und die Suche nach Dokumenten, aber sie erlaubte keine Fragen oder semantische Suche. Ziel des Projekts war die Implementierung einer semantischen Suchmaschine auf der Grundlage von Retrieval-Augmented Generation (RAG). Diese Lösung würde es den Nutzern ermöglichen, Fragen zu stellen und KI-generierte Antworten zu erhalten, zusammen mit den relevanten Dokumenten, die zur Formulierung der Antwort verwendet wurden, was einen intuitiveren und effizienteren Zugang zu öffentlichen Informationen bieten würde.

2
Industry
Civic Tech Software
Country
Polen
Partnership
7 months

2Herausforderung

Das Projekt war mit zwei großen Herausforderungen verbunden. Die riesige Menge an Dokumenten (über 1,6 Millionen) erforderte die Erstellung einer Vektordatenbank für effiziente Suchfunktionen. Die Verwaltung eines so großen Datensatzes erforderte eine robuste Infrastruktur und skalierbare Lösungen. Darüber hinaus entschied sich das Team für die Verwendung von Open-Source-Modellen, die auf individuell konfigurierter Hardware (GPUs) laufen sollten, anstatt sich auf vorgefertigte Lösungen von Anbietern wie OpenAI zu verlassen. Das zweite Problem war, dass viele KI-Modelle für Sprachen wie Englisch, Französisch oder Spanisch optimiert sind, aber weniger für Polnisch. Das bedeutete, dass das Team Modelle finden oder anpassen musste, die die Nuancen der polnischen Sprache effektiv handhaben konnten. Mit Hilfe eines Benchmarking-Prozesses wurde sichergestellt, dass die ausgewählten Modelle auch in Polnisch korrekt funktionieren.

challange.webp

3Lösung

Um diese Herausforderungen zu bewältigen, implementierte Profil Software einen vielschichtigen Ansatz. Das Team entwickelte einen Rahmen für kontinuierliches Benchmarking, bei dem verschiedene Komponenten der RAG-Anwendung (wie das LLM oder die Dateneinbettungsmodelle) auf Genauigkeit, Kontextrelevanz und Dokumentenabgleich getestet wurden. Dieser iterative Prozess sorgte für eine ständige Optimierung des Systems, um die Projektziele zu erreichen. Die Lösung wurde in einer Microservice-Architektur mit drei Kerndiensten aufgebaut: Web, NLP und ETL (Extract, Transform, Load), die alle auf Kubernetes gehostet werden. Dieser Ansatz ermöglichte die Bereitstellung sowohl auf der Cloud-Infrastruktur als auch auf den lokalen Servern der Stadt Krakau. Die Vektordatenbank wurde auf der Grundlage von PostgreSQL unter Verwendung der pgvector-Erweiterung erstellt, die im Kubernetes-Cluster gehostet wird. Diese Entscheidung senkte die Betriebskosten erheblich und gewährleistete gleichzeitig Flexibilität.Mit diesem umfassenden Ansatz lieferten wir eine hocheffiziente, skalierbare und kostengünstige KI-gestützte Suchlösung, die auf die einzigartigen Anforderungen des öffentlichen Informationssystems der Stadt Krakau zugeschnitten ist.

solution.webp
Icon

Lass uns reden!

Bei der Suche nach dem richtigen Team für deine Softwareentwicklung hilft dir Profil Software. Vereinbare einen Termin und sag uns, was du brauchst!

Andere Projekte

Tarot Routing Carousel

Tarot-Routing

Routenplanungs- und Optimierungssoftware

Tarot Routing nutzt hochmoderne Algorithmen, um effizientere Routen für die letzte Meile zu planen, schneller als Menschen es können. Die Kunden verkürzen ihre Fahrzeit um 30 % und reduzieren natürlich auch ihre CO₂-Emissionen, den Benzinverbrauch, die Fahrergehälter und die Wartungskosten.

case study
Tarot Routing Carousel