Das Konzept ist bereit, visualisiert und damit einfach erklärbar.
Das Ziel ist, das Amtsblatt besser zu durchsuchen. Um dies zu bewerkstelligen ist es notwendig, strukturierte Daten aus de Amtsblatt zu extrahieren. So soll es für Urner Bürger möglich werden, gezielt kategorisch Eingegrenzt Suchabfragen abzusetzen.
Event finish
Prototype
Unser Code ist öffentlich auf GitHub verfügbar: https://github.com/datahackdaysuri2023-amtsblatt
Sketching
Research
Meine Suche führte mich zu einer bekannten Search Engine namens Apache Lucene. Sie bildet den Kern für ElasticSearch und ist frei verfügbar. Sobald die PDFs mal eingelesen und indexiert sind, können sie schnell und flexibel durchsucht werden.
Wir konnten erfolgreich die Amtsblatt Daten der Eigentumsübertragungen mit Geo-Daten von https://map.geo.admin.ch anreichern.
Project
Joined the team
Die ersten Strukturierten Daten konnten aus den Amtsblättern extrahiert werden.
Wir haben 2 Streams:
- Mittels OpenAI / ChatGPT die Amtsblätter als Quelle zu verwenden, um damit Suchabfragen über ChatGPT durchführen zu können
- Klassischer Ansatz die PDFs und dessen Struktur über einen Parser in strukturierte Daten zu verwandeln.
Joined the team
Start
Data Hackdays Uri 2023
Bedarf an Alterswohnungen