Das Konzept ist bereit, visualisiert und damit einfach erklärbar.
Das Ziel ist, das Amtsblatt besser zu durchsuchen. Um dies zu bewerkstelligen ist es notwendig, strukturierte Daten aus de Amtsblatt zu extrahieren. So soll es für Urner Bürger möglich werden, gezielt kategorisch Eingegrenzt Suchabfragen abzusetzen.
Event finished
Verify
Unser Code ist öffentlich auf GitHub verfügbar: https://github.com/datahackdaysuri2023-amtsblatt
Get
Edited content version 37
Meine Suche führte mich zu einer bekannten Search Engine namens Apache Lucene. Sie bildet den Kern für ElasticSearch und ist frei verfügbar. Sobald die PDFs mal eingelesen und indexiert sind, können sie schnell und flexibel durchsucht werden.
Find
Wir konnten erfolgreich die Amtsblatt Daten der Eigentumsübertragungen mit Geo-Daten von https://map.geo.admin.ch anreichern.
Ask
Joined the team
Die ersten Strukturierten Daten konnten aus den Amtsblättern extrahiert werden.
Wir haben 2 Streams: - Mittels OpenAI / ChatGPT die Amtsblätter als Quelle zu verwenden, um damit Suchabfragen über ChatGPT durchführen zu können - Klassischer Ansatz die PDFs und dessen Struktur über einen Parser in strukturierte Daten zu verwandeln.
Edited content version 18
Joined the team
Event started
Edited content version 12