Das Konzept ist bereit, visualisiert und damit einfach erklärbar.
People | 3 | Posts | 12 | Dribs | 9 |
---|
Event finish
2 years ago
~
claudiospizzi
Prototype
Unser Code ist öffentlich auf GitHub verfügbar: https://github.com/datahackdaysuri2023-amtsblatt
2 years ago
~
saroua
Sketching
Research
Meine Suche führte mich zu einer bekannten Search Engine namens Apache Lucene. Sie bildet den Kern für ElasticSearch und ist frei verfügbar. Sobald die PDFs mal eingelesen und indexiert sind, können sie schnell und flexibel durchsucht werden.
2 years ago
~
saroua
Wir konnten erfolgreich die Amtsblatt Daten der Eigentumsübertragungen mit Geo-Daten von https://map.geo.admin.ch anreichern.
2 years ago
~
claudiospizzi
Project
JOINED
2 years ago
~
saroua
Die ersten Strukturierten Daten konnten aus den Amtsblättern extrahiert werden.
2 years ago
~
claudiospizzi
Wir haben 2 Streams:
- Mittels OpenAI / ChatGPT die Amtsblätter als Quelle zu verwenden, um damit Suchabfragen über ChatGPT durchführen zu können
- Klassischer Ansatz die PDFs und dessen Struktur über einen Parser in strukturierte Daten zu verwandeln.
2 years ago
~
claudiospizzi
JOINED
2 years ago
~
markusfroesch