Unser Code ist öffentlich auf GitHub verfügbar: https://github.com/datahackdaysuri2023-amtsblatt
Experience
Dribs
Meine Suche führte mich zu einer bekannten Search Engine namens Apache Lucene. Sie bildet den Kern für ElasticSearch und ist frei verfügbar. Sobald die PDFs mal eingelesen und indexiert sind, können sie schnell und flexibel durchsucht werden.
2 years ago