Melde Vollzug, natürlich mittels einer forumskonformen Minimalvariante.


Nachdem das alte NAS mit dem Dateisystem ext4 aufgesetzt war und Docker Btrfs voraussetzt, musste ein zweites NAS her, auch, um örtliche getrennte Backups machen zu können. Eine Änderung des Dateisystems ist im laufenden Betrieb nicht möglich. Ich habe mich für ein RAID "SHR-2" entschieden, das heißt, hier bleiben 12 TB Kapazität übrig und zwei Platten dürfen ausfallen, ohne dass es zu einem Datenverlust kommt.





Brother ADS-1700W mit der Möglichkeit, direkt ins Netzwerk zu scannen: https://www.brother.at/scanner/ads-1700w





Auf dem NAS wird ein "gemeinsamer Ordner" namens Scanner angelegt, darin folgende Verzeichnisse:





Ebenso ein Benutzer, der nur dort Schreibrechte hat:





Dann wird Docker installiert, eine Virtualisierungslösung, für die es unzählige Pakete gibt:





Eines davon ist OCRmyPDF, das die Texterkennung vornimmt: https://ocrmypdf.readthedocs.io/en/latest/





Eine bequeme Verwaltungsoberfläche für all jene, die die Kommandozeile scheuen bietet SynOCR: https://www.cphub.net/?id=40&pid=821





Der Scanner bekommt ein Netzwerkziel auf dem NAS:




Dann legt man Dokumente ein und startet den Scan:




Es gibt dann zwei Möglichkeiten. Entweder startet man die Erkennung auf dem NAS manuell über das Paket SynOCR, oder man lässt das z.B. in der Nacht laufen und hat am nächsten Tag alle PDFs mit durchsuchbarem Text versehen.

Das Ergebnis anhand einer Rechnung:




Damit erübrigt sich im Endeffekt eine pingelige Ablage, da man jedes Dokument bzw. dessen Inhalt über die Suchfunktion des Betriebssystems findet.

Man könnte jetzt zusätzlich noch einen Paginierstempel einsetzen, den ganzen Papierkram nummerieren und chronologisch ablegen. Benötigt man etwas, sucht man nach Inhalt, findet im PDF die Nummer und weiß sofort, wo das Dokument ist.

Oder man nutzt z.b. Hazel von https://www.noodlesoft.com und sortiert die Scans automatisiert nach Inhalt in die gewünschten Verzeichnisse.

Da freut sich die alte Buchhalterseele!