Archiv verlassen und diese Seite im Standarddesign anzeigen : Dokumentenverwaltung privat
Hypophyse
18.08.2019, 18:38
Werte Gemeinde,
diverse Schreiben und Rechnungen sammeln sich bei mir auf/unter/zwischen diversen Papierbergen und einmal jährlich bringe ich augenrollend Ordnung ins Chaos. Das muss einfacher gehen.
Aktuell schwanke ich zwischen der forumskonformen Anschaffung eines Dokumentenscanners, der per OCR auch durchsuchbare PDFs erstellt sowie mit beid-/mehrseitigen Dokumenten umgehen kann und einer Minimallösung via Scansoftware auf dem iPhone.
Habt ihr dafür einen funktionierenden Workflow? Ein NAS als Datengrab wäre vorhanden.
:dr:
https://www.kofax.de/products/paperport
peterlicht
18.08.2019, 18:58
https://www.dropbox.com/de/features/productivity/doc-scanner-app
Tipp aus dem Forum, wenn man viel scannen muss: Fujitsu Snapscan iX 500. Scannt doppelseitig, ist schnell und kann durchsuchbare pdfs erzeugen. Oder Du machst es mit Handy und App, z.B. Office Lens, Notizen o.ä..
Herr Vorragend
18.08.2019, 19:29
Roland, forumskonform wirst du dir für diese lästige Arbeit doch wohl eine Sekretärin einstellen. Pfff - selber scannen. 8o
Tatsächlich sind Buchhaltungs-/Sekretariatsservices günstiger als man denkt. Wäre jetzt auch mein Tipp gewesen. Wenn da einmal im Quartal zwei bis drei Stunden zusammenkommen, hast Du schon echt viel Zeug ;)
Beim Ersttermin besprechen was man wie haben möchte - fertig.
uhrenfanatiker
18.08.2019, 20:58
Roland, forumskonform wirst du dir für diese lästige Arbeit doch wohl eine Sekretärin einstellen. Pfff - selber scannen. 8o
und natürlich eine weitere Sekretärin zum späteren Raussuchen der Dokumente. Pfff - selber suchen. 8o :tongue:
Hier auf Mac ist es Devonthink Pro Office in Verbindung mit einem Fujitsu ix500 - bin sehr zufrieden.
John Wayne
18.08.2019, 21:44
Scanner mit OCR und dann nutze ich Hazel von Noodlesoft um die PDFs auf Grundlage ihres Inhaltes automatisch zu benennen und entsprechend abzulegen.
Hier auf Mac ist es Devonthink Pro Office in Verbindung mit einem Fujitsu ix500 - bin sehr zufrieden.
Ein Kollege hat auch Devonthink in Verbindung mit einem Snapscan im Einsatz. Schon seit Jahren, von der Software ist er sehr angetan.
avalanche
18.08.2019, 22:47
Wieso willst du dir das antun? Ich hab hier eine .doc mit allen Kündigungsdaten meiner Versicherungen. Wiederholende Zahlungen laufen über Dauerauftrag. Wenn es zu Unstimmigkeiten kommt, fordere ich den Vertragspartner dazu auf, mir die Unterlagen zuzustellen :grb:
Wirklich wichtige Unterlagen werfe ich in eine Holzbox von Rokker :D
Ich habe einen ix500 und scanne einfach alles ein, dann dem Dokument einen Namen geben der mit dem Datum anfängt und den Inhalt möglichst deutlich macht und auf dem Mac in einen Ordner der mit der cloud synchronisiert ist. Habe von überall Zugriff und bin nicht von Datenbanken oder Softwarelösungen abhängig. Wichtig ist ein guter Scanner, das muss schnell und einfach gehen.
Hypophyse
19.08.2019, 00:16
https://www.kofax.de/products/paperport
Hier auf Mac ist es Devonthink Pro Office in Verbindung mit einem Fujitsu ix500 - bin sehr zufrieden.
Danke, schau ich mir beides an.
Offenbar bietet kein Scanner die Möglichkeit, die Texterkennung selbst vorzunehmen und das Ergebnis auf einem NAS zu speichern.
https://www.dropbox.com/de/features/productivity/doc-scanner-app
Eine Cloud kommt nicht infrage. :dr:
Tipp aus dem Forum, wenn man viel scannen muss: Fujitsu Snapscan iX 500. Scannt doppelseitig, ist schnell und kann durchsuchbare pdfs erzeugen.
Anscheinend nur, wenn gleichzeitig die Software auf dem Mac läuft. Das gilt auch für Brother-Geräte. Lieber wäre mir ja ein Knopfdruck auf dem Scanner mit automatischer NAS-Speicherung (inkl. OCR).
Roland, forumskonform wirst du dir für diese lästige Arbeit doch wohl eine Sekretärin einstellen. Pfff - selber scannen. 8o
Mistress says no. :D
Scanner mit OCR und dann nutze ich Hazel von Noodlesoft um die PDFs auf Grundlage ihres Inhaltes automatisch zu benennen und entsprechend abzulegen.
Auch ein interessanter Weg, danke für den Tipp.
anguirel
19.08.2019, 09:40
Wenn die Geräte direkt auf das NAS scannen können, wäre evtl. eine nachträgliche Bearbeitung OCRmyPDF (https://ocrmypdf.readthedocs.io/en/latest/) im Docker container auf deiner Synology eine Lösung.
Das Thema beschäftigt mich auch schon etwas länger und aktuell nutze ich ebenfalls den Weg über macOS mit Hazel.
Ich nutze seit einem Jahr den Fujitsu ix500 und bin auch sehr zufrieden.
Natürlich muss man den Mac/PC laufen haben, das empfinde ich aber nicht als Nachteil, da ich die Dokumente ja sowieso nochmals umbenennen und ablegen möchte.
Hypophyse
19.08.2019, 10:33
Wenn die Geräte direkt auf das NAS scannen können, wäre evtl. eine nachträgliche Bearbeitung OCRmyPDF (https://ocrmypdf.readthedocs.io/en/latest/) im Docker container auf deiner Synology eine Lösung.
Danke, darüber bin ich auch schon gestolpert. Das wäre die eleganteste Lösung, erfordert aber Btrfs. Aktuell nutze ich ext4.
Huch, wieso braucht man dafür ein anderes Filesystem? Nutzt die Software spezielle Features von Btrfs?
Hypophyse
19.08.2019, 10:57
Einer der Vorteile von Btrfs sind die vielfältigen Virtualisierungsmöglichkeiten. Docker setzt es voraus.
https://www.synology.com/de-de/dsm/feature/docker
Naja. Ich brauch eh ein zweites NAS, da kann ich das auch gleich umstellen. :weg:
anguirel
19.08.2019, 12:57
Gerade gesehen, dass es für OCRmyPDF auch eine GUI über den Synology Paketmanager gibt: synOCR.
Alternativ das Ganze auf einem RaspberryPi laufen lassen...
Natürlich muss man den Mac/PC laufen haben, das empfinde ich aber nicht als Nachteil, da ich die Dokumente ja sowieso nochmals umbenennen und ablegen möchte.
Wenn die PDF durchsuchbar sind, warum denn noch den Dateinamen umbenennen? Da reicht doch der Zeitstempel des scannens und eine fortlaufende Nummer, oder?
Suche ich den Aldi Kassenzettel von August 2017, dann trage ich diese Begriffe in das Suchfeld des Finders ein.
Ja, ich möchte die PDF aber noch meinem eigenen System benennen und strukturiert in Ordner anlegen.
Übrigens erkennt die neue Scansoftware von Fujitsu das Datum auf dem Beleg und den Bereff. Funktioniert sehr gut..
Hypophyse
08.09.2019, 14:57
Melde Vollzug, natürlich mittels einer forumskonformen Minimalvariante. :gut:
Nachdem das alte NAS mit dem Dateisystem ext4 aufgesetzt war und Docker Btrfs voraussetzt, musste ein zweites NAS her, auch, um örtliche getrennte Backups machen zu können. Eine Änderung des Dateisystems ist im laufenden Betrieb nicht möglich. Ich habe mich für ein RAID "SHR-2" entschieden, das heißt, hier bleiben 12 TB Kapazität übrig und zwei Platten dürfen ausfallen, ohne dass es zu einem Datenverlust kommt.
http://oysterreich.net/Dokumentenscanner-01.jpg
Brother ADS-1700W mit der Möglichkeit, direkt ins Netzwerk zu scannen: https://www.brother.at/scanner/ads-1700w
http://oysterreich.net/Dokumentenscanner-02.jpg
Auf dem NAS wird ein "gemeinsamer Ordner" namens Scanner angelegt, darin folgende Verzeichnisse:
http://oysterreich.net/Dokumentenscanner-03.png
Ebenso ein Benutzer, der nur dort Schreibrechte hat:
http://oysterreich.net/Dokumentenscanner-04.png
Dann wird Docker installiert, eine Virtualisierungslösung, für die es unzählige Pakete gibt:
http://oysterreich.net/Dokumentenscanner-05.png
Eines davon ist OCRmyPDF, das die Texterkennung vornimmt: https://ocrmypdf.readthedocs.io/en/latest/
http://oysterreich.net/Dokumentenscanner-06.png
Eine bequeme Verwaltungsoberfläche für all jene, die die Kommandozeile scheuen bietet SynOCR: https://www.cphub.net/?id=40&pid=821
http://oysterreich.net/Dokumentenscanner-07.png
Der Scanner bekommt ein Netzwerkziel auf dem NAS:
http://oysterreich.net/Dokumentenscanner-08.png
Dann legt man Dokumente ein und startet den Scan:
http://oysterreich.net/Dokumentenscanner-09.jpg
Es gibt dann zwei Möglichkeiten. Entweder startet man die Erkennung auf dem NAS manuell über das Paket SynOCR, oder man lässt das z.B. in der Nacht laufen und hat am nächsten Tag alle PDFs mit durchsuchbarem Text versehen.
Das Ergebnis anhand einer Rechnung:
http://oysterreich.net/Dokumentenscanner-10.png
Damit erübrigt sich im Endeffekt eine pingelige Ablage, da man jedes Dokument bzw. dessen Inhalt über die Suchfunktion des Betriebssystems findet.
Man könnte jetzt zusätzlich noch einen Paginierstempel einsetzen, den ganzen Papierkram nummerieren und chronologisch ablegen. Benötigt man etwas, sucht man nach Inhalt, findet im PDF die Nummer und weiß sofort, wo das Dokument ist.
Oder man nutzt z.b. Hazel von https://www.noodlesoft.com und sortiert die Scans automatisiert nach Inhalt in die gewünschten Verzeichnisse.
Da freut sich die alte Buchhalterseele! :jump:
Sehr cool gelöst, danke für das „Tutorial“. Gefällt mir gut, nur die nicht vorhandene Sortierung würde mir Sorgen machen. Da liegen ja irgendwann zigtausend Dokumente mit kryptischen Namen. Kann man das nicht irgendwie optimieren? Kann die OCR Software das nicht intelligent benennen?
Gerade beim erstmaligen Anlegen wird das richtig heftig.
Sortierung hin oder her, das gefällt mir. Könnte mein Winterprojekt werden :gut:
Hypophyse
08.09.2019, 15:52
SynOCR kann das, aber natürlich nicht perfekt. Dessen Hauptaufgabe ist es, sich die Einstellungen zusammenklicken zu können. Für alles Weitere würde ich auf Hazel setzen, aber das habe ich noch nicht getestet.
12 TB?
Was willst du denn alles scannen.
Hypophyse
08.09.2019, 21:46
Alles! :D
Spacewalker
08.09.2019, 21:54
Ich habe mich für ein RAID "SHR-2" entschieden, das heißt, hier bleiben 12 TB Kapazität übrig und zwei Platten dürfen ausfallen, ohne dass es zu einem Datenverlust kommt.
Sind die Platten auch außerhalb des NAS noch auslesbar, falls der Raid-Controller ausfällt? (Leider schon erlebt.)
Hypophyse
08.09.2019, 22:02
Ja, mit Ubuntu: https://www.synology.com/en-global/knowledgebase/DSM/tutorial/Storage/How_can_I_recover_data_from_my_DiskStation_using_a _PC
Sobald alles eingerichtet ist, wird das gesamte System auf einem zweiten NAS gesichert und dieses steht dann nicht daheim, sondern wird übers Netz synchronisiert.
avalanche
08.09.2019, 22:06
Bist du der neue Datenverantwortliche der ÖVP :bgdev: :D
slimshady
08.09.2019, 22:21
:rofl::rofl:
Hypophyse
08.09.2019, 22:35
Mein Name ist Reiss. Wolf Reiss.
avalanche
08.09.2019, 22:48
:D
Hypophyse
09.09.2019, 00:07
Da liegen ja irgendwann zigtausend Dokumente mit kryptischen Namen. Kann man das nicht irgendwie optimieren? Kann die OCR Software das nicht intelligent benennen?
Hazel kann genau das: https://vimeo.com/68593663
Sehr gut! Vielen Dank, für die Information!
Hazel kann genau das: https://vimeo.com/68593663
8o8o8o
:verneig: danke.
Das ist wirklich genial.
Powered by vBulletin® Version 4.2.5 Copyright ©2025 Adduco Digital e.K. und vBulletin Solutions, Inc. Alle Rechte vorbehalten.