Seite 2 von 2 ErsteErste 12
Ergebnis 21 bis 35 von 35
  1. #21
    Freccione Avatar von blarch
    Registriert seit
    12.05.2007
    Ort
    Schweiz
    Beiträge
    6.689
    Ja, ich möchte die PDF aber noch meinem eigenen System benennen und strukturiert in Ordner anlegen.

    Übrigens erkennt die neue Scansoftware von Fujitsu das Datum auf dem Beleg und den Bereff. Funktioniert sehr gut..
    Gruss Wolfgang
    _______________________________________________

  2. #22
    Mil-Sub Avatar von Hypophyse
    Registriert seit
    10.08.2008
    Ort
    Oysterreich
    Beiträge
    12.438
    Themenstarter
    Melde Vollzug, natürlich mittels einer forumskonformen Minimalvariante.


    Nachdem das alte NAS mit dem Dateisystem ext4 aufgesetzt war und Docker Btrfs voraussetzt, musste ein zweites NAS her, auch, um örtliche getrennte Backups machen zu können. Eine Änderung des Dateisystems ist im laufenden Betrieb nicht möglich. Ich habe mich für ein RAID "SHR-2" entschieden, das heißt, hier bleiben 12 TB Kapazität übrig und zwei Platten dürfen ausfallen, ohne dass es zu einem Datenverlust kommt.





    Brother ADS-1700W mit der Möglichkeit, direkt ins Netzwerk zu scannen: https://www.brother.at/scanner/ads-1700w





    Auf dem NAS wird ein "gemeinsamer Ordner" namens Scanner angelegt, darin folgende Verzeichnisse:





    Ebenso ein Benutzer, der nur dort Schreibrechte hat:





    Dann wird Docker installiert, eine Virtualisierungslösung, für die es unzählige Pakete gibt:





    Eines davon ist OCRmyPDF, das die Texterkennung vornimmt: https://ocrmypdf.readthedocs.io/en/latest/





    Eine bequeme Verwaltungsoberfläche für all jene, die die Kommandozeile scheuen bietet SynOCR: https://www.cphub.net/?id=40&pid=821





    Der Scanner bekommt ein Netzwerkziel auf dem NAS:




    Dann legt man Dokumente ein und startet den Scan:




    Es gibt dann zwei Möglichkeiten. Entweder startet man die Erkennung auf dem NAS manuell über das Paket SynOCR, oder man lässt das z.B. in der Nacht laufen und hat am nächsten Tag alle PDFs mit durchsuchbarem Text versehen.

    Das Ergebnis anhand einer Rechnung:




    Damit erübrigt sich im Endeffekt eine pingelige Ablage, da man jedes Dokument bzw. dessen Inhalt über die Suchfunktion des Betriebssystems findet.

    Man könnte jetzt zusätzlich noch einen Paginierstempel einsetzen, den ganzen Papierkram nummerieren und chronologisch ablegen. Benötigt man etwas, sucht man nach Inhalt, findet im PDF die Nummer und weiß sofort, wo das Dokument ist.

    Oder man nutzt z.b. Hazel von https://www.noodlesoft.com und sortiert die Scans automatisiert nach Inhalt in die gewünschten Verzeichnisse.

    Da freut sich die alte Buchhalterseele!
    — Roland —

  3. #23
    Freccione Avatar von ReneS
    Registriert seit
    07.09.2010
    Ort
    Niederbayern
    Beiträge
    6.604
    Blog-Einträge
    10
    Sehr cool gelöst, danke für das „Tutorial“. Gefällt mir gut, nur die nicht vorhandene Sortierung würde mir Sorgen machen. Da liegen ja irgendwann zigtausend Dokumente mit kryptischen Namen. Kann man das nicht irgendwie optimieren? Kann die OCR Software das nicht intelligent benennen?

    Gerade beim erstmaligen Anlegen wird das richtig heftig.

    Sortierung hin oder her, das gefällt mir. Könnte mein Winterprojekt werden
    Viele Grüße
    René

    Next Hublot incoming!

  4. #24
    Mil-Sub Avatar von Hypophyse
    Registriert seit
    10.08.2008
    Ort
    Oysterreich
    Beiträge
    12.438
    Themenstarter
    SynOCR kann das, aber natürlich nicht perfekt. Dessen Hauptaufgabe ist es, sich die Einstellungen zusammenklicken zu können. Für alles Weitere würde ich auf Hazel setzen, aber das habe ich noch nicht getestet.
    — Roland —

  5. #25
    Yacht-Master Avatar von natas78
    Registriert seit
    13.04.2009
    Ort
    Düsseldorf
    Beiträge
    2.044
    12 TB?
    Was willst du denn alles scannen.

  6. #26
    Mil-Sub Avatar von Hypophyse
    Registriert seit
    10.08.2008
    Ort
    Oysterreich
    Beiträge
    12.438
    Themenstarter
    Alles!
    — Roland —

  7. #27
    Moderator Avatar von Spacewalker
    Registriert seit
    16.07.2008
    Ort
    Fox Club West Chapter
    Beiträge
    11.183
    Zitat Zitat von Hypophyse Beitrag anzeigen
    Ich habe mich für ein RAID "SHR-2" entschieden, das heißt, hier bleiben 12 TB Kapazität übrig und zwei Platten dürfen ausfallen, ohne dass es zu einem Datenverlust kommt.
    Sind die Platten auch außerhalb des NAS noch auslesbar, falls der Raid-Controller ausfällt? (Leider schon erlebt.)
    Gruß, Stefan


    Gendern ist ... wenn ein Sachse mit dem Boot umkippt.

  8. #28
    Mil-Sub Avatar von Hypophyse
    Registriert seit
    10.08.2008
    Ort
    Oysterreich
    Beiträge
    12.438
    Themenstarter
    Ja, mit Ubuntu: https://www.synology.com/en-global/k...ion_using_a_PC

    Sobald alles eingerichtet ist, wird das gesamte System auf einem zweiten NAS gesichert und dieses steht dann nicht daheim, sondern wird übers Netz synchronisiert.
    — Roland —

  9. #29
    Gesperrter User
    Registriert seit
    15.01.2009
    Beiträge
    8.006
    Bist du der neue Datenverantwortliche der ÖVP

  10. #30
    Day-Date Avatar von slimshady
    Registriert seit
    05.09.2006
    Beiträge
    3.878
    Christian

    Die halbe Miete ist die halbe Miete.

  11. #31
    Mil-Sub Avatar von Hypophyse
    Registriert seit
    10.08.2008
    Ort
    Oysterreich
    Beiträge
    12.438
    Themenstarter
    Mein Name ist Reiss. Wolf Reiss.
    — Roland —

  12. #32
    Gesperrter User
    Registriert seit
    15.01.2009
    Beiträge
    8.006

  13. #33
    Mil-Sub Avatar von Hypophyse
    Registriert seit
    10.08.2008
    Ort
    Oysterreich
    Beiträge
    12.438
    Themenstarter
    Zitat Zitat von ReneS Beitrag anzeigen
    Da liegen ja irgendwann zigtausend Dokumente mit kryptischen Namen. Kann man das nicht irgendwie optimieren? Kann die OCR Software das nicht intelligent benennen?
    Hazel kann genau das: https://vimeo.com/68593663
    — Roland —

  14. #34
    Explorer
    Registriert seit
    13.09.2010
    Ort
    LC 838 und LC 888
    Beiträge
    187
    Sehr gut! Vielen Dank, für die Information!

  15. #35
    Freccione Avatar von ReneS
    Registriert seit
    07.09.2010
    Ort
    Niederbayern
    Beiträge
    6.604
    Blog-Einträge
    10
    Zitat Zitat von Hypophyse Beitrag anzeigen
    Hazel kann genau das: https://vimeo.com/68593663


    danke.

    Das ist wirklich genial.
    Viele Grüße
    René

    Next Hublot incoming!

Ähnliche Themen

  1. Antworten: 6
    Letzter Beitrag: 30.09.2018, 17:22
  2. PAM 289 von privat
    Von ehemaliges mitglied im Forum Officine Panerai
    Antworten: 10
    Letzter Beitrag: 28.05.2013, 08:47
  3. Import von Privat aus USA
    Von hotknife im Forum Rolex - Haupt-Forum
    Antworten: 7
    Letzter Beitrag: 21.07.2004, 00:15

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •