Paperwork 2.0 ist da

Papierkram (noch besser) digitalisieren

31. Oktober 2020 | #paperwork #linux #software

Papierkram verwalten ist eine Sache, die man Computer überlassen lassen sollte: Einscannen, bestenfalls ein paar Metadaten ergänzen, vergessen – mehr Arbeit sollte kein Mensch in seine Zettelwirtschaft investieren müssen.

Der Rest ist eine Aufgabe für Software; das ist jedenfalls die Idee hinter Paperwork. Ich hab das Tool schon mal eher beiläufig erwähnt. Allerdings bin ich damals nicht ins Detail gegangen, weil der Funktionsumfang eher rudimentär und Paperwork somit eher etwas für, sagen wir mal, Enthusiasten war. Vor ein paar Tagen ist aber Version 2 erschienen und die kann sich wirklich sehen lassen.

Wie eingangs umrissen ist Paperwork ein Programm, um wichtige Schneckenpost-Sendungen zu archivieren. Dabei wird ein pragmatischer Ansatz verfolgt: Die Seiten werden in einem Rutsch gescannt, Text wird durchsuchbar gemacht (OCR ist das Stichwort) und auf Wunsch mit Schlagworten (Tags) versehen. Das reicht, um Dokumente im Bedarfsfall wieder hervorzukramen. Eine hochkomplexe Ablage ist ganz bewusst nicht vorgesehen – was auch okay ist, wenn man bedenkt, dass man 99% seiner Rechnungen nie wieder ansieht.

Als Alternative zum Scannen können auch PDF- oder Grafikdateien importiert und auf dieselbe Weise archiviert werden. Paperwork verwendet dafür übrigens keine ausgefeilte Datenbank, sondern legt alle Dokumente auf der Festplatte ab. Das macht es zumindest theoretisch denkbar, auch mit anderen Programmen auf das Dokumentenarchiv zuzugreifen.

 Links findet sich eine chronologische Liste aller Dokumente inklusive Volltextsuche. Im Hauptbereich wird das aktuell ausgewählte Dokument angezeigt. Auch exotische Papierformate sind kein Problem. Links können Schlagworte hinzugefügt oder das Datum des Dokuments angepasst werden. Versagt die automatische Texterkennung oder sollen Suchbegriffe ergänzt werden, werden diese unten links ergänzt und helfen später beim Wiederfinden.
Aufgeräumt: der neue Einstellungsdialog gibt sich übersichtlich, lässt aber auch keine Einstellungsmöglichkeiten vermissen. Paperwork 2.0 – die hier gezeigten Screenshots stammen von der Flatpak-Version.

Paperwork ist frei und quelloffen und lässt sich unter Windows, Linux und MacOS installieren. Unter Linux legt man am besten mit dem Flatpak-Paket los. Aber da Paperwork mittlerweile auch in einigen Distributionen vertreten ist (Debian, Ubuntu, Arch, Fedora), ist es nur eine Frage der Zeit, bis sich die neue Version auch über den Paketmanager installieren lässt.

Ich habe mittlerweile alle wichtigen Dokumente seit meiner Schulzeit digitalisiert und auf mehreren Datenträgen abgelegt und kann dieses Vorgehen nur empfehlen – wenn's drauf ankommt ist die Volltextsuche wirklich ein Traum!

Neuerungen in Version 2

Wer ältere Versionen kennt und unzufrieden war, sollte einen neuen Blick riskieren:

  • Das Scannen über den Dokumenteneinzug funktioniert endlich so, wie man es sich vorstellt (man muss nicht mehr vordefinieren, wie viele Seiten gescannt werden sollen)
  • PDF-Exporte verbrauchen deutlich weniger Speicher
  • PDF-Importe können wie Scans nachbearbeitet werden (Seiten drehen, zuschneiden usw.)
  • der Einstellungsdialog ist aufgeräumter
  • Es gibt ein neues mächtiges Command Line Interface

Links

Wer will, kann hier noch tiefer einsteigen:


(Artikelfoto von C M auf Unsplash)