Texterkennung (OCR) bei alten HP-Scannern
Einer der Gründe, warum ich mir vor Jahren wieder ein Multifunktionsgerät von Hewlett-Packard gekauft habe, war die OCR-Funktion. In der mitgelieferten Software ließ sich kinderleicht einstellen, dass man gescannte Texte automatisiert erkennen lassen konnte. Sehr hilfreich bei der Ablage von Unterlagen, die dann gleichzeitig auch durchsuchbar und zur Weiterverarbeitung geeignet waren!
Leider hat HP die entsprechende Software in Flash gebastelt. Zumindest die Oberfläche, welche die verschiedenen Tools aufruft. Und mit der endgültigen Einstellung von Flash durch Adobe und der automatisierten Deinstallation auf den verschiedenen Betriebssystemen, war das dann nicht mehr nutzbar. Als Ersatz bietet HP das Tool „HP Scan Extended“ an – welches allerdings leider alles andere als „erweitert“ ist. Es bietet nämlich keine Texterkennung. Der Rest der Funktionen funktioniert allerdings ziemlich fluffig und ohne Einschränkungen. Aber Texterkennung war halt ein entscheidender Kaufgrund. Und ich möchte ungern Geld ausgeben, weil ein Hersteller eine Funktion per Software deaktiviert, obwohl die Hardware wunderbar in Ordnung ist (bis auf den Drucker, der ist verreckt).
Ich habe dann aus Langeweile ein wenig die vom originalen Setup mitgelieferten Ordner und Dateien durchgeschaut und bin auf den Pfad „C:\Program Files (x86)\HP\Digital Imaging\DocProc“ gestoßen. Das hörte sich interessant an. Dort findet man die Datei „hpDocCvt.exe“ und das hört sich doch schon sehr nach HP Document Convert an.
Flugs gestartet und man bekommt eine kleine Programmoberfläche zu sehen, in welcher man Quelldateien und Zieldatei auswählen kann. Und einen Button „OCR-Optionen“. Hm, klingt gut. Also schnell ein ohne OCR gescanntes PDF als Quelle ausgewählt und die gleiche Datei als Ziel gesetzt. Danach geschwind auf „Erstellen“ geklickt und die Texterkennung nebst anschließendem Abspeichern in der ausgewählten Datei startet. Hat bisher immer einwandfrei geklappt. Leider ist es immer noch deutlich umständlicher als mit der ursprünglich mitgelieferten Lösung, aber ein etwas umständliches OCR ist besser als kein OCR.
Schreibe einen Kommentar