iOCR – PDF-OCR Engine für AutoOCR / Alfresco
Neben ABBYY FineReader der sicherlich besten und leistungsfähigsten OCR Engine haben wir jetzt auch eine weitere OCR Engine im Portfolio. iOCR ist in der Lage direkt aus TIFF Images durchsuchbare PDF´s zu erzeugen. Auch bei dieser Lösung bleibt das gescannte Image in seiner Original Darstellung erhalten wobei im “Hintergrund” der per OCR erkannte Text eingefügt wird. Damit werden gescannte Dokumente sofort jeder Volltextsuchengie zugänglich.
Vorteile:
- Commandline Anwendung – die OCR Engine läßt sich dadurch sehr einfach integrieren. Z.b.: Kann iOCR “Out of the Box” als “Plugin” Zusatz zum Alfresco ECM/DMS System installiert werden. Der OCR Prozess zur Konvertierung von TIFF Images in durchsuchbare PDF´s wird angestoßen sobald eine TIFF Datei in einem bestimmten Ordner abgelegt wird. Unmittelbar danach wird das PDF volltext indexiert und kann über seinen Inhalt gesucht und wieder gefunden werden.
- iOCR basiert auf Tiger OCR einer unglaublich schnellen und hoch performanten OCR Komponente. Unsere Tests und Erfahrungen zeigen dass die iOCR Performance eine der schnellsten momentan verfügbaren Lösungen darstellt. Eine hohe Performance hat wesentliche Bedeutung wenn in kurzer Zeit eine große Menge an Images Bestände und durchsuchbar gemacht werden muss.
- iOCR ist sehr kompakt und “schlank” – das Setup ist nur 5MB groß, die Anwendung braucht keine großen Rechnerressourcen.
- Die wichtigsten europäischen Sprachen (Engl, Deutsch, Franz, Schwed, Span, Dän, Ital, Port, Holländisch) werde mit guten Erkennungsgenauigkeit verarbeitet.
- Verschiedene Text und Image Komprimierungs-Einstelllungen ermöglichen kompakte PDF Dateigrößen
- Ausgabeformate – ASCII, smart ASCII (dabei wird versucht das Textergebnis möglichst nahe an das Original Image heranzubringen), RTF und PDF.
- PDF Sicherheitseinstellungen können gesetzt und PDF Profilinformation (Titel, Autor, Betreff und Schlüsselworte) befüllt werden.
Voraussetzung – MS-Windows XP/2000, Adobe Acrobat ist nicht erforderlich.
Wir verwenden iOCR momentan für folgende Anwendungen – AutoOCR - um über Foldermonitoring TIFF Images automatisiert in durchsuchbare PDF´s zu konvertieren bzw. als Add-On zur Alfresco ECM/DMS Lösung um gescannte Dokumente automatisiert per OCR zu verarbeiten. Die Dokumente sind danach sofort über deren Inhalt per Volltext such- und auffindbar.
Weitere Integration in unsere anderen Softwarelösungen – ScanClient, PDFMerge, AutoPDF – z.b. für PDF-OCR als auch für Bereichs OCR sind geplant.
iOCR verfügt über keine mengenmäßigen Restriktionen und kann mit der Voll-Lizenz eine beliebige Anzahl an Seiten und Dokumenten konvertieren und verarbeiten.
Im Setup von AutoOCR ist iOCR enthalten. Ohne Eingabe eines Lizenzkeys können max. 50 Dokumente für Demo bzw. Testzwecke konvertiert werden.
Die Lizenzkosten von iOCR betragen EUR 760,– exkl. Mwst.