ifresco AutoOCR Transformer – OCR processing integrated with Alfresco Share

2012-04-30 Von: Wolfgang May Kategorie(n): Alfresco, AutoOCR, OCR, PDF, PDF/A, ifresco, ifresco Client

The AutoOCR Server is integrated via REST as a dynamic configurable Alfresco document transformer. AutoOCR creates searchable PDF´s or other document formats like TXT, DOC(X), XLS(X), PPT(X), XML, RTF and HTML from image of PDF files. The OCR functions can be used via Java, JavaScript or as a document transformer. Config is done from the Share UI which also has a new document action “Transform” and gives access to all Alfresco transformers.

AutoOCR is an OCR server / service which is based on the obviously best OCR engine from Abbyy. The AutoOCR server has a REST web-serverice interface which was used to integrate it with Alfresco. AutoOCR is able to convert image- or PDF- files to searchable PDF´s. In addition to PDF other document formats like TXT, DOC(X), XLS(X), PPT(X), XML, RTF and HTML can also be created.

The configuration is simple and uses OCR profiles to summarize all possible settings. With an AMP install module  the direct integration of AutoOCR to Alfresco is realized. OCR functions are available in   Alfresco as a dynamically configurable transformer. Appropriate bindings allow the use of the OCR out services also from JavaScript and Java. From Alfresco 4.0, the configuration and monitoring will be done directly on the UI of the Share Administrator console.

In addition, we have extended the  Alfresco share document actions with the Alfresco Transformer integration. Transformer functions are available on  any document via the share interface and allow the conversion of documents into different formats.

AutoOCR as Alfresco Transformer:

The OCR function can be bound to a folder as an action. So if e.g. a scanned document will be placed in this folder, the processing starts automatically started and the document will be passed to the AutoOCR server. The result is a searchable PDF or other document format that can be immediately sought and found on the Alfresco full-text index.

AutoOCR JavaScript binding for Alfresco:

The JavaScript API allows direct access to the AutoOCR service from Alfresco scripts. From Repository JavaScripts (Webscript controller script, scripted actions) all the features of AutoOCR API can be adressed. This API is completely independent from the integration of AutoOCR services as Alfresco Transformer.

Alfresco Share – “Transform” document action

By implementing the additional “transform” document action to the Share UI you can use all your Alfresco transformes and not only the AutoOCR transformers. The “transform” action is implemented general and not only OCR specific.

Highlights / features:

  • Direct AutoOCR integration as Alfresco transformer with REST web service interface.
  • Separate AutoOCR service / server which does not strain the Alfresco server
  • Based on ABBYY – the leading OCR engine
  • Easy configuration by selecting OCR profiles – all available ABBYY OCR engine settings are combined.
  • In addition to PDF other output formats can be generated (TXT, RTF, DOC, etc.)
  • Dynamic transformer configuration at runtime using the Alfresco Share Admin interface.
  • JavaScript client for the AutoOCR service, available in Alfresco repository scripts (WebScripts, actions, etc.)
  • Java client for the AutoOCR service, for use in Java code.
  • The Java client itself has no dependencies for Alfresco.
  • New Share document action “Transform” enhances Share not only with OCR but with all supported transformers.

Requirements:

  • Alfresco 4.x – dynamic configuration via Share Userinterface
  • Alfresco 3.x – manual configuration w/o Share UI
  • AutoOCR from Version 1.9.8 on Microsoft Windows as a service
  • ABBYY FineReader Engine 10 (starting with 10.000 pages per month)

01-autoocr-action-menu 02-autoocr-shareaction-dialog 03-autoocr-shareaction-transform-waiting 04-autoocr-shareaction-results 05-autoocr-shareaction-transformed-docs 20-autoocr-admin-status 22-autoocr-admin-transformerconfig2 23-autoocr-admin-jobs

Test and Demo version is available – please contact us for details >>>

Price information you can find here >>>

ifresco AutoOCR Transformer – Version 1.6 verfügbar

2012-04-27 Von: Wolfgang May Kategorie(n): Alfresco, AutoOCR, OCR, PDF, PDF/A, ifresco

Vom ifresco AutoOCR Transformer ist jetzt die Version 1.6 verfügbar. Neben Fehlerkorrekturen wurde jetzt auch eine Alfresco Share Dokumentenaktion “Transform” implementiert. Damit kann über die Alfresco Share Benutzeroberfläche nicht nur die AutoOCR Verarbeitung – sondern auch alle anderen von Alfresco unterstützen Dokumenten Transformer ausgewählt und angewendet werden.

Funktionen – Alfresco Share “Transform”

  • OCR-Verarbeiten sowie Konvertieren von Dokumenten über die Alfresco Share Oberfläche
  • Verwendung der konfigurierten Alfresco Transformer inkl. AutoOCR Anbindung
  • PDF Image Dokumente können direkt durch die OCR´ten und damit durchsuchbaren PDF Dokument ersetzt werden.
  • Neben der Erzeugung von durchsuchbaren PDF-OCR Datei lassen sich über zusätzliche Transformationen weitere Dokumente z.b. DOC, TXT, HTML usw. in einem Arbeitsschritt erzeugen.

01-autoocr-action-menu 02-autoocr-shareaction-dialog 03-autoocr-shareaction-transform-waiting 04-autoocr-shareaction-results 05-autoocr-shareaction-transformed-docs

ecm Market – Der Marktplatz für Alfresco Lösungen

2012-04-27 Von: Wolfgang May Kategorie(n): Alfresco, AutoOCR, DMS, ECM, PDF, PDF/A, ifresco

Es gibt jetzt mit dem ecm Market unter www.ecm-market.de eine neue Plattform für Alfresco Lösungen und Add-On Module. Der ecm Market ist eine B2B-Plattform für kostenlose und kommerzielle Lösungen, sowohl für Alfresco Enterprise wie auch für Alfresco Community. Auf dieser Plattform bieten Softwarehäuser und Entwickler ihre Alfresco-basierten Lösungen für Unternehmen an. Auch wir bieten im ecm Market unsere Alfresco Lösungen an. Die erste dort verfügbare Lösung ist unsere Integration von Alfresco mit AutoOCR zur Erzeugung durchsuchbarer PDF´s.

ifresco AutoOCR Transformer im ecm Market >>>

ecm4u-PERMISSIONS – Rechte in Alfresco einfach managen

2012-03-14 Von: Wolfgang May Kategorie(n): Alfresco, DMS, ECM, ifresco

Die Verwaltung von Berechtigungen kann in Alfresco sehr schnell zu einer unübersichtlichen und aufwändigen Angelegenheit werden – da Rechte über Gruppen und Vererbungen über hierachische Baumstrukturen vergeben werden können und man sehr schnell den Überblick verlieren kann. Durch die Möglichkeiten der Gruppen und Vererbungen kann man mit den herkömmlichen und im Alfresco standardmäßig vorhandenen Funktionen nicht einfach herausfinden ob und welche Rechte ein bestimmter User auf einem bestimmten Unterordner in der Folderstruktur hat.

Projektadministratoren kennen das Problem: sobald verschiedene Abteilungen, Personen mit unterschiedlichen Befugnissen, Kunden oder externe Projektpartner in einem Projekt Zugriff auf ein Alfresco-System haben, verliert man schnell die Übersicht, welche Rechte für welche Gruppe tatsächlich erteilt oder vererbt wurden. Dies kann dazu führen, dass sensible Dokumente für unbefugte Personen sichtbar werden.

Alfresco verfügt im Standardumfang über keine Funktionen um einen Report zur Dokumentation und Überprüfung der Berechtigungen auszugeben bzw diese extern zu erstellen, zu bearbeiten und zu importieren.

All diese Funktionen stellt das Zusatzmodul ecm4u-PERMISSIONS zur Verfügung.

Highlights ecm4u-PERMISSIONS:

Mit ecm4u-Permissions werden alle erteilten und vererbten Rechte eines Arbeitsbereiches in einer übersichtlichen Liste dargestellt . Bisher mussten Sie dazu alle übergeordneten Ebenen einzeln aufrufen, sich die darin enthaltenen Rechte notieren oder merken – und konnten nie ganz sicher sein, wirklich alle Verzweigungen der Rechtesetzung im Blick zu haben. Nun sieht man  in einer Übersicht, wer der Besitzer eines Arbeitsbereiches ist, welcher Benutzer oder welche Gruppe darin über welche Berechtigungen verfügt – und ob diese Berechtigung vererbt oder direkt gesetzt wurde.

Darstellung der effektiven Rechte

Zugriffstest – Das Modul erlaubt es auf unkomplizierte Weise, die Rechte eines Nutzers oder einer Gruppe mit Hilfe des Zugriffstests zu überprüfen. Dazu markieren man einfach die abzufragenden Rechte und gibt den Namen eines Nutzers oder einer Gruppe in das vorgesehene Feld ein.  Bei der Eingabe des Vor-, Nach- oder Benutzernamens erscheint eine automatischen Vorschlagsliste. Nach der Bestätigung der Abfrage wird sofort in der Statusanzeige dargestellt, ob die betreffende Person oder Gruppe über das jeweilige Recht verfügt. Im Beispiel wurde für den Anwender „john.smith“ festgestellt, dass er im betreffenden Arbeitsbereich über Lese-, nicht aber über Editorrechte verfügt.

Zugriffstest

Rechteverwaltung - Mit ecm4u-Permissions können Sie die gesamte Rechtestruktur eines Arbeitsbereiches als Tabelle exportieren, in Excel bearbeiten und zurück nach Alfresco importieren. Sie erhalten damit nicht nur eine übersichtliche Darstellung der gesetzten Rechte eines Verzeichnisses, sondern können in dieser Liste aktiv Rechte bearbeiten und sogar komplett neue Arbeitsbereiche inklusive dazugehöriger Rechte erstellen. Diese Veränderungen werden dann beim Import der Rechteliste in Alfresco automatisch umgesetzt. Die Tabelle kann in MS-Excel geöffnet werden und enthält folgende Informationen:

  • den Pfad des Verzeichnisses,
  • die Angabe, ob die Vererbung aktiviert ist (true) oder nicht (false),
  • den Namen des Nutzers oder der Gruppe und
  • die Alfresco Rollen- oder Rechtebezeichnung.

Rechtestruktur exportieren Rechtestruktur anwenden

Sie können somit nicht nur die Rechte eines Nutzers oder einer Gruppe ändern, sondern auch die Vererbungen managen oder neue Verzeichnisse mit Rechten erstellen. Beim Import der angepassten Datei werden alle Veränderungen in Alfresco übernommen. Damit Sie genau überprüfen können, welche Aktionen vorgenommen wurden, wird Ihnen unmittelbar nach dem Import angezeigt, welche Änderungen umgesetzt wurden.

Sichere Handhabung - Bei aller Funktionalität muss man dennoch kein Administrator mit tiefen Alfresco-Kenntnissen sein, um das Modul im Projektalltag einsetzen zu können. Projektverantwortliche, die ecm4u-Permissions nutzen, könnnen sich sicher sein: ein Import der bearbeiteten Tabelle hat niemals zur Folge, dass Arbeitsbereiche gelöscht und somit ausversehen Dokumente in den Papierkorb verschoben werden. Zudem unterstützen umfangreiche Validierungen den Nutzer bei der Anpassung der Tabellenattribute: beim Import werden Benutzer- und Gruppennamen, Rollen- und Rechtebezeichnungen sowie Pfadnamen überprüft und eventuell vorhandene Validierungsfehler in einem Report angezeigt. Es bleibt somit immer nachvollziehbar und kontrollierbar, welche Aktionen ausgeführt wurden und wo unter Umständen noch Fehler vorhanden sind.

ecm4u-Permissions ist nach der Installation sofort einsatzbereit und kommt ohne zusätzliche Programmierung aus, ist upgrade-safe da nur Standarderweiterungspunkte des Systems benutzt werden und kompatibel mit Alfresco Community und Enterprise; jeweils 3.4.x. und 4.

AutoOCR – Alfresco Transformer Modul / JavaScript / Java Client

2012-01-20 Von: Wolfgang May Kategorie(n): Alfresco, AutoOCR, OCR, ifresco

Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über  Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen  – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code.  Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter MS-Windows

1_AutoOCR - alfresco transformer - status 2_AutoOCR - alfresco transformer connection configuration 3_AutoOCR - alfresco transformer configuration 4_AutoOCR - alfresco transformer job status

SAP setzt Alfresco intern ein

2011-12-15 Von: Wolfgang May Kategorie(n): Alfresco, ifresco, ifresco Client, ifresco PHP Library

Laut einem Pressebericht im “derStandard” online Ausgabe vom 7. Dezember 2011 – hat sich SAP entschieden intern Alfresco als Content Managment System einzusetzen. >>>

“Alfresco liefert uns eine robuste und skalierbare Plattform für Content Management und Collaboration”, betont Ran Cliff, Vice President IT bei SAP.

Eine solche Entscheidung und Meldung freut uns besonders da wir selbst auf diese Software setzen und Beratung, Consulting und Softwareentwicklung rund um Alfresco anbieten.

ifresco – Client for Alfresco – neue Version 0.3 verfügbar

2011-10-10 Von: Wolfgang May Kategorie(n): Alfresco, DMS, ECM, ifresco, ifresco Client

Die neue ifresco Version 0.3 wurde veröffentlicht.

Download & Neuerungen ifresco Version 0.3 >>>

ifresco Client 0.3 for Alfresco – PDFMerge – PDF Dokumente zusammenfügen

2011-08-09 Von: Wolfgang May Kategorie(n): Alfresco, ifresco, ifresco Client

Mit der ifresco Version 0.3 gibt es jetzt auch eine komfortable PDFMerge - Funktion. Man kann sich damit z.b. mehrere Dokumente über verschiedene Suchabfragen zusammenstellen – die Dokumente werden z.b. in der “Clipboard Liste” gesammelt und anschließend über die PDFMerge Funktion zu einem Gesamt-PDF Dokument zusammengeführt. Die Dokumente werden in der Reihenfolge der Liste (bei Markieren Alles) oder in der Reihenfolge der Selektion abgearbeitet. Das PDF-Gesamt-Dokument wird automatisch erzeugt und kann anschließend angezeigt, gemailt oder ausgedruckt werden.

ifresco Client 0.3 for Alfresco – Lookups über Kategorien

2011-08-09 Von: Wolfgang May Kategorie(n): Alfresco, ifresco, ifresco Client

Alfresco verfügt über die Möglichkeit Kategorien in Baumstrukturen anzulegen und einem Dokument eine oder mehrere Kategorien zuzuordnen. d.h. auf Basis der Kategorien lassen sich die Dokumente in “virtuelle Ordner” einordnen.

Durch eine mit der ifresco Version 0.3 implementierten Erweiterung können Kategorien auch als Lookups für Profilfelder verwendet werden. Dabei wird ein Feld einem Kategorie-Knoten zugeordnet. Auf der Profilmaske können dann alle darunterliegenden Kategorie-Eintragungen über eine Type-Ahead Funktion aufgelistet und ausgewählt werden. Wurde “Multiselect” konfiguriert so können auch mehrere Lookup Einträge ausgewählt und in das Feld eingefügt werden.

ifresco Client 0.3 for Alfresco – Neue Clipboard Funktion

2011-08-09 Von: Wolfgang May Kategorie(n): Alfresco, ifresco, ifresco Client

Mit der Version 0.3 von ifresco wurde jetzt auch eine neue Clipboard Funktion implementiert. Das Clipboard wird als neuer Tab in Form einer normalen Dokumentenliste angelegt und befüllt. Damit lassen sich die im Clipboard gesammelten Dokumente mit den gleichen Funktionen wie über die normale Suchergebnisliste verarbeiten. In Zukunft wird es auch möglich sein diese “gesammelten” (Clipboard)Listen zu speichern bzw. unter den Favoriten abzulegen und schnell wieder aufzurufen.