Papyrus Document Capture System 7
Transcription
Papyrus Document Capture System 7
ISIS Papyrus Produktinformation ISISPAPYRUS TM Papyrus Document Capture System 7 Scan Scan-/File-/ XML-/E-mailReceiver Bilder in Objects Struktur Papyrus Capture / Papyrus Objects FreeForm Classify Klassifikation des Dokumententypes automatische Verarbeitung FreeForm Recognition Erkennen von Indexdaten, Kopfdaten und Rechnungen manuelle Verarbeitung Validation Batch/Detail Überprüfen der erkannten Daten durch Prozeßregeln Verification Client Korrektur von OCR Resultaten, Dokumentvalidierung Supervisor Spezielle Korrektur von Dokumenten Das Papyrus Document Capture Konzept ermöglicht inte grierte, firmen weit einsetzbare Lösungen für leistungsfähiges und effizientes Entwickeln, Be treiben und Ad ministrieren von Dokumenterfas sungssystemen. Data Archiv & Export Export der validierten Daten als XML, CSV, TXT / TIFF, JPG, PDF Datei Kontakt Europa T: +43-2236-27551 F: +43-2236-21081 Das Konzept In einem Unternehmen langt tägliche eine Vielzahl von verschiedenartigen Dokumenten ein, die rasch verarbeitet und an die richtige Stelle weitergeleitet werden sollen. Daher muß der Aufbau und Einsatz eines Dokumenterfassungssystems kurzfristig und effizient vor sich gehen, unabhängig von den unterschiedlichen Dokumententypen, Erfassungs-Hardware und Betriebssystem. Basierend auf einem mit Bedacht erstellten „MIDDLEWARE“-Konzept, hat ISIS besonders leistungsfähige Werkzeuge zur Dokumenten- und Prozeß-Entwicklung entwickelt. Große Banken, Versicherungsgesellschaften, Behörden, Industrieunternehmen und Dienstleister insbesondere im Bereich Datenerfassung streben nach kurzen Entwicklungszeiten, Eliminierung von Programmieraufwand und Unabhängigkeit von Scanner, Dokumentenausprägung und Betriebssystem – alles Basiseigenschaften des „Papyrus Inbound Concepts". Amerika T: 817-416-2345 F: 817-416-1223 Asien/Pazifik T: +65-6339-8719 F: +65-6336-6933 E-Mail [email protected] Internet www.isis-papyrus.com © 2012, ISIS Papyrus, ersetzt alle bisherige Dokumentation. 1. Jänner 2012 ISIS Papyrus Produktinformation Papyrus Document Capture System 7 Die Capture Anwendungen Papyrus Capture Produkte Das ISIS Papyrus Document Capture System umfasst das gesamte Bearbeitungs-Spektrum, von der Entwicklung jeglicher «Inbound»-Anwendung, Scannen oder Importieren von Dokumenten, über Klassifizieren und Index-Daten-Extrahieren, bis zu manuellen Nachbearbeitungsmöglichkeiten und Übertragung zu beliebigen Geschäftsanwendungen. Dies beinhaltet Dokumenten-Layout-Erkennung ebenso wie Auslesen von Inhalten, Berücksichtigung von Dokumentenlogiken, Validierungsschnittstellen und hochfunktionellen Masken zur Vervollständigung der Daten. • Papyrus Designer Package/Capture für Windows 2K/XP/2K3/VISTA/2K8/7 bestehend aus -Capture Designer/FixForm -Capture Designer/Classify -Capture Designer/FreeForm® Graphisch unterstützte Entwicklung vom Document Capture Definitionen. • Papyrus Collect für Windows 2K/XP/2K3/VISTA/2K8/7 bestehend aus - Papyrus Scan (Professional, Item) - Messaging Server (Fax & E-mail in&out) Integrierte Erfassung von Papier und elektronischen Dokumenten. • Papyrus Server/FixForm für Windows 2K/XP/2K3/VISTA/2K8/7 Erkennung und Auslesen von Daten aus (geometrisch) hochstrukturierten Formularen. • Papyrus Server/Classify für Windows 2K/XP/2K3/VISTA/2K8/7 Kategorisierung von gemischtem Dokumentgut zur automatischen Weiterleitung • Papyrus Server /FreeForm® für Windows 2K/XP/2K3/ VISTA/2K8/7 Verarbeitung gering- oder unstrukturierter Dokumente durch Extraktion logischer Daten, auch wenn deren genaue Position unbekannt ist. • Papyrus Client/Capture für WebBrowser MS IE, Mozilla u.a. Das universelle Dokumenten-Portal, für alle Benutzerinteraktionen mit dem Dokument Capture System. • Papyrus WebRepository stellt die Basis-Architektur und eine vollständig objektorientierte Infrastruktur dar, einschließlich Versionierung, Benutzerverwaltung, Workflow und System-Integration u.v.a.m • Papyrus WebArchive auf z/OS, Windows 2K/XP/2K3/ VISTA/2K8/7, AIX, HP/Itanium and Sun Solaris für Internet basierte Dokumenten Verteilung und Abspeicherung in den Formaten TIF, AFP, PDF und GIF mit einer XML-Schnittstelle zu LangzeitArchivsystemen. Während des Designs einer Anwendung sind alle RecognitionEngines uneingeschränkt verfügbar. So ist sichergestellt, dass die Capture-Qualität und die Erkennungsergebnisse sofort und jederzeit verifizierbar sind. Hilfreiche Werkzeuge für hochvolumiges Benchmarking (Teststapeln mit mehreren hundert Seiten) hinsichtlich Automatisierungs- und Rückweisungsraten ermöglichen bestmögliche Vorbereitung eines Systems, bevor es produktiv geht. Auf Grund der Erfahrung mit hunderten erfolgreichen Capture Projekten bietet ISIS vorkonfigurierte Anwendungen, sogenannte „Frameworks“, um schnell und effizient mit kundenindividuellen Anpassungen beginnen zu können. Sie umfassen alle nötigen Definitionen für Dokumente und Datenfelder sowie vorbereitete Views für Administration und Workflow Design. Diese Frameworks sind u.a. •Posteingangsverarbeitung-Framework: hier gibt es z.B. vorbereitete Umgebungen für die Trainingsund Testphase, mit grafischen Unterstützungen zur Performanceanzeige. Damit können Systeme zur Erfassung und Klassifizierung von eingehender Briefpost, Faxen und Emails aufgesetzt werden. • Capture Framework – Formularerfassung: die schnell einsetzbare Standard-Umgebung für alle Arten und Typen von Formularen, einschließlich passender Nachbearbeitungsmasken. Papyrus Designer Package Capture • Capture Framework – Rechnungslesen: Windows 2K/XP/2K3/VISTA/2K8/7 Eingehende „FreeForm®“-Dokumente, also Import solche mit bloß logischer Struktur, benötiErgänzung Korrektur Papyrus Papyrus gen in der Regel mehr und andere Arbeits Klassifikation Collect Überprüfung Client - Scan Verwaltung schritte und eine engere Integration mit - Fax /Capture - E-Mail Validierungsdaten. Windows Windows 2K/XP/2K3/VISTA/2K8/7 2K/XP/2K3/VISTA/2K8/7 • Dokument Workplace: wenn hereinkommende Dokumente manuell getrennt oder umgeordnet Papyrus Recognition Server Windows 2K/XP/2K3/VISTA/2K8/7 werden müssen (wie z.B. bei Faxen), bietet Classify Extract Extract dieses leistungsfähige browser-basierte FixForm FreeForm® Framework alle notwendigen Werkzeuge und Funktionen. • Campaign Management Framework: Bestellinformation Dieses ermöglicht auf höchst professionelle Weise, die Das ISIS Papyrus Dokument Capture System besteht aus unabRückläufer Ihrer verschiedenen Marketing Kampagnen zu verhängigen Komponenten. Obwohl diese zueinander und in der arbeiten und mit den aus Kundenantworten ausgelesen Daten Papyrus Objects Infrastruktur eng integriert sind, können viele sofort individuelle Antwortschreiben zu erstellen. von ihnen, wenn nötig, auch einzeln verwendet werden. • Response Management Framework: Immer ein offenes Ohr auch für die formlosen schriftlichen Schulungen Anliegen Ihrer Kunden zu haben und auf diese schnell und perISIS bietet seinen Kunden ein spezielles Inhouse sönlich zu reagieren, mit höchsten Qualitätsansprüchen und so Schulungsservice in Form des Papyrus Capture Workshop. weit wie möglich automatisiert – das bietet diese Anwendung. ISIS Papyrus Produktinformation ISISPAPYRUS TM Papyrus Designer Package/Capture Dokumenten & Feld Struktur Leistungsfähige Werkzeuge für «Lernen am Beispiel» 5 OCR/ICR engines Definiton der Erkennungsparameter Anzeige der Testdokumente Herausragende Leistungs fähigkeit zur Definition von Klassifikation und Daten extraktion für alle Arten von Dokumenten Direkte Ansicht der Erkennungsergebnisse Produktbeschreibung Designer Familie zur Definition von Projekten zur Klassifikation und Datenauslesung für jegliche Art von Dokumenten. Als wesentliche Eigenschaften zur Vereinfachung und Beschleunigung des Customizing-Prozesses sind u.a. auch die beliebige Wiederverwendbarkeit von vordefinierten Parameter-Sets, wo immer möglich „Teach-by-Example“ und selbsterklärende Regeln beinhaltet. Papyrus Capture Designer/FreeForm® ist ein besonders mächtiges Werkzeug zur einfachen Erstellung von Definitionen für die automatische Datenerkennung aus gescannten, aber unsortierten Geschäftsdokumenten mit unbekannter Struktur und Layout wie z.B. Rechnungen, Listen, formlose Schreiben, etc. Papyrus Capture Designer/FixForm bietet alle nötigen Werkzeuge für die rasche Definition von Datenextraktionsparametern zur Verarbeitung aller Arten von Formularen mit bekanntem Layout einschließlich Handschrift. Papyrus Capture Designer/Classify beinhaltet selbstlernende Module zur Klassifikation von beliebigen Dokumenten und ermöglicht dadurch vielfältige Anwendungen im Bereich der automatischen Sortierung und Verteilung von elektronischen Dokumenten, Faxen und Papier-Post. Kontakt Europa T: +43-2236-27551 F: +43-2236-21081 Amerika T: 817-416-2345 F: 817-416-1223 Asien/Pazifik T: +65-6339-8719 F: +65-6336-6933 E-Mail [email protected] Internet www.isis-papyrus.com © 2012, ISIS Papyrus, ersetzt alle bisherige Dokumentation. 1. Jänner 2012 ISIS Papyrus Produktinformation Vorteile • Schnellere Definition und Testen von neuen Dokumententypen als bei vielen anderen Produkten • Je ein spezielles Design-Werkzeug für die drei grundsätzlichen Anforderungen des „DokumentVerstehens“: Klassifikation, Datenauslesen FixForm und FreeForm® • Ergonomische, selbsterklärende Benutzeroberfläche – keine Programmierkenntnisse erforderlich • Universelle Repository-Funktionen ermöglichen Wiederverwendung von bereits erstellten Definitionsteilen • Analyse- und Statistik-Funktionen (Regression Tests) inkludiert Komponenten des Pakets Papyrus Designer/FreeForm® Papyrus Designer/FixForm Papyrus Designer/Classify Gemeinsame Eigenschaften Bildvorverarbeitung Alle Designer ermöglichen automatische oder einstellbare Aufbereitung der Bilddaten für optimale Erkennungsergebnisse: •Schmutzentfernung •Auffetten •Linienentfernung • Entfernung von Lochungen • Automatisches Aufrichten •Binarisierung • Umwandlung Farbe in Grau • Geraderichten mittels - Blattrand - Textzeilen Image Erkennung von Ankern, Bitmaps, Linien; Barcode, OMR, Text: 5 OCR/ICR Engines decken jede Erkennungsherausfor derung ab, der jeweilige Zeichentyp ist leicht einstellbar. Flexible Post-OCR-Nachverarbeitung mit Filtermuster, Abstandsunterdrückung u.v.a.m. Designer/FreeForm® Der „Star“ unter den Capture Designern ermöglicht sowohl Dokumententypbasierte generische als auch Templatebasierte Extraktion. Die Kombination der beiden Methoden ergibt kürzeste Definitionszeiten und beste Erkennungsresultate. • Generische Definition - Regelbasierte Extraktion - Wartbares Regelsystem - Vorteil: funktioniert auch mit unbekannten Dokumentlayouts Papyrus Designer Package/Capture • Template-basierte Definition - Learn-by-example - an Dokumentregionen orientierte Datenextraktion - Optimierbar auf spezifische Eigenschaften von Dokumenttypen. Struktur des Definitionsprozesses: • Definition aller auftretenden Dokumententypen • Definition aller benötigten Datenfelder • Definitionen für jedes Datenfeld: - Allgemeine Eigenschaften - Dazugehörige Anker - Mögliche Muster und Strukturen des Elements - Bedingungen, die erfüllt sein müssen • Test der Definition mit verschiedenen Dokumenten • Vergleich der Ergebnisse mit zuvor generierten Soll-Resultaten („Golden Files“) Tools zur Anzeigeunterstützung ermöglichen die Definition neuer Dokumententypen in Minuten anstatt Stunden: • Anzeige von Extraktionskandidaten • Anzeige von Regionen und Abhängigkeiten • Bequeme Auswahlwerkzeuge. Papyrus Designer/FixForm Durchgängig angelegt gemäß XML Struktur-Prinzipien, vereint der Designer/FixForm mehr als ein Jahrzehnt Erfahrung mit Formularauslesung. Der übersichtliche Arbeitsplatz umfaßt alle nötigen Teilbereiche • Image-frame zur Anzeige des auszu lesenden Dokumentes • Extraktionsparameter wie Lesezone oder Erkennungstyp • Eigenschaftsfenster mit detaillierten Attributen jedes ausgewählten Elements • Bereich mit Anzeige der Ergebnisse zur sofortigen Visualisierung von Bildbearbeitung oder erkannten Zeichen. Papyrus Designer/Classify Der Designer/Classify dient zur Definition der verschiedenen Dokumentenkategorien, der Extraktion der Feature-Sets und der Klassifikationsstrategie. Er unterstützt die Automatisierung einzelner Definitionsschritte. Der Designer/Classify, weitgehend integriert in die Papyrus Objects Infrastruktur, ermöglicht den einfachen Umgang mit Sample Daten, Testläufen und Ergebnisanalyse. Unterstützte Klassifikationsarten: • Image Attribute der ganzen Seite oder einer speziellen Region • Schlüsselworte auf vorbestimmten Positionen oder an jeder beliebigen Stelle im Text • Text-Phrasen auf vorbestimmten Positionen oder irgendwo im Text •Regeln. Der Designer/Classify visualisiert die automatisch generierten Kategori sierungs-Attribute und ermöglicht • die Anpassung von Parametern wie die Relevanz von Schlüsselwörtern oder Klassifikations-Schwellwerte • die Analyse der Erkennungs-, Rückweisungs- und Fehlerraten und auf welchen Dokumenten diese auftreten • die Adaptierung von Klassifika tionsmethoden für spezielle Dokumententypen. Vor Beginn der Arbeit mit dem Designer/ Classify müssen die gewünschten Dokumentenkategorien festgelegt werden. Mit einer ausreichenden Anzahl von Musterdokumenten (einige Dutzend) für jede Kategorie wird das System antrainiert, um die spezifischen Eigenschaften jeder Klasse zu lernen. Neue Kategorien können auch während der Produktionsphase leicht hinzugefügt werden. Kontinuierliches Zusatztraining als unmittelbares Ergebnis der manuellen Klassifikation ist ebenfalls möglich. Datenformate Eine Anzahl von Dateiformaten, Image (TIFF, JPG, PDF) und Text (DOS, ANSI, Unicode), Microsoft Office Files wird unterstützt. Technische Anforderungen Hardware: Pentium >1GHz, 1GB RAM, 2GB HD Bestellinformation Papyrus Designer Package /Capture 7 für Windows 2K/XP/2K3/VISTA/2K8/7 Schulungen ISIS bietet seinen Kunden spezielle inhouse trainings services, die Papyrus Designer Capture Workshops. Bitte kontaktieren Sie uns bezüglich Einzelheiten und Terminen. Softwarewartung Es gelten die Allgemeinen Geschäftsbedingungen für ISIS SoftwareProdukte. Freie Serviceperiode ist 6 Monate nach Installation. Wartung und Service ist danach optional für Updates und Hotline verfügbar ISIS Papyrus Produktinformation ISISPAPYRUS TM Papyrus Client/Capture Benutzeroberfläche zur DokumentenBearbeitung für Capture Erfassung, Administration und Entwicklung Produktbeschreibung Papyrus Client/Capture ist die Browser-basierte Benutzeroberfläche für alle Anwenderinteraktionen innerhalb des Papyrus Dokumenterfassungssystems. Sie ermöglicht die Vervollständigung und Korrektur von Klassifikations- und Extraktionsergebnissen und stellt alle notwendigen Anzeigeunterstützungen und Plausibilitätsprüfungen innerhalb einer Capture-Anwendung zur Verfügung: • • • • • • Einheitliche Bearbeitung von gescannten Dokumenten, Faxen und E-mails Kontext-Sensitive Erfassungsfelder zur Dateneingabe Interaktive Überprüfung von extrahierten Daten Darstellung von Bildausschnitten oder ganzen Seiten Frei gestaltbaren Benutzerhinweise oder Benachrichtigungen Zugriffsmöglichkeiten für Administrator und Designer Funktionalitäten über Masken und Menüs Der gemäß den individuellen Projektanforderungen gestaltbare „Dokumentarbeitsplatz“ erlaubt zusätzlich manuelle Eingangsbearbeitungen wie z.B. das Ändern der Seitenreihenfolge in Bilddokumenten, Austausch von Seiten zwischen Dokumenten oder manuelle Dokumenttrennung/-zusammenführung. Kontakt Europa T: +43-2236-27551 F: +43-2236-21081 Amerika T: 817-416-2345 F: 817-416-1223 Asien/Pazifik T: +65-6339-8719 F: +65-6336-6933 E-Mail [email protected] Internet www.isis-papyrus.com © 2012, ISIS Papyrus, ersetzt alle bisherige Dokumentation. 1. Jänner 2012 ISIS Papyrus Produktinformation Papyrus Client/Capture Vorteile • Drei Zugriffsmöglichkeiten auf Dokumente: Portal-Browser, Terminal-Server, Papyrus Desktop • Ergonomische Bildschirmdarstellungen • Ein Anwenderinterface für alle Dokumententypen • Ohne Programmierung an alle Ihre individuellen Erfordernisse anpassbar Basisfunktionen • Darstellung aller eingehenden Dokumententypen • Bilddarstellung mit Zoom- und Scrollfunktionen • Verarbeitung von TIFF, Multipage TIFF, JPG und PDF, ASCII-basierte TextDokumente wie E-mails, Word, AFP • Spezielle Hervorhebung von wichtigen Bildbereichen • Farbmarkierung (variabel) von wichtigen Zonen • Hervorhebung von Rückweisungen oder unsicher erkannten Zeichen • Frei definierbare Datenfeldmasken • Markierungsfelder und Auswahllisten für Datenfelder • Baumstruktur zur Übersichtsdarstel lung von Dokumenten •Bildvorschau • Frei definierbare Zusammenstellung von Dokumentenlisten, Daten und Bildern • PDF- und AFP- plug-ins zur vielseitigen Darstellung von Dokumenten • Automatische Anpassung von Text und Bildbereichen nach Verfügbarkeit von Darstellungsplatz • Online Plausibilitätsprüfung mit Auswahlliste von zulässigen Werten Alle Capture Frameworks verwenden Papyrus Client/Capture Zur raschen Umsetzung von Kunden anforderungen hat ISIS alle notwendigen Darstellungen für die gesamte Funktionalitätspalette eines erfolgreichen Erfassungsprojektes bereits entwickelt. Dies inkludiert sowohl Standard-Arbeitsplatzoberflächen für jene Benutzer, die Daten ergänzen oder manuell erfassen sollen als auch Administratordarstellungen: •Dokumentendarstellung •Wartungsdarstellung •Taskdarstellung •Statistikdarstellung Auch der Applikationsentwickler kann das Gesamtsystem über das ISIS Portal im Browser bedienen: • Dokumenten- und DatenfeldDarstellung • Workflow Darstellung (Queues und Tasks) •Regeleditor Papyrus Desktop „Dokumentenarbeitsplatz“ Hardware: Pentium >1GHz, 512 Mb RAM Papyrus Client/Capture kann einfach konfiguriert werden, um als universeller Dokumentenarbeitsplatz zu dienen. Hier kann u.a. die Bildreihenfolge von mehrseitigen Dokumenten bzw. die Dokumentreihenfolge bearbeitet werden. Dies ermöglicht dem Anwender • Dokumente zu trennen oder zusammenzufügen • Einzelseiten zu drehen, zu verschieben oder zu löschen • Dokumentenreihenfolge zu ändern • Bilder in eine Zwischenablage zu verschieben • Einzelseiten hinzuzuscannen oder zu importieren Unterschiedliche Darstellungen erlauben den Zugriff auf Einzelseiten oder mehrseitige Dokumente sowie einen Dokumentenseitenpool (Zwischenablage). Papyrus Client/Capture kann eng in den Desktop integriert werden und genauso in der Browserversion verwendet werden.. Technische Voraus setzungen Bestellinformation Papyrus Client/Capture 7 Für Windows 2K/XP/2K3/VISTA/2K8/7 Windows Internet Explorer, Mozilla Schulungen ISIS bietet seinen Kunden spezielle inhouse trainings services, die Papyrus Designer Capture Workshops. Bitte kontaktieren Sie uns bezüglich Einzelheiten und Terminen. Softwarewartung Es gelten die Allgemeinen Geschäftsbedingungen für ISIS SoftwareProdukte. Freie Serviceperiode ist 6 Monate nach Installation. Wartung und Service ist danach optional für Updates und Hotline verfügbar. ISIS Papyrus Produktinformation ISISPAPYRUS TM Papyrus FreeForm® Häufig unter einer Gruppe von Objekten des Typs “Betrag” Typischerweise rechts von FreeForm® Ansatz Selbstlernendes Modul speziell zur Erkennung und Extraktion unsortierter und unstrukturierter Dokumente Wahrscheinlich im unteren Drittel der Seite Produktbeschreibung FreeForm ist ein Softwaremodul für die automatisierte Erkennung von unsortiert eingehenden, gescannten Geschäftsdokumenten mit unbekannten Strukturen und Layout. Das System erkennt auch Geschäftsdokumente wie Eingangsrechnungen, Lieferscheine, Bestellungen, Anträge, Bewerbungsschreiben, etc. FreeForm® basiert auf modernen Methoden der Mustererkennung und verwendet modernste Techniken in den Bereichen Schrifterkennung (OCR, ICR, Voting), assoziative Datenbanken, Fuzzy Logic und Neural Networks. ® Funktionsweise Die Option FreeForm® ermittelt aus einem Dokumentenimage den Namen der Dokumentenklasse sowie die für diese Klasse definierten Felddaten. Das Konzept erlaubt eine N:M Beziehung zwischen Images und Dokumenten: ein Dokument kann sich über eine oder mehrere Seiten erstrecken, genauso kann ein Image mehrere Dokumente beinhalten wie z.B. eine Zeitungsseite mehrere Artikel umfasst. Kontakt Europa T: +43-2236-27551 F: +43-2236-21081 Amerika T: 817-416-2345 F: 817-416-1223 Asien/Pazifik T: +65-6339-8719 F: +65-6336-6933 E-Mail [email protected] Internet www.isis-papyrus.com © 2012, ISIS Papyrus, ersetzt alle bisherige Dokumentation. 1. Jänner 2012 ISIS Papyrus Produktinformation Papyrus Freeform® Arbeitsweise Definition und Training FreeForm verarbeitet gescannte Dokumentseiten in drei Schritten: Ergonomie - FreeForm erspart die komplexe und zeitaufwendige Erfassung von kryptischen Definitionen und Regelwerken. Trainiert wird intuitiv und anhand konkreter Beispieldokumente - learning-by-example. ® Image Vorverarbeitung FreeForm® bereitet die Images für optimale Erkennungsresultate vor: • Erkennung der Dokumentenausrichtung und Autorotation •Schräglagenkorrektur • Schmutz- bzw. Hintergrundbereinigung. Dokument Klassifikation FreeForm® bewertet das Image anhand von Klassenmerkmalen und Verarbeitungsregeln: • Schlüsselwörter an vorgegebenen Positionen oder frei im Text • Textphrasen an vorgegebenen Positionen oder frei im Text • Grafiken, Linienelemente und Hintergrundfarbe an vorgegebenen Positionen, sowie Seitenformat Datenextraktion FreeForm® extrahiert und liest alle benötigten Felddaten zur erkannten Dokumentenklasse. Dies geschieht durch Auswertung folgender Merkmale und Regeln: • Absolute Positionsangaben • Relative Positionsangaben durch Hinweisobjekte • Mustervergleich (Auftreten von definierten Synonym- oder Datentyp-Objekten) Leistungsmerkmale • Verarbeitung von Dokumenten mit unbekanntem Format • Klassifizierung und Sortierung von gemischten Dokumentenstapeln • Kombination von Methoden des klassischen Formularlesens mit Volltextanalyse von freien Textbereichen • Einbinden in eine effiziente und ergonomische Produktionsumgebung mit integrierter Nachbearbeitung • Integrierte Definitions- und Trainingsumgebung • Interaktive Festlegung von Regeln, Parametern und Zonen mit sofortiger Verifizierung in einem Testlauf • Statistische Analysen des verarbeiteten Dokumentengutes mit der Möglichkeit die Ergebnisse für das Tuning zu verwenden ® Die Auswahl der relevanten Klassi fikationsmerkmale erfolgt während der Design- und Trainingsphase alternativ: • Automatisch - im Auto-LearnModus ermittelt FreeForm® die relevanten Merkmale zur bestmöglichen Unterscheidung der Dokumentenklassen anhand von vorgegebenen Imagebeständen für jede Klasse selbsttätig • durch den qualifizierten Benutzer (Superuser) - grafisch und einfach durch Auswahl relevanter Objekte des Images per Mausklick. Analog erfolgt das Lernen von Extraktionsregeln direkt am konkreten Beispieldokument. Kontrolle - „What gets measured gets done!“ Daher ist in die FreeForm® Entwicklungsumgebung ein Werkzeug zur laufenden, statistischen Überwachung und Analyse des aktuellen Trainingsstatus integriert. Der Benutzer wird über die Auswirkungen seiner Definitionsschritte unmittelbar informiert. Problemfälle und ihre Ursachen werden direkt aufgezeigt. Repository - FreeForm® verfügt über ein Object Repository. Einmal erstellte Definitionen wie • Synonyme, Worte oder Phrasen • Feldtypen - einfach oder zusammengesetzt (z.B. Adressblocks, Tabellen) • Dokumentklassen und Subklassen (Typen) werden übersichtlich verwaltet und können bequem wiederverwendet werden; d.h. neu zu erstellende Definitionen werden von bewährten, bestehenden abgeleitet. Das bedeutet: • rasche Anwendungserstellung • einfache und effiziente Wartung und Weiterentwicklung der Anwendung. Integration/Ergänzende Produkte Die Option FreeForm® ist für den Einsatz mit Papyrus Capture optimiert. Durch die ActiveX Schnittstelle kann diese Option auch von anderen Anwendungen und ErfassungsPlattformen, welche die Integration von ActiveX Servern unterstützen, genutzt werden. Das ISIS Capture Rohtextformat ist dokumentiert (ASCII/UNICODE mit Angaben zu Image, Zonen und Einzelzeichen). Der FreeForm® Applikationsdesigner ist eine eigenständige Anwendung, die im laufenden Betrieb des Document Capture Systems nicht benötigt wird. Technische Vorausset zungen •Hardware PIII 800+ Mhz, 512 MB RAM, 2GB HD. Pro Klassifikationsmodul sollte zur besseren Performance je ein RecoServer vorgesehen werden •Software Papyrus Capture Basissystem Dateiformate FreeForm® unterstützt eine große Anzahl unterschiedlicher Dateiformate, Bspw. Text (DOS, ANSI, Unicode, UUEncode, MIME), Microsoft Word (ab Version 6.0), Microsoft Excel (ab Version 2.x), HTML, RTF, WordPerfect (ab Version 6.0), Wordstar, Microsoft Works, PowerPoint, LotusWordPro, Microsoft Outlook Mail Format, AmiPro. Schulungen ISIS bietet seinen Kunden ein spezielles Inhouse Schulungsservice in Form des Papyrus Capture Workshop. ISIS Papyrus Produktinformation ISISPAPYRUS TM Papyrus Classify Dokumentenklassen DocClass01 DocClass02 DocClass03 DocClass04 DocClass05 DocClass06 DocClass07 ... • Felder • Geometrische Merkmale • Schlüsselwörter • Satzerkennung Klassenname: Stromrechnung Selbstlernendes Programm zur Klassifizierung von Dokumenten aller Art zur automatischen Sortierung und Verteilung. Felder: Kundenname Adresse Rechnungsdatum Rechnungsbetrag ... Prozess: WFL043 Kontakt Produktbeschreibung: Papyrus Classify ist ein selbstlernendes Modul zur Klassifizierung von Dokumenten, das vielfältige Anwendungsmöglichkeiten in den Bereichen automatische Sortierung und Verteilung von elektronischem Posteingang, Fax und Papierpost eröffnet. Intention von Papyrus Classify ist es, den ungefilterten Fluss einlangender Daten nach gewünschten Kriterien zu beurteilen, in frei definierbare Kategorien einzuordnen und damit die Informationen für Unternehmen zu erschließen und gezielt an den zuständigen Stellen zur weiteren Verarbeitung vorzulegen. Eine konkrete Anwendung von vielen ist das automatische Vorsortieren von elektronischer Eingangspost wie bspw. das Aufteilen von E-Mails an unterschiedliche Abteilungen – Rechnungswesen, Bestellung, Support, etc. – oder an einzelne Sachbearbeiter bzw. Kundenbetreuer. Auch für die automatische Klassifizierung von Texten, die in verschiedenen Sprachen vorliegen, nach der jeweiligen Sprache ist Papyrus Classify hervorragend geeignet. Europa T: +43-2236-27551 F: +43-2236-21081 Amerika T: 817-416-2345 F: 817-416-1223 Asien/Pazifik T: +65-6339-8719 F: +65-6336-6933 E-Mail [email protected] Internet www.isis-papyrus.com © 2012, ISIS Papyrus, ersetzt alle bisherige Dokumentation. 1. Jänner 2012 ISIS Papyrus Produktinformation Papyrus Classify Funktionen/Highlights Arbeitsweise Voraussetzungen technisch • Selbstlernendes System Das bedeutet, dass die Regeln, die für das automatische Zuordnen der Dokumente nötig sind, nicht von einem Administrator spezifiziert, gewartet bzw. den sich ändernden Anforderungen angepasst werden müssen, sondern dem System für jede gewünschte Dokumentenklasse eine bestimmte Anzahl an Dokumenten (typischerweise zwei bis drei Dutzend) zum Trainieren zur Verfügung gestellt werden. Papyrus Classify lernt aus diesen Trainingsdaten selbständig Regeln, nach denen in weiterer Folge die Klassifizierung vorgenommen wird. • Einfaches Nachtrainieren des laufenden Systems Ein Papyrus Classify, das im Echtbetrieb eingesetzt wird, kann laufend nachtrainiert werden; Grundlage dafür sind jene Dokumente, die nicht richtig zugeordnet werden konnten. Damit ist eine kontinuierliche, langfristige Optimierung des Systems gewährleistet, bzw. können die Regeln flexibel an Änderungen der Dokumentklassen angepasst werden. •Ausnahmebehandlung Dokumente, die nicht eindeutig einer Klasse zugeordnet werden konnten, werden ausgesondert und dem Administrator zur weiteren Beurteilung vorgelegt. Diese Dokumente werden dann manuell einsortiert, dabei können sie auf Wunsch für ein Nachtrainieren des Systems verwendet werden. • Zuordnung von einem Dokument zu mehreren Klassen • Mehrstufige Klassenhierarchie Dies ermöglicht ein mehrstufiges Vorsortieren der Dokumente; beispielsweise wird ein Dokument einer allgemeinen Klasse „Rechnung“ einer darrunterliegenden Klasse „Lieferant A“ zugeordnet. • Papyrus Classify erledigt den Großteil seiner Arbeit im Hintergrund. Sollte ein Eingriff des Administrators, oder eines Anwenders erforderlich sein, steht eine sehr klare, einfach und intuitiv zu bedienende Oberfläche zur Verfügung. Die beim Training selbständig erlernten Regeln wendet Papyrus Classify zur Klassifizierung unbekannter Texte an. Dabei berechnet das Programm für jedes Dokument die Wahrscheinlichkeiten, mit der dieser Text jeder Klasse zugeordnet werden kann. Die Zuordnung erfolgt in jene Kategorie mit der höchsten Wahrscheinlichkeit, sofern die bei der Definition der Klassen festgelegte Mindestwahrscheinlichkeit erreicht wird. Die solcherart vorsortierten Dokumente werden dann an die zur Bearbeitung bestimmte Stelle (Niederlassung, Abteilung, Person, etc.) weitergeleitet. Dokumente mit einer zu geringen Wahrscheinlichkeit für eine bestimmte Klasse werden in ein sogenanntes Reject Directory gestellt, aus dem sie der Administrator mit einem Mausklick der richtigen Kategorie zuweisen kann. Auf Wunsch werden diese Texte zum weiteren Training des Systems herangezogen. So kann Papyrus Classify im laufenden Betrieb ständig dazulernen und seine Wissensbasis erweitern. Möglicherweise falsch klassifizierte Texte gibt der Anwender an den Administrator weiter, der mit diesen wie mit den nicht klassifizierbaren Dokumenten verfährt. •Hardware PIII 800+ Mhz, 512 MB RAM, 2GB HD. Pro Klassifikationsmodul sollte zur besseren Performance je ein RecoServer vorgesehen werden •Software Papyrus Capture Basissystem Dateiformate Unterstützt eine große Anzahl unterschiedlicher Dateiformate beispielsweise Text (DOS, ANSI, Unicode, UUEncode, MIME), Microsoft Word (ab Version 6.0), Microsoft Excel (ab Version 2.x), HTML, RTF, WordPerfect (ab Version 6.0), Wordstar, Microsoft Works, PowerPoint, LotusWordPro, Microsoft Outlook Mail Format, AmiPro. Voraussetzungen organisatorisch Bevor Papyrus Classify zum Einsatz kommt, gilt es, die gewünschten Kategorien, in welche die Dokumente unterteilt werden sollen, festzulegen. Aus jeder dieser Kategorien wird eine gewisse Anzahl von Texten (üblicherweise ca. 20 bis 30) benötigt, die man Papyrus Classify als Trainingsmaterial zur Verfügung stellt. Anhand dieser Information lernt das Programm selbständig, wodurch sich die einzelnen Klassen voneinander unterscheiden. Natürlich können auch während des laufenden Betriebs auf einfache Weise neue Kategorien hinzugefügt werden. Schulungen ISIS bietet seinen Kunden ein spezielles Inhouse Schulungsservice in Form des Papyrus Capture Workshop. ISIS Papyrus References Credit Card ABN-AMRO Bank Taiwan American International Group Taiwan Capital One UK FDR First Data Ressources USA First Data Resources UK Lufthansa AirPlus Germany Lufthansa AirPlus Neu-Isenburg Germany Payserv Switzerland TSYS USA Direct Marketing EuroMail Netherlands Blair Corporation USA IBM Zurich Switzerland Rechenzentrum Schulte Germany SEMA Group Sweden Stroede Data Kungsbakka Sweden, Norway Distribution Donauland Austria Hapag Lloyd Germ Across any Nassjotryckeriet Sweden Banking Abbey National Financial Services UK Allianz Ireland Allied Irish Bank Ireland Astron Document Across Solutions UK Australian Retail Financial Services Australia Banc Sabadell Spain Banca 121 S.p.A. Italy Banca Agricola e Commerciale della Republica di San Marino Republica di San Marino Banca BSI Italia SpA Italy Banca Popolare di Milano Italy Banca Popolare di Sondrio Italy Bancaja Spain Banco Pastor Spain Banesto Spain Bank Leumi Tel Aviv Israel Bank of China Singapore Singapore Bank of Scotland UK Banque de France France Barmer Ersatzkasse Wuppertal Germany BAWAG Bank Vienna Austria BBVA Madrid Spain BBVA Portugal Portugal BNL Gestioni SGR Italy BNP Paribas France Bristol & West plc UK BSCH (Banco Santander Central Hispano) Spain Caisse Valaisianne de Compensation, Geneva Switzerland Caixa Catalunya Spain Caja de Madrid Spain Caja Laboral Spain Caja Rural de Sevilla Spain China Trust Commercial Bank Taiwan CITIBANK Germany CITIBANK Asia-Pacific Singapore Citibank Italia NA Italy CITIBANK Thailand Thailand Citigroup USA Commerzbank Germany COOP Bank Basel Switzerland Crédit Suisse España Spain Credit Suisse Zuerich Switzerland CS First Boston London UK Danske Bank Denmark Deutsche Bank Germany Deutsche Bank Luxembourg Dresdner Bank Germany Dreyfus Söhne + CIE AG Switzerland DWS Investment S.A. Germany EDS (for Bank of Canada) Canada EDS (Lloyds TSB) UK Euler Hermes France Fiditalia SpA Italy Findomestic Banca SpA Italy FISERV Investment Support Services USA Fuji Bank Tokyo Japan Gestitres France Hamburger Landesbank Germany HECM UK HFC Bank UK ING Bank Amsterdam Netherlands JACCS Japan Jyske Bank Denmark Kungthai Bank Bangkok Thailand Landesbank Baden Württemberg Germany Lloyds TSB Registrars UK M&G UK Nordea Denmark Denmark OCBC Bank Ltd Singapore PBZ CARDS d.o.o. Croatia PNC Bank USA Post Office Savings Bank Singapore Singapore PSK Austrian Postsparkasse Austria Rabobank ICT Netherlands RACON Software GmbH Austria R-G Premier Bank of Puerto Rico Puerto Rico Royal Bank Canada RSC Raiffeisen Daten-Service Center GmbH Austria SanPaolo France Schweizer Nationalbank Switzerland SE Banken Sweden SEB Bank Germany SEB Sweden Sweden SEC Servizi - Banche Popolari Italy Securicor (GTG Bankenservice GmbH) Germany SPARDAT Vienna Austria Stadshypothek Stockholm Sweden Swenska Handelsbanken Sweden Thai Farmers Bank Thailand UBS Basel Switzerland UBS Zurich Switzerland United Overseas Bank Malaysia Malaysia United Overseas Bank Singapore Singapore VISA Desjardins Montreal Canada Volkskreditbank AG Austria Volkswagen Bank GmbH Germany Volkswagen Financial Services UK West LB Germany Zürich Schweiz Switzerland Manufacturing Associated Wholesale Grocers USA Avon Cosmetics UK BASF AG Ludwigshafen Germany Canon GmbH Austria Carl Zeiss-Jena Germany Chevron USA Conoco/Phillips USA Deere & Company USA ENI SpA - SOFID Italy General Motors Germany Hapimag AG Baar Switzerland Henkel AG Duesseldorf Germany Hoechst AG Frankfurt Germany IKEA Sweden Infogold Welcom South Africa Istituto Geografico De Agostini Italy Iveco Finance Italy Kawasaki Heavy Industries Hyogo Japan Kawasaki Industries Tokio Japan Krupp Polysius Bekum Germany Mercury Marine USA Miele & Cie Germany Miroglio S.p.A. Italy Nissan Motors Kanagawa Japan Opel (General Motors) Germany Porsche AG Germany RCS Editori Italy Renault Automobile & Renault RCI France Rexnord Germany Samsung Data Systems Seoul Korea Schroff Germany Sony UK UK Thorn EMI Hvidivre Denmark US Steel USA Voest Alpine Austria Weru AG Germany Dassault France Neckermann Germany Ringier AG Switzerland Von Roll AG Switzerland Insurance Aachener Muenchner Versicherung Germany Achmea Netherlands AGF France Allianz Versicherung Stuttgart Germany Almindelig Brand Denmark ATP Huset Hillerod Denmark AXA Germany AXA Assicurazioni Italy AXA Insurance Ltd. UK AXA Non Life Insurance Japan AXA Royal Belge Belgium Chaucer Insurance UK Cornhill Insurance UK Credito y Caución Spain CSC South Africa CSC (City of Westminster Assurance) UK Daiwa Insurance Japan DAS Rechtsbijstand Netherlands Der Anker Austria E.A. Generali Versicherung Vienna Austria Fondiaria-SAI Italy Friends Provident UK Generali Netherlands Netherlands Gerling Konzern Germany GESI - Gruppo RAS Assicurazioni Italy ISISPAPYRUS TM Across Industries Banking Insurance Credit Card Utility Companies Telecommunication Manufacturing Healthcare Direct Marketing Government Any system made just for one industry segment will be as limited as its needs. With ISIS Cross-Industry solutions we can provide an unmatched spectrum of functionality for each one. The weighting of the requirements for ease-of-use, functionality, throughput and platform independence may differ among industries, but flexibility and quality are equally important for all. Grazer Wechselseitige Versicherung Austria Group Mornay France Hamburg Mannheimer Versicherung Germany Helvetia Patria Versicherung Switzerland Hibernian Insurance Ireland Hong Kong Securities Clearing Co. Ltd. China HUK Coburg Germany IVV Informationssysteme fuer Versicherungen Hannover Germany Jasuda Life Insurance Tokio Japan La Luxembourgeoise Luxembourg Legal and General Insurance Darthworth UK Liberty Life South Africa Lloyd Adriatico Trieste Italy MAPFRE Caja Salud Spain Mutualité Chrétienne, Christelijke Mutualiteite Belgium NFU Mutual Insurance UK Nichidan Inurance Insurance Tokyo Japan Norwich Union UK Parion Konzern Germany Providencia Insurance Budapest Hungary Provinzial Versicherung Germany Reale Mutua di Assicurazioni Italy Reihnland Versicherung Germany Sampo Insurance Finland Sanitas Switzerland Seguros Catalana Occidente Spain Societa’ Assicurazioni Industriali Italy Sparkassen Versicherung Germany Sun Life Canada SUVA Switzerland The Great West Life Assurance Company Canada Thrivent Financial for Lutherans USA Toro Assicurazioni Torino Italy Versicherungskammer Bayern Germany Victoria Volksbanken Versicherung Austria WellChoice, Inc USA Wiener Allianz Versicherungs AG Austria Winterthur Spain Winterthur Europe (Commercial Union Non Life) Belgium Winterthur Versicherung Switzerland Winterthur Versicherungen Austria Winterthur Versicherungen Switzerland Zürich Agrippina Gruppe Germany Zurich Insurance China Postal & Telecom Advanced Info Service Public Co. Ltd Thailand Arcor/Vodaphone Germany Austria Telekom Austria Belgacom/Belgacom Mobile Belgium Bell South Carrier Professional Services, Inc. USA British Telecom UK Canada Post Corporation Canada CGI-AMS USA Deutsche Bundespost/e-Post Germany Deutsche Post AG Germany Jazz Telecom Spain & Portugal Jersey Post UK Mannesmann VDO Germany Orange UK PTT Luxembourg Luxembourg Royal Mail Chesterfield UK Samart Corporation Thailand Singapore Telecommunications Ltd. Singapore Smart Communications, Inc. Philippines Swedish Post Sweden Telecomasia Bangkok Thailand Telefónica del Perú Peru Thai Telephone & Telecommunications Public Co. Ltd Thailand T-Mobil Germany United States Postal Service USA Vodafone Italy Edisontel S.p.A Italy Public Sector Austrian National Library Austria Ayuntamiento de Madrid (Madrid City Council) Spain BIT/VBS Switzerland Centre Informatique de L’Etat Luxembourg Chamber of Commerce Austria City of Vienna Austria Clackamas ESD USA Comune di Milano Italy EDS (Department of Social Security) UK EDS (OneCCV Job Seeker) UK INCM (Imprensa Nacional Casa da Moeda) Portugal INSS (Instituto Nacional de la Seguridad Sodial) Spain Land Transportation Authority Singapore Landeshauptstadt Duesseldorf Germany Landwirtschaftsverband Hannover Germany OSZE, general vote in Bosnia-Herzogovina Bosnia-Herzogovina San Diego City Schools USA SNCF France State Governments of Alaska, Georgia, Idaho, Nebraska, S. Dakota USA State of California: DMV, Calpers USA State of Oregon, Dept. of Transportation USA State of Wyoming USA Texas Department of Public Safety USA University of Alabama USA University Of North Dakota USA Western Michigan University USA European Patent Office Riyswijk Netherlands Finanzdirektion Zuerich Switzerland Ministere des finances France Ministry of Education Singapore Singapore Service AC Service AG Switzerland Aeroports de Paris France Air France France Alldata Germany Alliance Data Systems Corp. USA ARZ Allgemeines Rechenzentrum Aspheria France Austria Austrian Lotteries Austria Berjaya Registration Services Sdn Bhd Malaysia CCP UK Commision de la Sante et de Securite de Travail Quebec Canada Critical Mail Continuity Services Ltd. UK CTT (Correios Portugal) Portugal CW Agencies, Inc. Canada Dataservice SpA Italy Deutsche Bahn AG Germany EDS (Sabre Group/American Airlines) USA Elsag S.p.A. for Postel S.p.A. Italy ENRA Verzekeringen Netherlands Experian UK Fairfield Resorts USA FDC Denmark Fieramilano Italy GbD GmbH (Society for Paperless Document Processing) Germany Groupe S (SOPA) Belgium Hasbro UK IBM Norway Norway ICSC - Istituto Centrale Sostentamento Clero Italy InfoImage, Inc. USA Kommunedata Copenhagen Denmark Korea E-Post Center Korea Laboratories Dr. Kramer Germany Livestock Improvement Hamilton New Zealand National Computerboard Singapore Singapore Ordina Sociale Zekerheid Netherlands ORF Austria OSB Italy Pearson Government Solutions USA Periodici San Paolo Italy Personix, Inc. USA Postel S.p.A. Italy Presse Informatique France Professional Ducato Roccarde Megaplex Netherlands Servizi Italy Pulsen Dataproduction Sweden RCI Europe UK Schweizer Bundesbahn Basel Switzerland SDC Denmark SDI France Siemens Medical Solutions USA Sigma Moore Italy SPEOS France STEP S.p.A. Italy Stralfors Denmark SwissCom Switzerland Syndicated Office Systems USA TAP Air Portugal Spain Telepost (Serviços Correio Electrónico Postal) Portugal Telepost (Serviços Correio Electrónico Postal) Portugal Television Broadcasts Ltd China Telus Communications Inc. Canada The Toronto Star Canada T-Systems Germany TÜV Austria Ventura UK Utility AGSM Italy Central Maine Power USA Energie AG Linz Austria FirstEnergy Corp. USA Gas Natural Informática Spain KELAG Austria Keyspan Energy Services USA Meccanografica S.p.A. Italy Scottish & Southern Energy plc UK Stadtwerke Wuppertal Germany Wienstrom Vienna Austria ISISPAPYRUS TM Contact Europe P: +43-2236-27551 F: +43-2236-21081 America P: 817-416-2345 F: 817-416-1223 Asia Pacific P: +65-6339-8719 F: +65-6336-6933 E-mail [email protected] Internet www.isis-papyrus.com