DATEV DMS: Informationen zur OCR Volltexterkennung
Aktuelle Änderungen |
|
20.11.2023 |
Das Dokument wurde auf Aktualität geprüft. Bei der Prüfung haben sich keine inhaltlichen Änderungen ergeben. |
1 Über dieses Dokument
In diesem Dokument erhalten Sie die Hintergründe zur Funktionsweise der serverseitigen Volltexterkennung (OCR) in DATEV DMS.
2 Hintergrund
Damit Sie in DATEV DMS Ihre Dokumente per Volltext-Recherche finden, muss das System für alle nach DATEV DMS übernommenen und neu abgelegten Dokumente den Volltext ermitteln. Hierzu wird in jedem Dokument der Inhalt analysiert und in eine Volltextdatenbank geschrieben.
Die Volltexterkennung erfolgt direkt bei der Ablage des Dokuments in DATEV DMS über den DATEV DMS OCR Service (Dienst). Der Dienst läuft automatisch auf dem System mit DATEV DMS Server (meist der Fileserver). In der OCR Datenbank wird der Server hinterlegt, an dem zuerst die Installation von DATEV DMS Server durchgeführt wurde. Eine manuelle Auswahl bei Einsatz von mehreren Servern ist möglich. Eine Anleitung finden Sie hier: DATEV DMS: Anderen Server für die OCR-Volltexterkennung konfigurieren (Dok.-Nr. 1022818)
Nur für technisch versierte Anwender - Eigenen DATEV DMS Server einrichten
Die Serverkomponente von DATEV DMS kann auf dem Fileserver oder auf einem separaten Server installiert werden. Mit dem Einsatz eines separaten Servers für DATEV DMS lagern Sie die SQL-Datenbanken von DATEV DMS, den Dienst des Posteingangsassistenten und auch die OCR-Erkennung aus. Weitere Informationen: Eigenen Server für DATEV DMS einrichten (Dok.-Nr. 1021147) |
3 Notwendige Voraussetzungen
Für die Nutzung der Volltexterkennung ist die Installation der Office IFilter auf dem Server notwendig!
Sie können die Office IFilter unabhängig von der Microsoft Office-Version direkt über das Paket „Microsoft Office 2010 Filter Packs“ (32Bit oder 64Bit je nach eingesetztem Betriebssystem) installieren.
Alternativ ist die Installation einer Microsoft Office Version auf dem System möglich.
Der Server-Dienst zur OCR Volltexterkennung benötigt mind. 10GB freien Speicherplatz auf dem Laufwerk mit dem installierten Betriebssystem (meistens <C:>). Die OCR Volltexterkennung wird beendet, sobald der verfügbare Speicherplatz geringer als 5GB ist.
4 Prozesse und Ressourcenbedarf
Die folgenden Prozesse sind bei der OCR Erkennung beteiligt:
Prozess |
Anzahl |
Datev.Dms.Ocr.Service.exe |
einmalig, unabhängig vom Datenpfad |
Datev.Dms.Ocr.Server.exe |
pro Datenpfad |
Datev.Dms.Ocr.IFilterEngine.exe |
pro Datenpfad |
OCRService.exe |
einmalig, unabhängig vom Datenpfad |
OCRServer.exe |
unabhängig vom Datenpfad, kann mehrfach vorkommen |
Die OCR Volltexterkennung belegt während der Erkennung immer einen CPU-Kern. Bei z. B. 4 Kernen wird also maximal 25% der CPU-Leistung genutzt.