DATEV DMS: Probleme mit der Volltextermittlung (OCR)
Aktuelle Änderungen |
|
10.11.2023 |
Das Dokument wurde auf Aktualität geprüft. Bei der Prüfung haben sich keine inhaltlichen Änderungen ergeben. |
1 Situationsbeschreibung
In diesem Dokument erhalten Sie Informationen zu möglichen Abhilfen bei Problemen mit der Volltexterkennung (OCR) in DATEV DMS.
2 Ursache
Es gibt unterschiedliche Ursachen für Probleme bei der Volltexterkennung:
-
Wenn die Volltextermittlung nicht läuft, kann dies an einer fehlerhaften Einrichtung oder nicht ausreichendem Speicherplatz liegen.
-
Wenn bestimmte Dateien nicht erkannt werden, können notwendige Voraussetzungen (Installation der iFilter, ausreichende Qualität der eingescannten Dokumente etc.) nicht erfüllt sein.
-
Manche Dokumente können nicht volltexterkannt werden (passwortgeschützte Dokumente, verschlüsselte Dokumente etc.).
Wie Sie mögliche Ursachen ermitteln und die entsprechenden Abhilfen durchführen können, ist in diesem Dokument aufgeführt.
3 Abhilfe
3.1 Funktionsfähigkeit der Volltextermittlung prüfen
Um festzustellen, welches Problem bei der Volltextermittlung besteht, prüfen Sie zunächst, ob diese grundsätzlich läuft:
Fortschritt der Volltextermittlung per Filter prüfen | |
Voraussetzung:
|
|
Vorgehen: | |
1 |
Auf das |
2 |
Bezeichnung vergeben, z. B. Volltext Warteschlange. |
3 |
Gültigkeit Nur für mich oder Systemweit wählen. |
4 |
Auf |
5 |
Folgende Kriterien wählen: Feld: Volltextermittlung Operator: gleich Wert: in der Warteschlange |
6 |
Anlage des Filters mit OK bestätigen. |
7 |
Neuen Filter über die Übersicht aufrufen. |
Ihnen werden alle Dokumente angezeigt, die noch in der Warteschlange für die Volltextermittlung
stehen. Wenn Sie prüfen wollen, ob die Volltextermittlung läuft, warten Sie einige
Zeit und aktualisieren Sie die Dokumentenliste über das Symbol |
Gesamtanzahl über 20 000 Dokumente
Wenn die Gesamtanzahl der Dokumente in der Volltextwarteschlange über 20 000 beträgt, werden Ihnen nur 20 000 Dokumente in der Übersicht angezeigt. Prüfen Sie links in der Ablagestruktur, ob sich die tatsächliche Anzahl der Dokumente, die in Klammern hinter dem entsprechenden Bereich angezeigt wird, verringert:

-
Wenn die Volltextwarteschlange nicht abgearbeitet wird, fahren Sie mit Kapitel Korrekten Server in der OCR-Datenbank eintragen fort.
-
Wenn die Volltextwarteschlange abgearbeitet wird, läuft die OCR grundsätzlich.
-
Wenn bestimmte Dokumente nicht volltexterkannt werden, fahren Sie mit Kapitel Nicht erkannte Dokumente prüfen fort.
-
Wenn die Volltextermittlung zu langsam läuft, gehen Sie nach der Anleitung in folgenden Dokument vor: Volltextermittlung beschleunigen (Dok.-Nr. 1022639)
-
3.2 Korrekten Server in der OCR-Datenbank eintragen
3.2.1 Server in der OCR-Datenbank eintragen
Korrekten Server in der OCR-Datenbank eintragen | |||
Voraussetzung:
Administrator-Rechte in Windows |
|||
Vorgehen: | |||
1 |
Am DATEV DMS Server (meist Fileserver): Windows-Explorer öffnen. |
||
2 |
In das Verzeichnis %datevpp%\PROGRAMM\K0000276 navigieren. |
||
3 |
Die Datei Datev.Dms.Ocr.SettingsConfigurator.exe mit Administrator-Rechten ausführen. Nach dem Öffnen einer Command Box wird das Fenster Einstellungen DATEV DMS OCR-Service geöffnet.
|
||
4 |
Im Feld Servername: Den Namen des Servers eintragen, auf dem die Komponente DATEV DMS Server installiert ist. Die Volltextermittlung findet auf diesem Server statt, nicht auf dem Windows Terminalserver / Client. Im Feld Datenpfad: Den Datenpfad von DATEV DMS eintragen. Wenn es mehrere Datenpfade gibt, alle Datenpfade eintragen.
Wenn bereits der korrekte Server / Datenpfad eingetragen ist, fahren Sie mit Kapitel Dienste und Speicherplatz prüfen fort. |
||
5 |
Auf OK klicken. |
||
Die Konfiguration für die Volltexterkennung ist abgeschlossen. |
3.2.2 Registry-Eintrag der iFilter prüfen
Registry-Eintrag vom Datenpfad prüfen | |
Voraussetzung:
Administrator-Rechte in Windows |
|
Vorgehen: | |
1 |
Windows-Taste drücken, regedit eingeben und mit Enter bestätigen. Der Registrierungs-Editor wird geöffnet. |
2 |
Zu HKEY_CURRENT_USER\Software\DATEVeg\Components\K0000276\Versions\1.0\SelectedDataDirectories\Data\Sel1 navigieren. |
3 |
Auf der rechten Seite den Wert SelComputer prüfen und ggf. korrigieren. Hier muss der Computername des DATEV DMS Servers stehen. |
4 |
Zu HKEY_USERS\S-1-5-18\Software\DATEVeg\Components\K0000276\Versions\1.0\SelectedDataDirectories\Data\Sel1 navigieren. |
5 |
Auf der rechten Seite den Wert SelComputer prüfen und ggf. korrigieren. Hier muss der Computername des DATEV DMS Servers stehen. |
3.3 Dienste und Speicherplatz prüfen
3.3.1 Dienst prüfen
Dienst prüfen | |
Voraussetzung:
Administrator-Rechte in Windows |
|
Vorgehen: | |
1 |
Am DATEV DMS Server (meist Fileserver): Dienste aufrufen. |
2 |
Beim Dienst Datev.Dms.Ocr.Service muss Folgendes eingestellt sein:
|
3 |
Den Dienst Datev.Dms.Ocr.Service manuell beenden. |
4 |
Den Dienst Datev.Dms.Ocr.Service manuell starten. Im Taskmanager müssen die 2 Prozesse Datev.Dms.Ocr.Server.exe und Datev.Dms.Ocr.iFilterEngine.exe erscheinen. |
5 |
Wenn die Prozesse nicht erscheinen oder wenn der Dienst sich nach dem manuellen Start sofort wieder beendet: Speicherplatz prüfen |
3.3.2 Speicherplatz prüfen
Speicherplatz prüfen | |
Vorgehen: | |
1 |
Am DATEV DMS Server (meist Fileserver): Windows-Explorer öffnen. |
2 |
Den freien Speicherplatz prüfen: Der Server-Dienst zur OCR Volltexterkennung benötigt mind. 10GB freien Speicherplatz auf dem Laufwerk mit dem installierten Betriebssystem (meistens <C:>). Die OCR Volltexterkennung wird beendet, sobald der verfügbare Speicherplatz geringer als 5GB ist. |
Wenn der Speicherplatz ausreichend ist und die Volltextermittlung weiterhin nicht läuft:
Wenden Sie sich per Servicekontakt mit dem Betreff Volltextermittlung läuft nicht an DATEV. Wählen Sie das Produkt DATEV DMS.
-
Servicekontakt aufrufen: Am unteren Ende von DATEV Hilfe-Center auf Servicekontakt klicken.
-
Anleitung: Servicekontakt anlegen (Dok.-Nr. 1071593)
3.4 Nicht erkannte Dokumente prüfen
Wenn die Volltextermittlung grundsätzlich läuft, muss geprüft werden, welche Art von Dokumenten nicht volltexterkannt werden. Wenn Sie eine Regelmäßigkeit erkennen können:
Wenn Dokumente verschiedener Dokumenttypen nicht erkannt werden, fahren Sie mit dem Kapitel Einzelne Dokumente unterschiedlicher Dateitypen werden nicht erkannt fort.
3.4.1 Microsoft Office-Dokumente werden nicht erkannt
3.4.1.1 iFilter installieren
iFilter installieren | |
Voraussetzung:
Administrator-Rechte in Windows |
|
Vorgehen: | |
1 |
Am DATEV DMS Server (meist Fileserver): Systemsteuerung öffnen. |
2 |
Unter Programme | Programme und Features: Nach dem Microsoft Filter Pack suchen. Wenn das Microsoft Filter Pack nicht installiert ist, das Microsoft Filter Pack auf der Seite von Microsoft downloaden: Microsoft Office 2010 Filter Packs |
3 |
Je nach eingesetztem Betriebssystem das Microsoft Filter Pack 32Bit oder 64Bit installieren. |
Alternativ zur Installation der iFilter ist die Installation einer Microsoft Office Version auf dem System möglich.
3.4.2 PDF-Dokumente werden nicht erkannt
Wenn PDF-Dokumente nicht erkannt werden, prüfen Sie den Registry-Eintrag der iFilter;
Registry-Eintrag der iFilter prüfen | |
Voraussetzung:
Administrator-Rechte in Windows |
|
Vorgehen: | |
1 |
Windows-Taste drücken, regedit eingeben und mit Enter bestätigen. Der Registrierungs-Editor wird geöffnet. |
2 |
Zu HKEY_CLASSES_ROOT\.pdf\PersistentHandler navigieren. |
3 |
Den Wert {1AA9BF05-9A97-48c1-BA28-D9DCE795E93C} eintragen. |
3.4.3 Bild-Dokumente werden nicht erkannt
Damit der Volltext von Bild-Dokumenten korrekt erkannt wird, empfiehlt DATEV bestimmte Einstellungen, auf die beim Scannen geachtet werden sollte:
3.4.3.1 Qualität der gescannten Dokumente prüfen
Ziel ist es, beim Scannen ein kleines Dateiformat bei guter Lesbarkeit zu erhalten. Eine gescannte DIN-A4-Seite hat im Durchschnitt ein Volumen zwischen 50 und 100 KB.
Gute Erfahrungswerte bieten:
-
Dateitypen:
-
TIF/TIFF
-
PDF (Stempel, Notizen und Markierungen nur mit DATEV DMS)
-
-
Modus: schwarz-weiß
-
Durch das Scannen in Graustufen oder in Farbe vergrößert sich das Volumen der Datei erheblich. Es sollte daher nur in begründeten Ausnahmefällen genutzt werden (z.B. graue Unterlegung ["Zebrastreifen"] von Zahlen).
-
Die Volltexterkennung (OCR) erzielt aufgrund des besseren Kontrasts die besten Ergebnisse bei schwarz-weiß-Dokumenten.
-
-
Auflösung: 300 dpi
-
Höhere Auflösungen vergrößern das Volumen der Datei erheblich und haben auch beim späteren Ausdruck im DINA4-Format wenig Mehrwert.
-
3.4.4 Einzelne Dokumente unterschiedlicher Dateitypen werden nicht erkannt
Bestimmte Dokumente können nicht von der OCR erkannt werden:
-
Anlagen von E-Mails
Anlagen einer E-Mail können nicht erkannt werden, wenn diese nicht als eigene Dateien in der Dokumentstruktur gespeichert werden. In diesem Fall wird nur der Text der E-Mail erkannt. Damit die Anlage durch die Volltexterkennung läuft, wählen Sie bei der Ablage die Option E-Mail mit Anlagen zusätzlich in Dokumentstruktur oder Nur Anlagen in Dokumentstruktur.
-
Eingebettete Dateien
-
Eine eingebettete Datei ist z. B. eine Microsoft-Excel-Tabelle in einem Microsoft-Word-Dokument. In diesem Fall wird nur der Text des „Hauptdokuments“, also des Microsoft-Word-Dokuments, ermittelt.
-
Verschlüsselte Dateien
-
Kennwortgeschützte Dateien
3.4.4.1 Unterstützte Dateitypen prüfen
Unterstützte Dateitypen prüfen | |
Vorgehen: | |
1 |
Das Dokument per Drag & Drop aus DATEV DMS z. B. auf den Desktop ziehen, um den Dateityp einzusehen. |
2 |
Prüfen, ob der Dateityp von der Volltextermittlung unterstützt wird. Folgende Dateitypen werden unterstützt:
|
Falscher Dateityp
In seltenen Fällen passt Dateityp nicht zur abgelegten Datei. Beispiel: RTF-Dokumente werden mit der Dateiendung .doc abgespeichert. Dies können Sie folgendermaßen prüfen: Wenn Sie das Dokument in Microsoft Word öffnen und Speichern unter wählen, steht beim Format nicht „.doc“, sondern „.rtf“. |
Wenn das Dokument prinzipiell volltextermittelt werden kann, führen Sie eine manuelle Volltextermittlung durch:
3.4.4.2 Volltext manuell ermitteln
Volltext ermitteln für ein einzelnes Dokument | |
Voraussetzung:
In DATEV DMS / Dokumentenablage: geöffnete Dokumentenliste |
|
Vorgehen: | |
1 |
Gewünschtes Dokument in der Dokumentenliste markieren. |
2 |
Im Menü: Bearbeiten | Volltext | Volltext ermitteln wählen. Am Dokument wird das Kennzeichen gesetzt, dass der Volltext ermittelt werden soll. |
Der Volltext ist für das Dokument ermittelt. Das Dokument kann jetzt auch über die Volltextsuche gefunden werden. |
Wenn der Volltext weiterhin nicht ermittelt wird:
Wenden Sie sich per Servicekontakt mit dem Betreff Volltext wird nicht ermittelt an DATEV. Wählen Sie das Produkt DATEV DMS.
-
Servicekontakt aufrufen: Am unteren Ende von DATEV Hilfe-Center auf Servicekontakt klicken.
-
Anleitung: Servicekontakt anlegen (Dok.-Nr. 1071593)