Als E-Mail senden
1025582

Aktuelle Änderungen

10.11.2023

Das Dokument wurde auf Aktualität geprüft. Bei der Prüfung haben sich keine inhaltlichen Änderungen ergeben.

1 Situationsbeschreibung

In diesem Dokument erhalten Sie Informationen zu möglichen Abhilfen bei Problemen mit der Volltexterkennung (OCR) in DATEV DMS.

2 Ursache

Es gibt unterschiedliche Ursachen für Probleme bei der Volltexterkennung:

  • Wenn die Volltextermittlung nicht läuft, kann dies an einer fehlerhaften Einrichtung oder nicht ausreichendem Speicherplatz liegen.

  • Wenn bestimmte Dateien nicht erkannt werden, können notwendige Voraussetzungen (Installation der iFilter, ausreichende Qualität der eingescannten Dokumente etc.) nicht erfüllt sein.

  • Manche Dokumente können nicht volltexterkannt werden (passwortgeschützte Dokumente, verschlüsselte Dokumente etc.).

Wie Sie mögliche Ursachen ermitteln und die entsprechenden Abhilfen durchführen können, ist in diesem Dokument aufgeführt.

3 Abhilfe

3.1 Funktionsfähigkeit der Volltextermittlung prüfen

Um festzustellen, welches Problem bei der Volltextermittlung besteht, prüfen Sie zunächst, ob diese grundsätzlich läuft:

Fortschritt der Volltextermittlung per Filter prüfen
Voraussetzung:
  • In DATEV Benutzerverwaltung: das Recht Hauptadministrator (bei einer Anmeldung als Benutzer sind Dokumente ggf. aufgrund von Sperren nicht sichtbar)

  • In DATEV DMS / Dokumentenablage: geöffnete Dokumentenliste

Vorgehen:
1

Auf das Filter-Symbol klicken und Neuen Filter anlegen… wählen.

2

Bezeichnung vergeben, z. B. Volltext Warteschlange.

3

Gültigkeit Nur für mich oder Systemweit wählen.

4

Auf Kriterium hinzufügen klicken.

5

Folgende Kriterien wählen:

Feld: Volltextermittlung

Operator: gleich

Wert: in der Warteschlange

6

Anlage des Filters mit OK bestätigen.

7

Neuen Filter über die Übersicht aufrufen.

Ihnen werden alle Dokumente angezeigt, die noch in der Warteschlange für die Volltextermittlung stehen. Wenn Sie prüfen wollen, ob die Volltextermittlung läuft, warten Sie einige Zeit und aktualisieren Sie die Dokumentenliste über das Symbol (Aktualisieren) oder die Taste F5. Wenn sich die Anzahl der Dokumente in der Warteschlange reduziert, wird die Volltextwarteschlange abgearbeitet.

Gesamtanzahl über 20 000 Dokumente

Wenn die Gesamtanzahl der Dokumente in der Volltextwarteschlange über 20 000 beträgt, werden Ihnen nur 20 000 Dokumente in der Übersicht angezeigt. Prüfen Sie links in der Ablagestruktur, ob sich die tatsächliche Anzahl der Dokumente, die in Klammern hinter dem entsprechenden Bereich angezeigt wird, verringert:

3.2 Korrekten Server in der OCR-Datenbank eintragen

3.2.1 Server in der OCR-Datenbank eintragen

Korrekten Server in der OCR-Datenbank eintragen
Voraussetzung:

Administrator-Rechte in Windows

Vorgehen:
1

Am DATEV DMS Server (meist Fileserver): Windows-Explorer öffnen.

2

In das Verzeichnis %datevpp%\PROGRAMM\K0000276 navigieren.

3

Die Datei Datev.Dms.Ocr.SettingsConfigurator.exe mit Administrator-Rechten ausführen.

Nach dem Öffnen einer Command Box wird das Fenster Einstellungen DATEV DMS OCR-Service geöffnet.

Hinweis
Command Box nicht schließen

Wenn der falsche Server in der Datenbank eingetragen ist, kann der Aufruf des Fensters Einstellungen DATEV DMS OCR-Service einige Zeit dauern. Schließen Sie in dieser Zeit auf keinen Fall die Command Box.

4

Im Feld Servername: Den Namen des Servers eintragen, auf dem die Komponente DATEV DMS Server installiert ist. Die Volltextermittlung findet auf diesem Server statt, nicht auf dem Windows Terminalserver / Client.

Im Feld Datenpfad: Den Datenpfad von DATEV DMS eintragen. Wenn es mehrere Datenpfade gibt, alle Datenpfade eintragen.

Hinweis
Datenpfad über den DATEV SQL-Manager einsehen

Der Datenpfad muss so eingetragen werden, wie er im DATEV SQL-Manager (Administrator) steht. Der Datenpfad für DATEV DMS im DATEV SQL-Manager endet auf DOKORG. Wichtig: Nicht DOKORG_D oder DOKORG_V. In das Feld Datenpfad muss der Datenpfad dann mit 2 Backslashs „\\“ am Anfang und ohne „DOKORG“ am Ende eingetragen werden.

Wenn bereits der korrekte Server / Datenpfad eingetragen ist, fahren Sie mit Kapitel Dienste und Speicherplatz prüfen fort.

5

Auf OK klicken.

Die Konfiguration für die Volltexterkennung ist abgeschlossen.

3.2.2 Registry-Eintrag der iFilter prüfen

Registry-Eintrag vom Datenpfad prüfen
Voraussetzung:

Administrator-Rechte in Windows

Vorgehen:
1

Windows-Taste drücken, regedit eingeben und mit Enter bestätigen.

Der Registrierungs-Editor wird geöffnet.

2

Zu HKEY_CURRENT_USER\Software\DATEVeg\Components\K0000276\Versions\1.0\SelectedDataDirectories\Data\Sel1 navigieren.

3

Auf der rechten Seite den Wert SelComputer prüfen und ggf. korrigieren. Hier muss der Computername des DATEV DMS Servers stehen.

4

Zu HKEY_USERS\S-1-5-18\Software\DATEVeg\Components\K0000276\Versions\1.0\SelectedDataDirectories\Data\Sel1 navigieren.

5

Auf der rechten Seite den Wert SelComputer prüfen und ggf. korrigieren. Hier muss der Computername des DATEV DMS Servers stehen.

3.3 Dienste und Speicherplatz prüfen

3.3.1 Dienst prüfen

Dienst prüfen
Voraussetzung:

Administrator-Rechte in Windows

Vorgehen:
1

Am DATEV DMS Server (meist Fileserver): Dienste aufrufen.

2

Beim Dienst Datev.Dms.Ocr.Service muss Folgendes eingestellt sein:

  • Starttyp: Manuell

  • Anmelden als: Lokales System

3

Den Dienst Datev.Dms.Ocr.Service manuell beenden.

4

Den Dienst Datev.Dms.Ocr.Service manuell starten.

Im Taskmanager müssen die 2 Prozesse Datev.Dms.Ocr.Server.exe und Datev.Dms.Ocr.iFilterEngine.exe erscheinen.

5

Wenn die Prozesse nicht erscheinen oder wenn der Dienst sich nach dem manuellen Start sofort wieder beendet: Speicherplatz prüfen

3.3.2 Speicherplatz prüfen

Speicherplatz prüfen
Vorgehen:
1

Am DATEV DMS Server (meist Fileserver): Windows-Explorer öffnen.

2

Den freien Speicherplatz prüfen:

Der Server-Dienst zur OCR Volltexterkennung benötigt mind. 10GB freien Speicherplatz auf dem Laufwerk mit dem installierten Betriebssystem (meistens <C:>). Die OCR Volltexterkennung wird beendet, sobald der verfügbare Speicherplatz geringer als 5GB ist.

Wenn der Speicherplatz ausreichend ist und die Volltextermittlung weiterhin nicht läuft:

Wenden Sie sich per Servicekontakt mit dem Betreff Volltextermittlung läuft nicht an DATEV. Wählen Sie das Produkt DATEV DMS.

3.4 Nicht erkannte Dokumente prüfen

Wenn die Volltextermittlung grundsätzlich läuft, muss geprüft werden, welche Art von Dokumenten nicht volltexterkannt werden. Wenn Sie eine Regelmäßigkeit erkennen können:

Wenn Dokumente verschiedener Dokumenttypen nicht erkannt werden, fahren Sie mit dem Kapitel Einzelne Dokumente unterschiedlicher Dateitypen werden nicht erkannt fort.

3.4.1 Microsoft Office-Dokumente werden nicht erkannt

3.4.1.1 iFilter installieren
iFilter installieren
Voraussetzung:

Administrator-Rechte in Windows

Vorgehen:
1

Am DATEV DMS Server (meist Fileserver): Systemsteuerung öffnen.

2

Unter Programme | Programme und Features: Nach dem Microsoft Filter Pack suchen.

Wenn das Microsoft Filter Pack nicht installiert ist, das Microsoft Filter Pack auf der Seite von Microsoft downloaden: Microsoft Office 2010 Filter Packs

3

Je nach eingesetztem Betriebssystem das Microsoft Filter Pack 32Bit oder 64Bit installieren.

Alternativ zur Installation der iFilter ist die Installation einer Microsoft Office Version auf dem System möglich.

3.4.2 PDF-Dokumente werden nicht erkannt

Wenn PDF-Dokumente nicht erkannt werden, prüfen Sie den Registry-Eintrag der iFilter;

Registry-Eintrag der iFilter prüfen
Voraussetzung:

Administrator-Rechte in Windows

Vorgehen:
1

Windows-Taste drücken, regedit eingeben und mit Enter bestätigen.

Der Registrierungs-Editor wird geöffnet.

2

Zu HKEY_CLASSES_ROOT\.pdf\PersistentHandler navigieren.

3

Den Wert {1AA9BF05-9A97-48c1-BA28-D9DCE795E93C} eintragen.

3.4.3 Bild-Dokumente werden nicht erkannt

Damit der Volltext von Bild-Dokumenten korrekt erkannt wird, empfiehlt DATEV bestimmte Einstellungen, auf die beim Scannen geachtet werden sollte:

3.4.3.1 Qualität der gescannten Dokumente prüfen

Ziel ist es, beim Scannen ein kleines Dateiformat bei guter Lesbarkeit zu erhalten. Eine gescannte DIN-A4-Seite hat im Durchschnitt ein Volumen zwischen 50 und 100 KB.

Gute Erfahrungswerte bieten:

  • Dateitypen:

    • TIF/TIFF

    • PDF (Stempel, Notizen und Markierungen nur mit DATEV DMS)

  • Modus: schwarz-weiß

    • Durch das Scannen in Graustufen oder in Farbe vergrößert sich das Volumen der Datei erheblich. Es sollte daher nur in begründeten Ausnahmefällen genutzt werden (z.B. graue Unterlegung ["Zebrastreifen"] von Zahlen).

    • Die Volltexterkennung (OCR) erzielt aufgrund des besseren Kontrasts die besten Ergebnisse bei schwarz-weiß-Dokumenten.

  • Auflösung: 300 dpi

    • Höhere Auflösungen vergrößern das Volumen der Datei erheblich und haben auch beim späteren Ausdruck im DINA4-Format wenig Mehrwert.

3.4.4 Einzelne Dokumente unterschiedlicher Dateitypen werden nicht erkannt

Bestimmte Dokumente können nicht von der OCR erkannt werden:

  • Anlagen von E-Mails

    Anlagen einer E-Mail können nicht erkannt werden, wenn diese nicht als eigene Dateien in der Dokumentstruktur gespeichert werden. In diesem Fall wird nur der Text der E-Mail erkannt. Damit die Anlage durch die Volltexterkennung läuft, wählen Sie bei der Ablage die Option E-Mail mit Anlagen zusätzlich in Dokumentstruktur oder Nur Anlagen in Dokumentstruktur.

  • Eingebettete Dateien

  • Eine eingebettete Datei ist z. B. eine Microsoft-Excel-Tabelle in einem Microsoft-Word-Dokument. In diesem Fall wird nur der Text des „Hauptdokuments“, also des Microsoft-Word-Dokuments, ermittelt.

  • Verschlüsselte Dateien

  • Kennwortgeschützte Dateien

3.4.4.1 Unterstützte Dateitypen prüfen
Unterstützte Dateitypen prüfen
Vorgehen:
1

Das Dokument per Drag & Drop aus DATEV DMS z. B. auf den Desktop ziehen, um den Dateityp einzusehen.

2

Prüfen, ob der Dateityp von der Volltextermittlung unterstützt wird.

Folgende Dateitypen werden unterstützt:

  • .BAT

  • .BMP

  • .CMD

  • .CSV

  • .DNOTE

  • .DOC / .DOCX

  • .DOCM

  • .DOT / .DOTX

  • .GIF

  • .HTM

  • .HTML

  • .INI

  • .JPG / .JPEG

  • .LOG

  • .MHT

  • .MHTML

  • .MSG

  • .ODP

  • .ODS

  • .ODT

  • .PDF

  • .PNG

  • .PPS / .PPSX

  • .PPSM

  • .PPT / .PPTX

  • .PPTM

  • .RTF

  • .TIFF / .TIF

  • .TXT

  • .XLAM

  • .XLS / .XLSX

  • .XLSB

  • .XLSM

  • .XLT

  • .XLW

  • .XML

Hinweis
Falscher Dateityp

In seltenen Fällen passt Dateityp nicht zur abgelegten Datei. Beispiel: RTF-Dokumente werden mit der Dateiendung .doc abgespeichert. Dies können Sie folgendermaßen prüfen: Wenn Sie das Dokument in Microsoft Word öffnen und Speichern unter wählen, steht beim Format nicht „.doc“, sondern „.rtf“.

Wenn das Dokument prinzipiell volltextermittelt werden kann, führen Sie eine manuelle Volltextermittlung durch:

3.4.4.2 Volltext manuell ermitteln
Volltext ermitteln für ein einzelnes Dokument
Voraussetzung:

In DATEV DMS / Dokumentenablage: geöffnete Dokumentenliste

Vorgehen:
1

Gewünschtes Dokument in der Dokumentenliste markieren.

2

Im Menü: Bearbeiten | Volltext | Volltext ermitteln wählen.

Am Dokument wird das Kennzeichen gesetzt, dass der Volltext ermittelt werden soll.

Der Volltext ist für das Dokument ermittelt. Das Dokument kann jetzt auch über die Volltextsuche gefunden werden.

Wenn der Volltext weiterhin nicht ermittelt wird:

Wenden Sie sich per Servicekontakt mit dem Betreff Volltext wird nicht ermittelt an DATEV. Wählen Sie das Produkt DATEV DMS.

Service-TAN
Kundensupport
Der Internet Explorer ist veraltet und wird nicht mehr unterstützt!

Für einen uneingeschränkten Funktionsumfang empfiehlt DATEV einen modernen Standard-Browser zu verwenden, wie z.B.: