• Skip to primary navigation
  • Skip to main content
Fellow Consulting AG

Fellow Consulting AG

where people work together

  • Produkte & Services
    • Digitale Transformation
      • Intelligent Open Network
    • Infor OS
    • Strategischer Einsatz von Open Source im Unternehmen
    • Ephesoft Transact – IDM-Capture
      • FellowKV²-Plugin
      • TableExtraction²-Plugin
    • Marketing & CRM
      • Oktopost – Social Marketing
      • Sugar Market
      • SugarCRM
  • Customer Success Stories
    • MVTec – SugarCRM für einen globalen Hersteller
    • Bet3000 – SugarCRM für Glücksspiele
    • Coloplast – Mobiles CRM für Life Science
    • Diversey – Mobiles CRM und Wartung für Reinigung und Hygiene
    • Diversey – Online Shop
    • Jochen Schweizer – SugarCRM für die Freizeit
    • Acnos Pharma rationalisiert Arbeitsabläufe
    • Deutsche Presse-Agentur (dpa)
  • Fellow
    • Über uns
    • Karriere: Wir stellen ein!
    • Kontakt
    • Optin
    • Partner
  • Deutsch
    • English
  • Show Search
Hide Search

Künstliche Intelligenz im Fellow KV² PlugIn

Julian Obermeier · 12. Juli 2021 ·

Teilen

Wie Sie bereits wissen, macht unser KV² Plugin Ephesoft selbstlernend. Es sorgt dafür, dass Erkennungs- und Extraktionsregeln für Dokumente sich kontinuierlich verbessern und aktualisieren. Die folgenden Techniken werden auf Basis von vorheriger Transformation in ein OCR Dokument angewandt.


Durch maschinelles Lernen ist unser PlugIn in der Lage…

  1. …die Dokumente über #TF-IDF zu analysieren und zu identifizieren
  2. …Extraktionsregeln zu synchronisieren und
  3. …neue Extraktionsregeln durch einmalige menschliche Hilfe einzufügen und anschließend selbstständig anzuwenden

Wir möchten in diesem Blog gerne auf den Begriff TF-IDF näher eingehen und Ihnen diesen in der Theorie erklären, sodass die Erfolge in der Praxis  besser zu verstehen sind. Wie oben bereits beschrieben geht es hierbei um die Identifizierung, Klassifizierung und Analyse von Dokumenten. TF-IDF (der Begriff wird in der unten stehenden Formel erläutert) gibt jedem Dokument einen Identifikator.

#TF-IDF

Dieser Identifikator beschreibt das Maß für die Originalität eines gewissen Wortes, indem die Anzahl des Vorkommens eines Wortes in einem Dokument mit der Anzahl der Dokumente, in denen das Wort vorkommt, verglichen wird.

Klingt kompliziert? Vereinfacht gesagt, TF-IDF misst die Ähnlichkeit von Dokumenten.

D.h. die Häufigkeit eines Wortes (TF) wird in unserem PlugIn mit der Inversen Dokumentenhäufigkeit (IDF) verglichen.

Danach ergibt sich folgende Graphik:

Die einzelnen Punkte auf dieser Graphik stellen Begriffskennzeichen dar. Das interessante ist die Clusterbildung hinter diesen Punkten.

Die Cluster geben Auskunft darüber, welche Rechnungen von welchen Lieferanten ausreichend ähnlich sind.

Somit sind wir in der Lage Extraktionsregeln gewissen Lieferanten zuzuordnen, sodass nicht für jeden Lieferanten ein neues Regel- und somit Extraktionstemplate erstellt werden muss.

Jetzt wissen Sie mehr über die TF-IDF Funktion unseres PlugIns. Im nächsten Blog tauchen wir noch tiefer ein!


Teilen

News Document management, Ephesoft, Extraction, Regex, TFIDF

Weitere Blogs

In diesem Blogbeitrag stellen wir Ihnen einige der besten Tipps vor, wie Sie den Prozess einfacher und effizienter gestalten können.

In diesem Blogbeitrag erörtern wir die Vorteile der Verwendung einer Low-Code-Plattform mit CRM, um Ihr Unternehmen zu vergrößern.

Digitalisierung forciert Low-Code-Entwicklung

Die Digitalisierung und auch der Fachkräftemangel haben die Nachfrage nach No-Code-
und Low-Code-Entwicklungsmodellen massiv befeuert. Beide Ansätze zielen auf kürzere Entwicklungszyklen ab. Was Low-Code-Plattformen konkret bieten sollten, zeigt IT-Dienstleister Fellow Consulting AG auf.

Ohne Low-Code keine Prozessdigitalisierung

Ziel der Prozessdigitalisierung ist es, Prozesse effizienter und transparenter zu gestalten. Dies kann geschehen, indem sie automatisiert oder benutzerfreundlicher gestaltet werden. Viele Unternehmen stellen jedoch fest, dass sie mit ihren Projekten zur Prozessdigitalisierung nicht die gewünschten Ergebnisse erzielen. Das liegt oft daran, dass sie versuchen, mit zu wenig Hilfe zu viel zu erreichen. In diesem Blogbeitrag werden wir erörtern, warum Low-Code-Plattformen für erfolgreiche Prozessdigitalisierungsprojekte so wichtig sind.

Partnerschaft

Da sich die digitalen Technologien immer weiter entwickeln und alle Aspekte unseres Lebens beeinflussen, stehen Unternehmen an einem Scheideweg: Sie müssen sich anpassen oder riskieren, veraltet zu werden.

  • Startseite
  • Kontakt
  • Datenschutz
  • AGB
  • Impressum