Menu
  • Standorte
  • Services
  • Experten
  • Hot Topics
  • News & Knowledge
  • Karriere
  • Über uns
  • Suche
  • Presse
  • Events
  • Kontakt
  • Sprache
  • Berlin
  • Düsseldorf
  • Erlangen
  • Frankfurt
  • Hamburg
  • Hannover
  • Kolbermoor
  • Köln
  • Leipzig
  • München
  • Nürnberg
  • Regensburg
  • Rosenheim
  • Stuttgart
  • Tax
  • Digital
  • Advisory
  • Legal
  • Industries
  • Centers of Excellence
  • KI im Steuerbereich
  • plAIground
  • Pillar Two
  • Sustainability Services (ESG)
  • E-Rechnung | ViDA
  • Country by Country Reporting (CbCR)
  • US Steuer- & Zollpolitik
  • News
  • Tax Weekly
  • KI Studie 2024
  • Newsletter
  • Webinare
  • Podcasts
  • WTS Journal
  • WTS als Arbeitgeber
  • Warum WTS
  • Benefits
  • Dein Einstieg
  • Stay in Touch
  • FAQs Karriere
  • Jobbörse
  • WTS im Überblick
  • Werte und Vision
  • Unser Management Team
  • Unsere Partner
  • Unsere Geschichte
  • Unsere Standorte
  • Auszeichnungen
  • Corporate Responsibiltiy
  • Tax CMS
  • Corporate Tax
  • Customs
  • Financial Services Tax
  • GreenTax & Energy
  • HR Taxes
  • Indirect Tax / VAT
  • International Tax & Permanent Establishments (ITP)
  • International Tax Desks
  • Mergers & Acquisitions Tax
  • Private Clients
  • Tax Controversy / Tax Disputes
  • Transfer Pricing
  • Digital Trends
  • Digital Partnering
  • Digitale Tools und Lösungen
  • End-to-End Prozesse
  • KI im Steuerbereich
  • SAP S/4HANA
  • Übersicht der internationalen Ertragsteuersätze (CIT rates)
  • Case Studies
  • Alle digitalen Services
  • Alle Legal Services
  • Civil & Commercial Law
  • Climate Regulation & Energy Law
  • Corporate Law
  • Data Privacy & IT Law
  • Employment Law
  • Global Expatriate Service
  • Legal Operate
  • Litigation
  • AI-Driven Next Generation Compliance
  • Alle Industries Services
  • Banking
  • Insurance
  • Mittelstand
  • Real Estate
  • Performance & Restructuring Tax Services
  • Sustainability Services (ESG)
  • Newsletter Übersicht
  • Newsletter Anmeldung
  • Webinar Anmeldung
  • Der WTS Steuer Podcast
  • Dein Einstieg als Schüler:in
  • Dein Einstieg als Student:in
  • Dein Einstieg als Absolvent:in
  • Dein Einstieg als Berufserfahrene:r
  • Bewerbungsprozess
  • Partner München
  • Partner Berlin
  • Partner Düsseldorf
  • Partner Erlangen
  • Partner Frankfurt
  • Partner Hamburg
  • Partner Hannover
  • Partner Köln
  • Partner Kolbermoor
  • Partner Nürnberg
  • Partner Regensburg
  • Partner Rosenheim
  • Partner Stuttgart
  • Alle Standorte
  • Standort Berlin
  • Standort Düsseldorf
  • Standort Erlangen
  • Standort Frankfurt
  • Standort Hamburg
  • Standort Hannover
  • Standort Kolbermoor
  • Standort Köln
  • Standort Leipzig
  • Standort München
  • Standort Nürnberg
  • Standort Regensburg
  • Standort Rosenheim
  • Standort Stuttgart
  • Unsere Umwelt
  • Soziales Engagement
  • Diversity
  • Kulturelles Engagement
  • Integrierte Rechts- und Steuerberatung
  • Internationale Gehalts- und Schattenabrechnungen
  • Internationale Mitarbeiterentsendungen/Globale Mobilität
  • Internationale Mitarbeitereinsätze und Projektgeschäft
  • Lohnsteuer
  • Nationale Lohn- und Reisekostenabrechnungen
  • Sozialversicherungs- und Arbeitsrecht
  • Work from Anywhere
  • HR Beratung
  • DAC 7
  • Compliance Manager
  • Comply
  • plAIground
  • VAT Health-Check
  • CbCR Risk Analyser
  • CbCR-2-XML
  • TPmanager
  • TPcoordinator
  • CbCRmanager
  • Tax CMS
  • Cesop
  • GewStmanager
  • Digital Process Automation
  • End-to-End Ertragsteuer-Prozesse
  • End-to-End Umsatzsteuerprozesse
  • End-to-End Zoll-Prozesse
  • End-to-end-Transfer Pricing Prozess
  • End-to-End Grundsteuer-Prozesse
  • Energiewirtschaftliche Prozesse
  • Nachhaltigkeitsreporting GRI207
  • Tax CMS
  • Case Study Hartmann Gruppe
  • Case Study WTS TPcompiler
  • Case Study Berechnung von Verrechnungspreisen
  • Case Study CbCR Table I
  • NOW@WTS
  • Presse
  • Events
  • Kontakt
Deutsch
English
  • English
  • Deutsch
WTS weltweit
  • WTS Global
  • Albania
  • Algeria
  • Angola
  • Argentina
  • Armenien
  • Australia
  • Austria
  • Bangladesh
  • Belgium
  • Benin
  • Bolivia
  • Bosnien und Herzegowina
  • Botswana
  • Brazil
  • Bulgaria
  • Burkina Faso
  • Burundi
  • Cambodia
  • Cameroon
  • Canada
  • Cape Verde
  • Central African Republic
  • Chad
  • Chile
  • China
  • Colombia
  • Congo Brazzaville
  • Costa Rica
  • Croatia
  • Cyprus
  • Czech Republic
  • Democratic Republic of Congo
  • Denmark
  • Dominican Republic
  • Ecuador
  • Egypt
  • El Salvador
  • Equatorial Guinea
  • Estonia
  • Eswatini
  • Ethiopia
  • Finland
  • Frankreich
  • Gabon
  • Gambia
  • Georgia
  • Germany
  • Ghana
  • Gibraltar
  • Greece
  • Guatemala
  • Guinea
  • Guinea-Bissau
  • Honduras
  • Hong Kong
  • Hungary
  • Iceland
  • India
  • Indonesia
  • Iran
  • Iraq
  • Ireland
  • Israel
  • Italy
  • Ivory Coast
  • Japan
  • Kazakhstan
  • Kenya
  • Korea
  • Kyrgyzstan
  • Laos
  • Latvia
  • Liberia
  • Libya
  • Lithuania
  • Luxembourg
  • Macao
  • Madagascar
  • Malawi
  • Malaysia
  • Mali
  • Malta
  • Mauritania
  • Mauritius
  • Mexico
  • Moldova
  • Mongolia
  • Montenegro
  • Morocco
  • Mozambique
  • Myanmar
  • Namibia
  • Nepal
  • Netherlands
  • New Zealand
  • Niger
  • Nigeria
  • North Macedonia
  • Norway
  • Pakistan
  • Panama
  • Paraguay
  • Peru
  • Philippines
  • Poland
  • Portugal
  • Puerto Rico
  • Romania
  • Rwanda
  • São Tomé and Príncipe
  • Saudi Arabia
  • Senegal
  • Serbia
  • Sierra Leone
  • Singapore
  • Slovakia
  • Slovenia
  • Somalia
  • South Africa
  • South Sudan
  • Spain
  • Sri Lanka
  • Sudan
  • Sweden
  • Switzerland
  • Taiwan
  • Tanzania
  • Thailand
  • Togo
  • Trinidad and Tobago
  • Tunisia
  • Turkey
  • Turkmenistan
  • Uganda
  • Ukraine
  • United Arab Emirates
  • United Kingdom
  • Uruguay
  • USA
  • Uzbekistan
  • Venezuela
  • Vietnam
  • Zambia
  • Zimbabwe
  • Services Clothing
    • Tax
      • Tax CMS
      • Corporate Tax
      • Customs
      • Financial Services Tax
      • GreenTax & Energy
      • HR Taxes
        • Integrierte Rechts- und Steuerberatung
        • Internationale Gehalts- und Schattenabrechnungen
        • Internationale Mitarbeiterentsendungen/Globale Mobilität
        • Internationale Mitarbeitereinsätze und Projektgeschäft
        • Lohnsteuer
        • Nationale Lohn- und Reisekostenabrechnungen
        • Sozialversicherungs- und Arbeitsrecht
        • Work from Anywhere
        • HR Beratung
      • Indirect Tax / VAT
        • DAC 7
      • International Tax & Permanent Establishments (ITP)
      • International Tax Desks
      • Mergers & Acquisitions Tax
      • Private Clients
      • Tax Controversy / Tax Disputes
      • Transfer Pricing
    • Digital
      • Digital Trends
      • Digital Partnering
      • Digitale Tools und Lösungen
        • Compliance Manager
        • Comply
        • plAIground
        • VAT Health-Check
        • CbCR Risk Analyser
        • CbCR-2-XML
        • TPmanager
        • TPcoordinator
        • CbCRmanager
        • Tax CMS
        • Cesop
        • GewStmanager
        • Digital Process Automation
      • End-to-End Prozesse
        • End-to-End Ertragsteuer-Prozesse
        • End-to-End Umsatzsteuerprozesse
        • End-to-End Zoll-Prozesse
        • End-to-end-Transfer Pricing Prozess
        • End-to-End Grundsteuer-Prozesse
        • Energiewirtschaftliche Prozesse
        • Nachhaltigkeitsreporting GRI207
        • Tax CMS
      • KI im Steuerbereich
      • SAP S/4HANA
      • Übersicht der internationalen Ertragsteuersätze (CIT rates)
      • Case Studies
        • Case Study Hartmann Gruppe
        • Case Study WTS TPcompiler
        • Case Study Berechnung von Verrechnungspreisen
        • Case Study CbCR Table I
      • Alle digitalen Services
    • Advisory
    • Legal
      • Alle Legal Services
      • Civil & Commercial Law
      • Climate Regulation & Energy Law
      • Corporate Law
      • Data Privacy & IT Law
      • Employment Law
      • Global Expatriate Service
      • Legal Operate
      • Litigation
      • AI-Driven Next Generation Compliance
    • Industries
      • Alle Industries Services
      • Banking
      • Insurance
      • Mittelstand
      • Real Estate
    • Centers of Excellence
      • Performance & Restructuring Tax Services
      • Sustainability Services (ESG)
    Services

    Mehr über unsere umfassenden Services

    ESG 

    Unsere Sustainability Services im Überblick

  • Experten
  • Hot Topics Clothing
    • KI im Steuerbereich
    • plAIground
    • Pillar Two
    • Sustainability Services (ESG)
    • E-Rechnung | ViDA
    • Country by Country Reporting (CbCR)
    • US Steuer- & Zollpolitik
    Hot Topics

    Überblick über die aktuellen "Hot Topics" der Steuerbranche und wie wir bei individuellen Fragen unterstützen können

    Ready for the game?
  • News & Knowledge Clothing
    • News
    • Tax Weekly
    • KI Studie 2024
    • Newsletter
      • Newsletter Übersicht
      • Newsletter Anmeldung
    • Webinare
      • Webinar Anmeldung
    • Podcasts
      • Der WTS Steuer Podcast
    • WTS Journal
    News & Knowledge

    Aktuelle Nachrichten und Themenspecials rund um die Bereiche Steuern, Digitalisierung sowie Financial & Deal Advisory.

    Unser Podcast
  • Karriere Clothing
    • WTS als Arbeitgeber
    • Warum WTS
    • Benefits
    • Dein Einstieg
      • Dein Einstieg als Schüler:in
      • Dein Einstieg als Student:in
      • Dein Einstieg als Absolvent:in
      • Dein Einstieg als Berufserfahrene:r
      • Bewerbungsprozess
    • Stay in Touch
    • FAQs Karriere
    • Jobbörse
    Deine Karriere bei WTS 

    Different. Like you.

  • Über uns Clothing
    • WTS im Überblick
    • Werte und Vision
    • Unser Management Team
    • Unsere Partner
      • Partner München
      • Partner Berlin
      • Partner Düsseldorf
      • Partner Erlangen
      • Partner Frankfurt
      • Partner Hamburg
      • Partner Hannover
      • Partner Köln
      • Partner Kolbermoor
      • Partner Nürnberg
      • Partner Regensburg
      • Partner Rosenheim
      • Partner Stuttgart
    • Unsere Geschichte
    • Unsere Standorte
      • Alle Standorte
      • Standort Berlin
      • Standort Düsseldorf
      • Standort Erlangen
      • Standort Frankfurt
      • Standort Hamburg
      • Standort Hannover
      • Standort Kolbermoor
      • Standort Köln
      • Standort Leipzig
      • Standort München
      • Standort Nürnberg
      • Standort Regensburg
      • Standort Rosenheim
      • Standort Stuttgart
    • Auszeichnungen
    • Corporate Responsibiltiy
      • Unsere Umwelt
      • Soziales Engagement
      • Diversity
        • NOW@WTS
      • Kulturelles Engagement
    Über uns

    WTS im Überblick: Was uns besonders macht

    Interesse an unseren Kunstführungen im Münchner Werksviertel? 

  • Suche
Home Services KI Studie Übersicht
  • KI Studie Übersicht
  • Editorial
  • Zusammenfassung
  • Einleitung
  • Aktuelle Entwicklungen der Ki
  • KI-Anwendungen im Steuerbereich
  • Anwendungsszenarien
  • Schlussfolgerung
  • Glossar
  • Literatur
  • Inhaltsverzeichnis
  • Suche
  • KI Studie Übersicht Anwendungsszenarien Automatisierung des Transfer Pricing Benchmarking Prozess

Automatisierung des Transfer Pricing Benchmarking Prozess

Thema & Problemstellung

Verrechnungspreise sind in steuerlicher Hinsicht als „Preise und Konditionen für grenzüberschreitende Geschäftsbeziehungen zwischen verbundenen Unternehmen sowie zwischen Stammhaus und Betriebsstätte“ [47] zu bewerten. Es geht also im Speziellen um die wertschöpfungsadäquate Verteilung des Steuersubstrats aus den an einer Transaktion beteiligten Staaten.

Eine Möglichkeit zum Nachweis und zur Dokumentation der Angemessenheit konzerninterner Verrechnungspreise sind Datenbankstudien. Die Prüfung der Angemessenheit der eigenen Verrechnungspreise erfolgt dabei anhand von GuV-Daten öffentlicher Jahresabschlüsse einer Vergleichsgruppe. Die Vergleichsgruppe soll dabei möglichst aus Unternehmen bestehen, die ausschließlich den betroffenen Unternehmensgegenstand (Produkt oder Dienstleistung) sowie die gleiche Unternehmensfunktion ausüben. Man könnte auch von der Suche nach dem „Einhorn“ sprechen, da die Unternehmen möglichst keine breite Palette von Produkten anbieten oder Funktionen ausüben sollen.

Datenbankanalysen sind ausschließlich bei der Angemessenheitsanalyse von Margen der Routineunternehmen anzuerkennen, wenn die strengen Anforderungen an die Vergleichbarkeit der herangezogenen Vergleichsunternehmen sichergestellt sind. Daher werden in der Praxis oftmals Datenbankanalysen erstellt. In einigen bedeutenden Staaten ist dies bereits gesetzlich verpflichtend. Teilweise wird sogar die jährliche, vollständige Erstellung einer Datenbankanalyse gefordert. In diesem Zusammenhang können für das Screening des Marktes zwei grundlegende, arbeitsintensive und aufeinander aufbauende Schritte unterschieden werden:

Quantitatives Screening: Dabei wird die Suchstrategie in einer Unternehmensdatenbank umgesetzt. In erster Linie, um eine Datenbankanfrage zu stellen, die Unternehmen mit zuvor spezifizierten SIC-/NACE-Codes (Branchencode), Keywords, Unabhängigkeitskriterien, Ländern, Jahren sowie der Umsatzgrößen und Renditekennzahlen („Profit Level Indicator“) selektiert. Darüber hinaus werden ebenso erste Unternehmen eliminiert, zu denen keine Finanzkennzahlen in ausreichendem Maße verfügbar sind oder die auf ein dauerhaftes Verlustgeschäft hindeuten. Üblicherweise wird damit ein Zwischenergebnis von ca. 150 bis 1.000 Unternehmen (je nach Selektionskriterien) gewonnen.

Qualitatives Screening: Im Anschluss an das quantitative Screening erfolgt eine manuelle Feinauswahl der Peergroup. Dabei werden alle (!) zuvor gefunden Unternehmen z. B. via Internetrecherche hinsichtlich Vergleichbarkeit (F&R-Profil, Unternehmensgegenstand, Größe etc.) untersucht. Nicht vergleichbare Unternehmen werden aus der Suche eliminiert: Wenn z. B. angebotene Produkte oder ausgeführte Funktionen abweichen oder keine Internetseite vorhanden ist etc. Danach werden noch einmal die Unternehmen der unteren und oberen 25% der Treffer („Interquartilsbandbreite“) eliminiert, sodass ein Ergebnis mit i.d.R. fünf bis 20 Vergleichsunternehmen entsteht [49].

Durch die Notwendigkeit der regelmäßigen Überprüfung und Neuerstellung der Benchmarking-Studien sowie dem hohen manuellen Aufwand wurde von WTS und dem DFKI ein Prototyp zur Teilautomatisierung des Benchmarking-Prozess entwickelt und zum Proof-of-Concept weiterentwickelt. Durch die vielversprechenden Ergebnisse hinsichtlich des Bearbeitungsaufwands und auch der Standardisierung wird eine Produktentwicklung derzeit angestrebt.

Der Prototyp setzt dabei zwei Strategien um: Erstens werden der Prozess standardisiert und die benötigten Werkzeuge integriert, sodass nicht mehr vielfältige Anwendungen parallel zum Einsatz kommen müssen. Zweitens wird der Benutzer beim qualitativen Screening unterstützt, in dem offensichtlich unpassende Unternehmen automatisiert eliminiert werden. Dadurch sinkt der Umfang der zu prüfenden Unternehmen. Um die Entscheidungen bestmöglich zu unterstützen, werden zu den verbliebenen Unternehmen in einem KI-Cockpit zudem relevante Informationen bereitgestellt – in konzentrierter und übersichtlicher Form. Dabei zeigt sich erneut, dass Benchmark-Studien keine triviale Aufgabe darstellen. Es werden für jede Studie bzw. für die Findung eines Preises einer Transaktion zwischen 2-5 GB an Daten gespeichert und verarbeitet.

Lösungsarchitektur

Das quantitative Screening wird bereits weitestgehend durch umfangreiche Datenbanken abgedeckt und kann durch Abfragen abgebildet werden, die der jeweiligen Suchstrategie entsprechen. Das anschließende qualitative Screening bietet jedoch umfangreiche Potenziale zum Einsatz von künstlicher Intelligenz. Daher ist die erste Selektion von Unternehmen aus der Datenbank der Einstiegspunkt in den Prototyp.

Diese Selektion umfasst üblicherweise 150 - 1.000 Unternehmen, zu denen die Datenbank Informationen wie Unternehmensname, Webseite, Handelsbeschreibung sowie Finanzkennzahlen und Abhängigkeitskriterien enthält, die zum qualitativen Screening herangezogen werden und anhand derer die Ähnlichkeit zum Referenzunternehmen bewertet werden. Dazu wurde ein Analyse-Dashboard entwickelt, um Entscheidungen mit bestmöglicher Unterstützung aller verfügbarer Informationen treffen zu können.

Bei der Analyse kommen gleich mehrere KI-Methoden im Prototyp zur Anwendung:

 

(1) Intelligentes Web Scraping: Neben verschiedenen Informationen aus den Datenbanken (vor allem Finanzkennzahlen) bieten die Webseiten der einzelnen Unternehmen eine reiche Informationsquelle - sei es über zu untersuchende Kriterien wie die Unternehmensfunktion oder die angebotenen Produkte. Zur Erschließung dieser Informationen durchsucht ein intelligenter Web-Scraper ausgehend der gegebenen Startadresse die gesamte Webseite. Relevante Webseiten werden gespeichert und zur Analyse durch die KI-Systeme weitergeleitet. Relevante Schritte wie die Dokumentation werden dabei automatisch erstellt. Im Zuge dessen eliminieren die KI-Systeme automatisch erste Unternehmen, die stark von Suchkriterien der Nutzereingaben abweichen oder über keine relevanten Informationen verfügen. Die verbleibenden Unternehmen werden dem Benutzer zur Bewertung im Analyse-Dashboard angezeigt. Dort werden die weitern KI-Methoden der Suchparameter, Klassifikation, Zusammenfassung und Ähnlichkeitsberechnung von Texten übersichtlich dargestellt.

(2) Suchparameter: Suchparameter entsprechen Schlagwörtern, die im Webseitentext des Unternehmens grün/rot hervorgehoben werden können und auf das Akzeptieren oder Eliminieren hinweisen. Der Prototyp schlägt bereits Suchparameter vor, überlässt die Anpassung aber dem Benutzer. Die reine Suche nach Wörtern wurde dabei um eine KI-Komponente ergänzt die zusätzlich auch Synonyme und Wörter mit dem gleichen Wortstamm erkennen kann. So lässt sich bspw. mit dem Suchbegriff „Produkt“ ebenfalls der Begriff „Werkstück“ finden, nicht aber das Wort „Produktion“.

(3) Klassifikation hinsichtlich der Unternehmensfunktion: Bei der Klassifikation werden die Webseitentexte hinsichtlich der Unternehmensfunktion untersucht. Dabei wird geprüft, ob es sich um ein produzierendes, vertreibendes, forschendes, entwickelndes oder verwaltendes Unternehmen handelt oder ob es Dienstleistungen erbringt. Zudem wird in der nächsten Ausbaustufe dem Benutzer die Möglichkeit gegeben, die Vorhersage zu bewerten. Auf diese Weise sollen dem Algorithmus wertvolle Informationen für zukünftige Klassifikationen gegeben werden (Continuous Learning).

(4) Textähnlichkeit: Zu jedem Text wird ein Ähnlichkeitsmaß (0% - 100%) angezeigt. Dieses soll anzeigen, wie ähnlich der Webseitentext zu dem des Referenzunternehmen und zu den Texten der bereits akzeptierten Unternehmen ist. Damit können die potenziell vielversprechendsten Kandidaten für eine bevorzugte Analyse ausgewählt werden. Aber auch stark abweichende Texte lassen sich automatisch eliminieren.

(5) Automatische Zusammenfassungen: Webseiten können teileweise sehr viele Informationen enthalten. So wurden durchschnittlich 1.800 Wörter pro Webseite gezählt. Um die Information zu komprimieren und die Entscheidung zu beschleunigen, wurde eine KI-Anwendung zur Zusammenfassung der Texte implementiert – mit Schwerpunkt auf Unternehmensfunktion, Produkt und Unabhängigkeit des Unternehmens. Dank dieser innovativen Komponente konnte die Wortzahl pro Unternehmen auf 75 reduziert werden. Wodurch sich die Lesedauer von etwa sieben Minuten auf wenige Sekunden reduziert. Dennoch bleibt der Informationsgehalt der gekürzten Texte in 85% der Fälle unverändert, was auch in der Evaluation bestätigt werden konnte.

Ergebnisse und Fazit

Die Evaluation der eingesetzten KI-Methoden erfolgt für jede Methode individuell. Daher werden im Folgenden die Performanz der Textklassifikation, der Textähnlichkeit und der Zusammenfassungen getrennt untersucht.

Textklassifikation: Zur Untersuchung der Methode wurde ein KI-Modell anhand von Unternehmenswebseiten und Labeln von bereits erstellten Benchmarking-Studien trainiert. Dabei wurde ein s.g. LSTM-basierter Ansatz verfolgt, bei dem nicht nur das Auftreten von Wörtern eine Rolle in der Klassifikation spielt. Auch die Reihenfolge der Wörter sowie deren Bedeutung in dem jeweiligen Kontext wurden berücksichtigt [50]. Wegen einer stark unterschiedlichen Anzahl von Texten pro Klasse wurden die Unterschiede durch die Generierung von synthetischen Daten ausgeglichen. Dabei wurden Daten einer Klasse kopiert und die Kopie durch Löschen, Einfügen und Ersetzen von Wörtern variiert. Dadurch konnte bei der Analyse der Unternehmensfunktion bei neuen, bisher unbekannten Unternehmen eine Vorhersagegenauigkeit von 92% erreicht werden.

Die Kennzahlen zur Performance der Textklassifikation können in oben stehender Abbildung eingesehen werden. Zu jeder Klassifikation wird auch deren Sicherheit berechnet, sodass diese Analyse bei der automatischen Elimination zum Einsatz kommt. Um Unternehmen mit einer anderer als der gesuchten Funktion sowie mit hoher Sicherheit zu eliminieren. Aufgrund der Komplexität einzelner Unternehmen und der Vielfalt deren Tätigkeiten ist eine Klassifizierung zu einer Klasse nicht immer möglich. Eine niedrige Vorhersagegenauigkeit ist oftmals ein Indikator für Unternehmen, die mehrere Funktionen ausüben.

Textähnlichkeit: Im zweiten Schritt wurde die Ähnlichkeiten von Webseitentexten evaluiert. Der Ansatz fußt auf dem vortrainierten, transformer-basierten Sprachmodell BERT, welches das „Sprachverständnis“ enthält, sowie der Kosinus-Ähnlichkeit als Ähnlichkeitsmaß[51]. Zur Evaluation wurden bestehende Benchmark-Studien herangezogen, die bekannte akzeptierte und eliminierte Unternehmen sowie deren Webseitentexte enthalten. Die Ähnlichkeiten zwischen allen Texten der akzeptierten Unternehmen sowie die Texte aller zu untersuchenden Unternehmen wurde gemessen. Dabei zeigte sich, dass sich die Gruppe der Texte von akzeptierten Unternehmen wesentlich ähnlicher ist als die Texte der akzeptierten und eliminierten Unternehmen zusammen. Konkret betrug das Ähnlichkeitsmaß im Schnitt 73,9% in der Gruppe der akzeptierten Unternehmen gegenüber 49,8% in der gesamten Studie. Die Untersuchung umfasste insgesamt 5 Benchmark-Studien. Die Ergebnisse wurden gemittelt.

Textzusammenfassung: Die dritte Evaluation betrifft die automatische Zusammenfassung von Texten. Die textuelle Zusammenfassung wird dabei mit einem großen Sprachmodell (vgl. Kapitel Große Sprachmodelle) durchgeführt. Wobei durch Prompt-Engineering der Schwerpunkt auf Produkte/Dienstleistungen und Unternehmensfunktion gelegt wird. In der Evaluation haben 3 Probanden eine Stichprobe von 232 Unternehmen bewertet. Dazu wurde jedem Probanden, zu jedem Unternehmen, einmal der vollständige Text der Unternehmenswebseite sowie die automatisch erzeugte Zusammenfassung vorgelegt. Dieser untersuchte u. a. den Informationsgehalt und die Nützlichkeit der Zusammenfassung für den Business Case im Vergleich zur Webseite und trug seine Ergebnisse in einen Feedbackbogen ein. Der Informationsgehalt konnte auf einer Skala von -5 bis +5 gewählt werden. -5 bedeutet in diesem Fall maximaler Informationsverlust in der Zusammenfassung, 0 einen identischen Informationsgehalt und +5 Information wurden gefunden, die nicht im Text sind. Z. B. durch Halluzination durch das großen Sprachmodells oder auch eine Fehlinterpretation des Probanden. Optimal wäre somit ein Ergebnis von 0. Über alle Bewertungen hinweg wurde ein Mittelwert von -0.16 erreicht, sodass die Zusammenfassungen einen minimalen Informationsverlust erleiden, aber natürlich bei weitem weniger Text enthalten. Die Nützlichkeit war in 78% aller Fälle gegeben, sodass die Zusammenfassung zu einer Entscheidung herangezogen werden konnte. Von den 52 Fällen, in denen es nicht möglich war mit der Zusammenfassung eine Entscheidung zu treffen, war dies in 37 Fällen auch mit der Webseite nicht zweifelsfrei möglich. Die Effektivität beträgt somit 85%.

Nächster Artikel

weitere Artikel

Automatisierte Generierung von Verrechnungspreisdokumentationen
Informationsextraktion aus Grundsteuerbescheiden
Synthetische Daten für Anomalieerkennung
Umsatzsteuerliche Klassifizierung von Leistungsbeschreibungen von Rechnungen
Kombination großer Sprachmodelle mit Wissensgraphen

Kontaktieren Sie uns noch heute

Sie haben Fragen zu unseren Services oder der WTS? Lassen Sie es uns wissen. Schreiben Sie uns einfach eine E-Mail oder rufen Sie uns direkt an.

Kontakt
Tax
  • Digital
  • Advisory
  • Industries
  • Legal
Hot Topics
  • KI im Steuerbereich
  • plAIground
  • Pillar Two
  • Sustainability Services (ESG)
  • E-Rechnung | ViDA
Karriere
  • Jobbörse
  • WTS als Arbeitgeber
  • Warum WTS
  • Dein Einstieg
  • Stay in Touch
News & Knowledge
  • Tax Weekly
  • Newsletter Übersicht
  • WTS Journal
  • Newsletter Anmeldung
Über WTS
  • Experten
  • Über uns
  • Werte und Vision
  • Unsere Partner
  • Corporate Responsibiltiy
  • Auszeichnungen
© 2025 WTS Impressum Unternehmensangaben Disclaimer Datenschutzerklärung Hinweisgebersystem AGBs Informationen für Lieferanten