Benfords Gesetz gezählter Zahlen

Der amerikanische Physiker Frank Benford hatte entdeckt, dass ein Buch mit Logarithmentabellen unterschiedlich abgegriffen war. Vorn standen all jene Zahlen, die mit einer Eins anfingen; dort schlugen die Leute augenscheinlich am häufigsten nach. Warum diese eigenartige Vorliebe für die Eins? Den Physiker beschlich ein wunderlicher Verdacht. Die nächsten Jahre wendete Benford dafür auf, der Sache auf den Grund zu gehen. Er beschaffte sich Zahlenkolonnen aller Art und studierte sie: Statistiken der amerikanischen Baseball-Liga, alle Zahlen aus einer Ausgabe des "Reader's Digest", das Atomgewicht der Elemente und Stromrechnungen von den pazifischen Salomon-Inseln. Am Ende hatte er 20 229 Datensätze überprüft (Manfred Dworschak, DER SPIEGEL 47/1998).

Das Ergebnis bestätigte seine Ahnung: Die Wirklichkeit scheint der Eins den Vorzug zu geben. Fast jede dritte Zahl fängt mit ihr an. Je größer jedoch die Ziffer, desto seltener steht sie an erster Stelle.




Für die Eins beträgt sie demnach gut 30 Prozent, für die Zwei knapp 18, für die Neun nur 4,6 Prozent.

Wer betrügt, denkt sich irgendwelche Zahlen aus, und für ausgedachte Zahlen gilt Benfords Gesetz nicht. Für die wirklichen Dinge allerdings, die gezählt, gemessen und gewogen werden, kann der Weg von der Eins zur Zwei sehr lang sein: Um ihn zurückzulegen, müssen sie um das Doppelte wachsen. Einer Fünf fehlt dagegen nur ein Fünftel, um zur Sechs zu werden, der Neun nur noch ein Neuntel zur Zehn (und damit zur nächsten Eins an erster Stelle).

Bereits 1998 setzt die amerikanische Steuerbehörde entsprechende Prüfungssoftware ein. Auch etliche Großunternehmen, von Texaco bis Philip Morris, haben ihre interne Buchhaltung damit ausgerüstet. In Deutschland ist die Software bei den Wirtschaftsprüfern Schitag Ernst & Young im Einsatz. Um die Ergebnisse zu verfeinern, beachtet sie neben den ersten Ziffern auch noch die zweiten. Ein in sich plausibler Steuerbetrug, in dem auch noch genügend Einsen an erster Stelle vorkommen, von den zweiten Ziffern zu schweigen, ist nicht so einfach zusammenzustellen.

Der große Vorteil des Benford-Tests besteht in seiner Automatisierbarkeit. Menschliche Steuerprüfer können bestenfalls Stichproben durchleuchten. Computer dagegen fressen sich im Nu durch sämtliche Zahlenkolonnen eines Großunternehmens. Fördern sie Unregelmäßigkeiten zutage, so ist zwar noch nichts bewiesen, aber dann schauen sich die Prüfer die Sache genauer an.

In einem Fall fand sich bei Überprüfung der Umsätze eine Häufigkeit der Ziffer 1 von 70%. Ein Blick in die Kontenblätter genügte: Gebucht waren jeweils Tagesumsätze von 800 € bis 2500 €. Die Auswertung der Kassensoftware mit Einzelumsätzen hätte wieder die „Normalverteilung“ ergeben.

Der Benford-Test ist denn auch nur ein erster Filter der Betriebsprüfung, jedoch sollte der Unternehmer in diesem nicht hängen bleiben.



Chi-Quadrat-Test

Ein weiteres Prüfverfahren ist nach dem 22. Buchstaben des griechischen Alphabets, dem Chi benannt. Die hierbei unterstellte lineare Ziffernverteilung entspricht eher der Schulmathematik als die von Benford für die erste Ziffer. Betrachtet wird bei der Chi-Analyse die erste Vorkommastelle und die erste und die zweite Nachkommastelle: Jede Ziffer von 0 bis 9 sollte sich vor und hinter dem Komma mit einer Wahrscheinlichkeit von jeweils 10% wiederfinden.

Wer sich die Tageseinnahmen blockweise ausdenkt und nachträgt und dabei seine Fantasiezahlen nur mit Bankeinzahlungen abstimmt, benutzt unwillkürlich seine Lieblingszahlen. Nach Ansicht des Psychologen Hill bevorzugen Menschen die Ziffer 6, 7 und 4 (sog. Hill-Verteilung für ausgedachte Zahlen).

Ein Chi-Testwert von über 30 deutet auf Phantasiewerte hin, die achtlos dahingeschrieben wurden.

Wollen Sie die Nullwerte dennoch prüfen, so ist in diesem Fall die Datenbasis zu bereinigen. Z.B. können Sie in der Kasse Auszahlungen auf der Habenseite und bei den Einzahlungen im Soll glatte Einlagenbeträge löschen.

Gott würfelt nicht Albert Einstein

Während der Benford-Test aufgrund der logarithmischen Verteilung den meisten Menschen suspekt bleibt, spricht jedoch gerade die plausible, lineare Verteilung in der Chi-Quadrat-Analyse gegen ihre Entsprechung in der wirklichen Welt:

Für die Fahndung besteht ab dem Chi-Wert von 30 eine 95% Wahrscheinlichkeit für manipulierte Einnahmeaufzeichnungen.

Experimente mit Daten unverdächtiger Betriebe zeigen, dass hier bei großen Datenmengen Auffälligkeiten vorkommen können (Frank Reinhardt, Digitale Steuerprüfung, DATEV Magazin 1/2005 S. 17 ff.).

Bei großen Datenmengen nehmen die absoluten Unterschiede zwischen den erwarteten und den tatsächlichen Häufigkeiten zu. Deren Quadrate werden jeweils nur zu der einfachen Gesamtmenge ins Verhältnis gesetzt.

Gerade die geringe Datenmenge (hier: 217 Werte) führt dagegen das Finanzgericht Münster in seinem Urteil vom 14.08.2003 ( 8 V 2651/03 E,U) gegen den blinden Glauben in die Wahrscheinlichkeitsrechnung an – und kommt damit zum gleichen Ergebnis:

Es bestehen erhebliche Zweifel am Aussagewert der für die Fahndung maßgeblichen Grenze von 30 ...... Der Chi-Quadrat-Test ist keine von der Rechtsprechung anerkannte Methode und kann eine Vermögenszuwachs- oder Geldverkehrsrechnung oder eine andere sichere Kalkulations- oder Verprobungsmethode nicht ersetzen.

Im vorhandenen Fall hätte die Verschiebung lediglich zweier Nullen (von 41 auf 39) zur Neun einen Wert von 29,41 ergeben.

Dieses Urteil überrascht umso mehr, weil dasselbe Finanzgericht noch am 5.12.2002 (8 V 5774/02 E, G, U ) den Chi-Quadrat-Test neben weiterer Buchführungsmängel als Ablehnungsgrund für einen Aussetzungsantrag zugelassen hatte.

Fazit

Mit der Benford- und Chi-Quadrat-Analyse kann eine steuerliche Außenprüfung nicht simuliert werden. Sie stellen für sich genommen nur eine von mehreren möglichen Prüfungsschritten dar. Dabei findet sich bei Abweichungen von der ideal-mathematischen Verteilung in den meisten Fällen plausible Erklärungen.

Zwar lassen sich mit den Testkombinationen recht gut ausgedachte und manipulierte Zahlen entdecken. Die große Anzahl der untauglichen Ergebnisse und Fehlalarme trüben jedoch das Idealbild eines unfehlbaren und narrensicheren Lügendetektors für die Buchhaltung.

Wer also Antworten auf die Herkunft von Privateinlagen, geringe Rohaufschläge etc. und in Zukunft eben auch auf Benford- und Chi-Quadrat-Abweichungen parat hat, kann Betriebsprüfungen gelassen ins Auge sehen.



© Goyang Media Ltd. 2006