GuttenPlag Wiki
Forum: Übersicht > Wahrscheinlichkeit eines Zufalls



Wie hoch ist die Wahrscheinlichkeit, dass es sich nicht um Plagiate handelt, sondern dass die Übereinstimmungen mit anderen Quellen zufällig entstanden sind? Falls diese Wahrscheinlichkeit recht klein sein sollte, könnte man sie vielleicht in Anzahl aufeinanderfolgender Lottogewinne ausdrücken. Das würde dann auch meine Mutter verstehen.

Mathematiker, ihr seid gefordert, vernünftige Annahmen zu machen und eine Schätzung abzugeben.


Die Wahrscheinlichkeit ist viel zu klein, um sie sinnvoll als Anzahl aufeinanderfolgender Lottogewinne auszudrücken. Fordern Sie ihre Mutter lieber auf, einen Ihrer obigen Sätze mit Anführungszeichen in Google einzugeben. Selbst "Das würde dann auch meine Mutter verstehen." hat noch keine Treffer (bis diese Seite indiziert wird und dann den einzigen Treffer liefert). (Und deutet im übrigen darauf hin, dass löblicherweise wenige Leute ihre eigene Mutter als öffentlichen Standard für Begriffsstutzigkeit präsentieren.)

Bei selteneren Wörtern ist es noch schlimmer, lassen Sie ihre Mutter selbst erleben, was passiert, wenn man die *zwei* aufeinanderfolgenden Wörter "verschiedentlich untechnisch" sucht und dann überlegen, dass in der Dissertation hunderte solche Wörter "zufällig" richtig aneinandergereiht wurden.

_________________________________________________________________________________________

Hallo,

die Eingangsfrage ist extrem schwierig zu beantworten, da sehr viele unterschiedliche Parameter gesetzt werden müssen, z. B.

- Wie viele Worte hat ein zu vergleichender Absatz? - Aus wie vielen Worten besteht der Wortschatz, der für diesen Absatz zufällig "zusammengewürfelt" werden müsste? - Will man alle Kombinationen werten oder nur die, die einen Sinn ergeben und/oder grammatikalisch richtig sind? usw.

Ich bin keine Mathematikerin (naja, nach einer Festlegung der o.g. Variablen sollten auch Schüler/innen der Oberstufe oder zumindest entsprechende Studierenden im ersten Studienjahr solche Wahrscheinlichkeiten errechnen können) und habe momentan auch keine Zeit für solche "Spielereien" (Es ist aber eine witzige Überlegung :-)) ). Aber wenn Du Deiner Mutter einen Eindruck vermitteln möchtest, nehme doch mal folgendes Bild:

Wenn sie sichergehen will, dass sie beim Lotto ganz sicher einen "6er mit Superzahl" macht, muss sie fast 140 Millionen Lottotipps auf einmal abgeben. Falls sie bei der Dissertation von Herrn Guttenberg einen abgeschriebenen (und möglicherweise plagiierten) Absatz finden will, muss sie sich zwei Seiten - ohne Inhalts- und Literaturverzeichnis sowie Anhang - aus der Diss zufällig raussuchen. - OK, Ok, es gibt wohl auch noch Seiten ohne Plagiate. Sie könnte also zufällig zwei "Nieten" ziehen. Aber wenn sie sich nicht nur zwei sondern z. B. zehn Seiten anguckt, müsste schon mindestens ein "verdächtiger" Absatz dabei sein (wahrscheinlich sogar mehr, durchschnittlich um die 6) usw.

Ich denke, damit kann sich Deine Mutter bestimmt eine Vorstellung machen, um welchen Umfang es geht. Na ja, ist jetzt nicht direkt eine Antwort auf Deine Frage, aber wenn es darum geht, der breiten Bevölkerung (die sich in der Regeln keine Gedanken um wissenschaftliche Standards und Regeln macht) die Gründe der "Aufregung" zu verdeutlichen, kann das Beispiel vielleicht ein wenig hilfreich sein. (Bitte nicht vergessen zu erwähnen, dass eine "Doktorarbeit" nicht durch einfaches Abschreiben sondern durch eigenständiges Denken (!) und Schreiben (mindestens) (sic!) sowie harte erbehrungsreiche Arbeit erworben werden sollte und viele andere kleine Doktoranden genau das tun.) (Entschuldigt mein Klatschianisch - aber ich versuche immer, für die Allgemeinheit verständlich zu bleiben.)

Nur mal so.

Grüße ___________________________________________________________________________________________

Also

Gutti ist doch unschuldig, er hat gar nicht abgekupfert, de anderen haben alle von ihm abgeschrieben.

Unmöglich? Nein, nicht wenn man davon ausgeht, dass Zeit nach Goldstein und Tumilka auch rückwärts laufen kann:http://iopscience.iop.org/0264-9381/20/3/311/pdf/0264-9381_20_3_311.pdf_____

___________________________________________________________________________________


So, hier hat sich was gefunden:

Angenommen, es komme bei jedem zweiten Text im Umfang von 475 Seiten zufälligerweise einmal vor, dass ein Gedanke in Worten formuliert wird, die über einen ganzen Absatz hinweg mit Ausnahme einzelner Wörter identisch mit der Formulierung eines Absatzes sind, welcher an anderer Stelle schon einmal veröffentlicht wurde. Dann betrüge die Wahrscheinlichkeit, dass so etwas in einem solchen Text gleich 60 mal vorkommt, 0,5 hoch 60. Dies kommt statistisch bei 0,000000000000000087 Prozent solcher Texte oder bei jedem 1,15 Trillionsten Text einmal vor. Nach gegoogelten Schätzungen gibt es ca. 130 Mio. Bücher auf der Erde. Demnach würde auf knapp 9 Milliarden Planeten von vergleichbarer Bevölkerung wie jener der Erde im Durchschnitt einmal ein solches Buch erscheinen. Schließlich: Die Wahrscheinlichkeit einer per Gentests fälschlicherweise erfolgten Verurteilung ist 1,15 Milliarden mal größer als die Wahrscheinlichkeit, dass ein Buch erscheint, in dem an 60 Stellen (oder mehr) versehentlich der gleiche Wortlaut gewählt wurde wie in einem anderweitig erschienenen Text.