Sprache Bigram Home

Jschreiner Home

Westeuropäischer Sprache Bigrame Mit Zwei Dimensionen und Farben

Was Sind Diese Diagramme?

Willkommen bei der Website on Joseph Schreiner, daß Schriftzeichenmuster auf westeuropäische Sprachen illustriert. Insbesondere illustriere ich die Muster und die Häufigkeiten der Bigrame, oder die Verbindungen von zwei Schriftzeichen. Auf dieser Website illustriere ich die häufigsten Bigrame, auf Englisch, Deutsch, Französisch und Spanisch gefunden wird. Nicht nur sehen wir die häufigsten Bigrame, aber wir sehen auch die Stellungen dieser Bigrame. Hälfte der Bigrame werden mit Farben dargestellt, sodaß können wir die Sprache sehen, wo die Bigrame häufigst vorkommen.

A7C

Dieser Anteil meiner Website gründet auf die zwei Hauptdiagramme unter – Farbe und Monochrom. Indem klicken an diesen Diagrammen, sehen Sie die Detaildiagramme. Wenn Sie an einem Anteil eines Hauptdiagramm klicken, öffnet sich ein neues Fenster mit einem Detaildiagramm. Das Fenster zeigt Ihnen den vergrößten Teil. Sie sehen, die Hauptdiagramme ganz verwickelt sind. Jede Pixel hat Bedeutung. Die Detaildiagramme zeigen Ihnen die wirkliche Bigrame.

Die Diagramme zeigen uns die Beziehung zwischen Bigrame. Sie zeigen uns, wie die Bigrame einander vorausgehen und folgen. Überlegen Sie sich dem englischen Text red ball.  Die Diagramme zerlegen den Text zu einer Zeilee von Bigrame wie Vorausgehenbigrame und Folgenbigrame:

Vorausgehen Folgen
Bigram Bigram
re d_
ed _b
d_ ba
_b al
ba ll

Für Klarheit wurde das Leerzeichen in eine Unterzeichen umwandelt. So sehen wir, daß das Folgenbigram d_ dem Vorasgehenbigram re folgt.  _b folgt ed, und so weiter.

Indem benutzen die Bigrame der vier Sprachen, wob ich das Muster der Hauptdiagramme.

Monochrom Diagramm

(Schwartz & Weiß)

Klicken Sie an einem Teil, um ihn vergrößert zu sehen.

Der vergrößerte Teil öffnet innerhalb eines getrennten Fenster.

Um alle Detail zu sehen, vergrößern Sie das Fenster.

monochrome

Farbe Diagramm

Klicken Sie an einem Teil, um ihn vergrößert zu sehen.

Der vergrößerte Teil öffnet innerhalb eines getrennten Fenster.

Um alle Detail zu sehen, vergrößern Sie das Fenster.

colorg

Die Struktur der Hauptdiagramme

Die Reihen (A durch I) stellen das Vorausgehenbigram dar. Die Spalten (1 durch 9) stellen das Folgenbigram dar. re, ein Vorausgehenbigram, fand sich auf Reihe G. d_, ein Folgenbigram, fand sich auf Spalte 8. Wir schauen Anteil G8 an, die Verbindung re-d_ zu sehen, ihre Häufigkeit zu bestimmen, und ihre häufigste Sprache zu sehen.

C2C

Ich illustriere die häufigsten 450 Bigrame. Es ist zu schwierig mehre Bigrame auszustellen, gegeben die Zwänge von Bildauflösung. Die Hauptdiagramme haben 450 x 450 Pixel, aber es gibt keine “Pixel = Bigram” Entsprechung. Die mehre häufigeren Bigrame werden mit Pixellängen mehr als 1,00 ausgestellt. Die wenige häufigeren Bigrame werden mit Pixellängen weniger als 1,00 ausgestellt.

In der Monochromdiagrammen stellt die Helligkeit Bigramhäufigkeit dar. Das Schwarze bedeutet, daß ein Bigrampaar in dem Text nicht sich findet. Helle Weiß bedeutet, daß ein Bigrampaar häufig sich findet. Grautöne stellen Zwischenhäufigkeit dar. Auch verwerten die Farbdiagramme die Helligkeit und die Pixellänge Häufigkeit auszudrücken.

In der Farbdiagramme zeigt der Farbton die Sprache an, wo das Bigrampaar häufigst besteht:

Sprache Farbe
Spanisch Rot
Französisch Gelb
Englisch Grün
Deutsch Blau

Die starken Farbtöne zeigen an, daß das Bigrampaar eine starke Bevorzugung für eine Sprache zeigt. Ein schwache Farbton, das nähe zu weiß oder grau ist, zeigt einen Bigrampaar an, das in aller vier Sprachen gleich vorkommen.

G1C

Ich finde, die Diagramme faszinierend sein. Ich hoffe, Sie auch sie faszinierend finden. Die Hauptdiagramme geben uns eine Vogelperspektive der Häufigkeiten. Man kann sie mit Spektrometern oder mit Elektrophorese vergleichen. Aber sie erlauben nicht uns Auskunft über dem Einzelbigram zu sehen. Dafür müssen wir die Detaildiagramme besichtigen. Diese Diagramme sind verwickelt, aber sie zeigen genuge Detail, daß wir Einzelbigrame vernehmen können.

Die Struktur der Einzeldiagramme

Wenn Sie an einem Anteil eines Hauptdiagramm klicken, sehen Sie das entsprechende Detaildiagramm, das die Zelle vergrößern. Die Pixellängen werden mit 12 multiplizieren. Die Detaildiagramme haben die gleichen Farben und Helligkeit wie die Hauptdiagramme. Und sie zeigen uns die Bigrame dem Achse entlang.

Ebenso sind Die Detaildiagramme verwickelt wie die Hauptdiagramme. Erinnern Sie sich an, daß diese Diagramme 50 Bigrame an der horizontalen und der vertikalen Achsen entfalten. Die Bigrame können nicht an einer einzelen Linie entfaltet werden. Um alle zu verzeichnen, werden die Bigrame mit vier gestaffelter Linien ausgestellt. Unten zeigt der Beispiel, wie ich es mache. An der vertikalen Achse (das Vorausgehenbigram) sehen wir die Bigrame co, ha, no, pa, so … An der horizontalen Achse (das Folgenbigram) sehen wir die Bigrame _p, _c, _l, _e, _d ...

G2C

Das zeigt die Ordnung, wie sie der Achse entlang stehen. Aber ich müsste diese Bigrame an verschiedenen Linien setzen, um sie dem Raum hineinzuquetschen.

Wie Machte Ich Das?

Für Probetext benutzte ich 1,8 Megabytes von Onlinetext, der zu gleichen Teilen Englisch, Spanisch, Französisch und Deutsch besteht. 60% des Text kommt aus Wikipedia Artikel. Die Artikel besprachen die USA, Frankreich, Mexiko, Deutschland, Computers, Fernsehen, Religion, die Sonne, und den Mond. 10% kommt aus Yahoo! Nachrichten. Und 30% kommt aus Märchen und Kindergeschichten.

Aus dem Text entfernte ich die Klammer der Wikipedia Zitate, Bildunterschriften, und unbenutzte Zeilenumbrüche. Auch ich übersetzte die folgende Schriftzeichen:

  • Großbuchstaben wurden Kleinbuchstaben
  • Doppelleerzeichen wurden Einzelleerzeichen
  • Leerzeichen wurden Unterstreichen
  • Zahlen wurden <<9>>
  • Satzzeichen, daß ein Satz beenden, oder ein Satz auf Spanisch anfangen, wurden ein Ausrufzeichen.
  • Alle anderen Schriftzeichen wurden das Rautenzeichen
  • Die Anfang und die Endungen den Paragraphen wurden "¶¶".

Mit Visual Basic prüfte ich den Text, und fand ich alle möglichen Bigrame. Ich wählte die 450 häufigste Bigrame weiter zu analysieren. Ich erschaffte ausgeprägte 450 x 450 Tabellen für jede Sprache.

I2C

Der verwickelteste und feinste Teil des Verfahren war die Festlegung, wie die Bigrame an den horizontalen und vertikalen Achsen ordnet wurde. Ich folgte dem Grundsatz, daß Bigrame mit ähnlichen Antwortmustern nebeneinander stehen. Zum Beispiel werden ra und na gewöhnlich von den gleichen Bigrame gefolgt. Daher stehen diese zwei Bigrame nebeneinander an dem vertikalen Achse (die Zeilen). Wie Folgenbigrame werden zu und ko gewöhnlich von den gleichen Bigrame vorausgegangen. Daher stehen diese zwei Bigrame nebeneinander an dem horizontalen Achse (die Spalten).

Der Begriff der Ähnlichkeit ist leicht zu verstehen, aber schwer mit einem Statistikalgorithmus zu durchführen. Ich versuchte vielen maßgefertigen Methoden, vorher ich das Schlußalgorithmus wählte. Wenn Sie die Details wissen wollen, bitte, senden Sie mir Email. Sonst verweile ich bei meinen Methode nicht hier.

Manche Ergebnisse

Die Hauptdiagramme sind reich mit Detailen. Sie ähneln Fraktale, daran sie dennoch viele Details zeigen, wenn Sie kleiner Teile prüfen. Ich ermutigen Sie, die Detaildiagramme zu prüfen.

F6C

Aber ich muss Orientierung besorgen. Lassen wir einige den Hauptzeilen, oder horizontale Streifen, anschauen.

Streif, E & F kreuzt – Diese sind fast alle Bigrame, die ein Leerzeichen für das zweiten Schriftzeichen haben. (Die Detaildiagramme zeigen Leerzeichen als Unterzeichen).

Blaue Streif – in I – Diese sind Bigrame, daß am Ende von deutschen Wörtern vorkommen. Zum Beispiel ehtz, oder hn.

Rote Streif, in F – Diese sind Bigrame mit betonten Vokalen, daß auf Spanisch vorkommen , án, und .

Grüne Streif, in A – Diese sind Bigrame, meistens mit y oder w wie das zweite Buchstaben. Häufig beenden sie englischen Wörter (zum Beispiel lyow, und sh.

The vertikalen Streifen (Spalten) sind auch interessant.

E8C

Streif um 2 – Diese sind Bigrame, daß ein Leerzeichen für das erste Schriftzeichen haben.

Streif, 5 & 6 kreuzt - Diese sind Bigrame, wo das erste Buchstabe rn, or l ist, und das zweite Buchstabe ein Konsonant ist.

Rote Streif, in 7 - Das erste Buchstabe dieser Bigrame ist a oder o, und das zweite Schriftzeichen ist ein Leerzeichen oder Satzzeichen (das Ende der spanischen Wörter oder Sätze).

Und wir haben einigen interessanten Vierecke,die die Kreuztpunkt von Zeilen und Spalten sind.

D2C

Leere E2 & F2 – Alle Doppelleerzeichen wurden auf Einzelleerzeichen umstellen. Die E/F Zeile ist Bigrame, die mit einem Leerzeichen enden. Die Spalte – 2 ist Bigrame, die mit einem Leerzeichen beginnen. Es gab kein Bigrampaar, daß zwei aufeinanderfolgenden Leerzeichen erhalten.

Spärliche A5 durch F5 – Mit weniger Ausnahmen enden die Bigrame von Zeilen A zu F mit Konsonanten. Spalten 5 & 6 erhalten Doppelkonsonantbigrame. Diese Kreuzpunkt zeigt drei aufeinanderfolgenden Konsonanten, daß selten vorkommen.

Helle E3 durch F5 – Spalten 3, 4, und 5 erhalten Bigrame, wo das erste Buchstabe ein Konsonant ist, und das zweite ein Vokale ist. Diese Verbindung erscheint häufig am Anfang der Wörter. Daher stellt diese Viereck dar:

Schriftzeichen – Leerzeichen – Konsonant – Vokal

daß der Übergang zwischen Wörtern ist.

Rote G2 & H2 – Vor allem ist der G/H Streif Bigrame, wo das erste Buchstabe ein Konsonant ist, und das zweite Buchstabe o oder a.  Daher ist deise Viereck:

Konsonant – o/a – Leerzeichen – Buchstabe

Vielen spanischen Substantiven enden mit o oder a, so das Viereck den Übergang zwischen spanischen Wörtern darstellt.

Gelbe H2 – Zeile H ist Bigrame, wo das zweite Buchstabe éu, oder iist. Vielen französischen Partizipien enden mit éu, und i.  So stellt das Viereck dar:

Konsonant – é/u/i – Leerzeichen – Buchstabe

der Übergang zwischen französischen Wörtern.

Bemerkungen? Fragen? Vorschläge? Bitte, email zu:

contact me