Seit über drei Jahren bin ich jetzt schon prinzipiell daran interessiert, madagassich zu lernen. Phasenweise habe ich dann auch mal wirklich Anstalten gemacht, Vokabeln und einfache Satzstrukturen zu lernen, aber immer schnell wieder andere Sachen wichtiger, dringender, spannender gefunden. Leider gibt es auch nicht besonders viele Resourcen, die einem dabei behilflich sein könnten. So habe ich etwa wirklich noch keinen einzigen madagassischen Podcast gefunden und Google Translate kann Malaysisch, Maltesisch und Mazedonisch, aber (noch) kein Madagassisch. Einige Online-Wörterbücher gibt es immerhin doch: Monde Malgache, Mada Dictionaire.
Einige typische „Einsteigervokabeln“ wie Hallo, Tschüß, Danke und Kartoffel habe ich bereits gelernt, aber das reicht noch lange nicht, um einen unbekannten Text lesend zu verstehen (Hören ist nochmal sehr viel schwerer für mich). Damit ich zum Beispiel Artikel in der madagassichen Wikipedia unter Zuhilfenahme eines Wörterbuchs bewältigen kann, müsste ich wenigstens die häufigsten Wörter kennen, damit ich nicht jedes Wort nachschlagen muss. Welches sind denn nun die häufigsten Wörter? Für andere Sprachen, wie Englisch oder Deutsch ist eine solche Liste schnell gefunden. Für die madagassische Sprache war so etwas nicht auffindbar – Lediglich eine Liste der Häufigkeit der Buchstaben konnte ich ausfindig machen.
Also – wenn es so etwas scheinbar noch nicht gibt, muss ich die Liste wohl selbst aufstellen. Dabei halte ich es erstmal einfach; Verben in verschiedenen Zeitformen oder Hauptwörter in Plural und Singular werden nicht zusammengefasst, zusammengesetzte Wörter nicht in ihre Einzelteile zerlegt usw. Wo ein Leerzeichen oder ein Satzzeichen (.;!?) auftritt, ist das Wort zuende und es beginnt das nächste. Solange diese einfachen Regeln gelten, kann (fast) jeder Informatik-Student im ersten Semester eine Liste der häufigsten Wörter für einen gegebenen Text aufstellen. Ob diese Vereinfachung halbwegs akzeptabel ist, werde ich Tahina bei Gelegenheit mal fragen;-)
Stellt sich die Frage – Welchen Input sollte für die Analyse verwendet werden? Ich dachte zuerst an die madagassischsprachige Wikipedia, aber das Lernen der API zum „scrapen“ der Inhalte wäre nochmal ein Projekt für sich, dass ich vielleicht zu einem späteren Zeitpunkt nochmal angehe. Vorerst suchte ich nach einem Text, den ich ohne größeren Aufwand in mein Programm „hineinwerfen“ kann. Hier bin ich (zumindest vorerst) bei der madagassischen Bibelübersetzung von 1865 gelandet – weder aktuell noch unbedingt repräsentativ für die Alltagssprache, aber immerhin vom Umfang schonmal interessant. Wenn die Ergebnisse wirklich repräsentativ sein sollten, bräuchte ich natürlich deutlich aktuellere und thematisch breiter gestreute Texte.
Trotzdem: Besser als nichts. Es folgen die 100 häufigsten Wörter aus der madagassischen Bibel. Da ich mich entschieden habe, Idiome, die mit Apostroph oder Bindestrich zusammengehalten werden als ein Wort zu betrachten, tauchen auch einige davon in der Liste auf.
Platzierung | Wort | Vorkommen | Übersetzung |
---|---|---|---|
1 | ny | 53992 | der/die/das |
2 | ary | 25139 | und; also |
3 | dia | 22759 | und; dann |
4 | sy | 13975 | und (Aufzählung) |
5 | amin’ny | 13678 | zum/zur |
6 | ho | 12727 | werden |
7 | ka | 12260 | aber;und;deshalb |
8 | izy | 11324 | er/sie/es |
9 | fa | 10722 | aber; dass; weil |
10 | tsy | 10614 | nicht |
11 | izay | 10614 | der/die/das |
12 | no | 10514 | Hilfswort in Fragen |
13 | na | 7486 | oder |
14 | jehovah | 7027 | Gott (?) |
15 | azy | 6717 | ihn/ihm/sein/ihr |
16 | rehetra | 6342 | alles/alles |
17 | izany | 5655 | der/die/das |
18 | tany | 5355 | Feld; Erde |
19 | tamin’ny | 4936 | zum/zur |
20 | hoe | 4312 | also |
21 | efa | 3948 | abgeschlossen |
22 | koa | 3757 | auch |
23 | avy | 3623 | kommen |
24 | eo | 3619 | hier |
25 | teo | 3543 | da |
26 | raha | 3521 | als/wenn/falls |
27 | any | 3514 | dort |
28 | aho | 3446 | ich |
29 | hoy | 3434 | direkte Rede „er sagt“ |
30 | an’i | 3245 | zugehörig |
31 | olona | 3057 | Mensch; Jemand |
32 | mba | 3042 | so dass |
33 | nanao | 2833 | machen (Vergangenheitsform) |
34 | ao | 2799 | dort |
35 | izao | 2410 | jetzt; dieser („this“) |
36 | ireo | 2325 | |
37 | aza | 2317 | |
38 | ianao | 2303 | |
39 | tao | 2275 | |
40 | andro | 2203 | |
41 | ahy | 2167 | |
42 | noho | 2155 | |
43 | ianareo | 2085 | |
44 | taminy | 1936 | |
45 | anao | 1914 | |
46 | ihany | 1891 | |
47 | sady | 1884 | |
48 | isiraely | 1811 | |
49 | araka | 1778 | |
50 | mpanjaka | 1756 | |
51 | misy | 1749 | |
52 | tahaka | 1739 | |
53 | eny | 1676 | |
54 | aminy | 1662 | |
55 | tonga | 1590 | |
56 | kosa | 1563 | |
57 | teny | 1522 | |
58 | nisy | 1491 | |
59 | aoka | 1481 | |
60 | tamin’i | 1451 | |
61 | zanak’i | 1391 | |
62 | izaho | 1340 | |
63 | toy | 1317 | |
64 | va | 1306 | |
65 | rehefa | 1304 | |
66 | zavatra | 1296 | |
67 | iray | 1270 | |
68 | ry | 1259 | |
69 | jesosy | 1257 | |
70 | nefa | 1255 | |
71 | roa | 1225 | |
72 | indro | 1208 | |
73 | davida | 1197 | |
74 | anareo | 1187 | |
75 | tsara | 1181 | |
76 | mbola | 1156 | |
77 | ilay | 1151 | |
78 | satria | 1115 | |
79 | amin’i | 1091 | |
80 | ratsy | 1076 | |
81 | an’ny | 1057 | |
82 | fanatitra | 1053 | |
83 | chapitre | 1034 | |
84 | tan | 1012 | |
85 | firenena | 979 | |
86 | ity | 969 | |
87 | aminao | 959 | |
88 | maro | 957 | |
89 | nony | 934 | |
90 | lehilahy | 921 | |
91 | manao | 918 | |
92 | samy | 915 | |
93 | aminareo | 915 | |
94 | taranak’i | 900 | |
95 | marina | 895 | |
96 | mosesy | 877 | |
97 | masina | 875 | |
98 | joda | 867 | |
99 | jerosalema | 859 | |
100 | fanahy | 841 |
Der nächste Schritt ist jetzt wohl, sich auch um die Übersetzung für die Wörter zu bemühen, sonst ist das ganze natürlich nicht viel Wert. Aber für heute mache ich erstmal Schluss;-)