Jetzt kanns weitergehen …

Noch eine kleine Anpassung … Kanji-Stroke-Order-Colorizer war auf ein einziges Kanji-Zeichen begrenzt … Diese Beschränkung hab ich aufgehoben und jetzt bin ich glücklich:

anki2_2

So hab ich mir das vorgestellt …Zu meiner Expression 歴史 wird automatisiert die Heisig-Nummern herausgesucht und die Diagramme erstellt 🙂

Erstaunlicherweise stimmen bei diesem Beispiel, die Kanji-Untergruppen mit den Gruppen von RTK überein. Es ist nur eine theorie, aber da hat sich entweder KanjiVG von Heisig inspirieren lassen oder umgekehrt … Ich kann irgendwann mal ein Beispiel aus Kanji-ABC und den Graphemen suchen, und dann weiß ich vlt genaueres … Momentan bin ich damit sehr zufrieden.

Jetzt muss ich nur noch herausfinden, ob mir das wirklich etwas bringt oder nicht …

Beide Patches hab ich in den GitHub submitted … Mal kucken, ob die Patches aufgenommen werden … Wenn nicht, forke ich es einfach und arbeite am Fork weiter 🙂

Advertisements

Anki-Plugin angepasst

Na also 🙂

anki2

Das ganze war etwas wie ein Brain-Teaser, weil das SVG/XML mit Untergruppen und Unteruntergruppen strukturiert ist und man erstmal herausfinden musste, welche Gruppen man in einer Farbe überhaupt anzeigt.

Die KanjiVG-Daten brechen innerhalb des SVGs die Gruppen noch weiter auf, bis teilweise nur noch Striche übrig sind.

Jetzt war die Kunst dann „nur noch“, ohne Python-ElementTree auszukommen. ElementTree ist eine XML-Library, die das rekursive Iterieren durch einen XML-Baum sehr einfach macht. Konnte ich leider nicht verwenden, weil die Library nicht Bestandteil des Python-Cores ist und selbst nachinstalliert werden müsste. Wäre natürlich schlecht für Plugins, die man einfahc nur runterladen möchte und die dann funktionieren sollen.

Das obige Kanji ist eins meiner „Lieblingskanjis“ … Ich konnte es mir irgendwie nie merken, weil es einfach nur komplex aussah. Ich merkte mir quasi, dass das Kanji, das kompliziert aussieht, 後 sein müsste … Ist natürlich ein richtiger Fail, wenn man versucht normale Alltagstexte in Japanisch zu lesen 😉

Gibt noch ein paar andere Kanjis, bei denen das Gleiche ist …

Jetzt werd ich aber mal richtig saubermachen und die Kanjis vernünftig lernen 🙂

Naja, gleich nachdem ich KanjiColorizer nochmal neu runtergeladen und einen hübschen Patch gebaut habe, der hoffentlich dann in die Mainline wandert. Über ein neues Setting sollte man von StrokeOrder auf ColorGroups umschalten können, was implementierungstechnisch ohne weiteres möglich ist 🙂

 

Tagaini Jisho (Update3)

Ja, was es alles gibt!

Eine kostenlose Wörterbuchsoftware, die auch die Zerlegung von Kanji in Komponenten beherrscht … Echt super!

tagainijisho

Testweise hab ich 蜜 mal mit dem RTK verglichen und man würde es nicht glauben … Die Bedeutungen sind nahezu die gleichen (davon mal abgesehen, dass ich es in Deutsch habe …)

Für mich ist das Kanji-Lernen über die Komponenten der richtige Weg … Ob ich dafür aber tatsächlich die Geschichtchen aus RTK assimiliere oder nur mit der Komponentenzerlegung arbeite, weiß ich noch nicht …

*Update*: Ja is denn heut‘ scho Weihnachten? 🙂

Die Quelle für die Zerlegung ist KanjiVG … Eine Webseite, die die Daten kostenlos zum Runterladen anbietet (als SVG/XML) …

Ein XML-Schnippsel sieht z.B. so aus:

<kanji id="kvg:kanji_04ede">
<g id="kvg:04ede" kvg:element="仞">
    <g id="kvg:04ede-g1" kvg:element="亻" kvg:variant="true" kvg:original="人" kvg:position="left" kvg:radical="general">
        <path id="kvg:04ede-s1" kvg:type="㇒" d="M32.49,15.39c0.13,1.17,0.24,2.64-0.12,4.08c-2.26,9.09-11.02,26.67-21.56,39"/>
        <path id="kvg:04ede-s2" kvg:type="㇑" d="M27.03,39c0.59,0.61,0.76,1.97,0.76,3.23c0,13.02-0.29,43.65-0.29,52.4"/>
    </g>
    <g id="kvg:04ede-g2" kvg:position="right">
        <g id="kvg:04ede-g3" kvg:element="刀">
            <path id="kvg:04ede-s3" kvg:type="㇆" d="M46.22,24.4c1.66,0.83,3.74,0.61,5.21,0.45C63.5,23.5,80,21.61,86.57,20.76c4.27-0.55,6.17,1.66,5.93,5.55c-0.63,10.25-7.05,49.63-12.87,61.41c-4.22,8.55-6.69,5.81-9.88,0.26"/>
            <path id="kvg:04ede-s4" kvg:type="㇒" d="M64.44,27.33c0.81,1.17,0.59,3.49,0.37,5.44C62.63,51.82,56.7,71.14,42.5,88.11"/>
        </g>
        <g id="kvg:04ede-g4" kvg:element="丶">
            <path id="kvg:04ede-s5" kvg:type="㇔" d="M49.89,41.32c0.38,2.32-3.16,13.34-6.81,16.42"/>
        </g>
    </g>
</g>
</kanji>

Na, da werd ich mir doch ein Anki-Plugin daraus zimmern!

Diese farbigen Komponentenbildchen kann man mit Python bestimmt nicht all zu schwierig zeichnen lassen … Jedes einzelne Zeichen ist ein kleines SVG-Bildchen und SVG-Libraries gibts bestimmt genug …

Glaub, da hab ich die nächste Zeit dann schon wieder was zu tun … Wär ja furchtbar, wenn ich mal zum Aus- und Entspannen kommen würde 😉

*Update2*: Oho … Das Plugin Kanji-Stroke-Order-Colorizer basiert auf den KanjiVG Daten … Na dann ist es ja noch leichter, den Kram umzubauen 🙂

*Update3*: Und tatsächlich … Mir kamen die Bildchen so vertraut vor, dass ich gleich an den Kanji-Stroke-Orders-Font denken musste … Identisch!

Ich muss mal googeln, wer KanjiVG noch alles verwendet … Die Möglichkeiten sind unendlich 🙂

Aus 2 mach 1 :)

Achja, ist ja super, dass es für Anki Decks mit RTK gibt …

Es gibt sowohl das RTK 4th edition (in English) als auch das RTK 3rd edition (in Deutsch).

Die Aufgabe bestand nun, aus den zwei Decks ein neues Deck zu bauen … RTK 4th edition in Deutsch 🙂

Die Decks ließen sich aus Anki in Form von Textdateien exportieren und von Python einlesen … Etwas Skriptmagie und tada … Jetzt hab ich endlich das, was ich wollte …

Auszug:

刑;Strafe;734
型;Gussform;735
才;Genie;736
財;Vermögen;737
材;Baumaterial;738
存;existieren;739
在;sein;740

Kanji mit deutscher Bedeutung und Heisig-Index der neuen Auflage 🙂

Jetzt muss ich nur noch mein Kanji Meaning Lookup Plugin so umbauen, dass für jedes Kanji gleich die Heisig-Bedeutung und -Index in meine Karten eingetragen werden und dann bin ich der effizenteren Verwendung von RTK wieder ein kleines Stückchen näher gekommen 🙂

Leider gibts aber keine Stories in Deutsch … Außerdem gibt es leider keine Angabe der verwendeten Primitiven … Mal schauen, wieviel eigenen Aufwand ich da investieren werde 🙂

 

 

Ach herje … RTK neue Auflage

Ohje, seufz 😉

Neue „stark erweiterte“ Auflage von RTK (Remember The Kanji) mit 196 Kanji mehr …

Die zusätzliche Menge an Kanjis wäre nicht so schlimm, wenn sie die Kanjis nicht einfach in der Buch reingewurschtelt hätten.

Das hat zur Folge, dass z.B. der Heisig-Index auf WWWJDIC nicht mehr stimmt. Oder, dass fertige Heisig-Index-Listen nicht mehr richtig sind …

Nach einem Nachmittag, den ich im Schockzustand verbrachte, fand ich dann Heraus, dass es eine Konkordanzliste zu der neuen Auflage gibt.

Ein PDF, das ein Mapping der alten Auflage zur neuen Auflage durchführt. Und auf den ersten Blick, scheint das sogar korrekt zu sein.

Dummerweise ist das ein PDF und ich muss erst wieder irgendwas basteln, damit man programmatisch verwendbare Listen herausbekommt. Ist aber nicht unbedingt schlimm, weil man per Copy und Paste die Daten aus dem PDF bekommt und nur noch etwas Programmlogik braucht, um eine neue Liste zu generieren.

Mein Ziel ist:

Kanji in Anki -> Liste 1 (Kanji nach Nummer alt) -> Liste 2 (Mapping auf neue Ausgabe) -> Integration des Heisig-Index der neuen Ausgabe in meinen Anki-Karten für schnellere Referenz … 🙂

Was jetzt noch super wäre wäre, wenn es eine Datenbank geben würde, die ein Kanji in die Primitiven aufsplittet … Das ist aber garnicht sooooo einfach, weil die Zerlegung in Primitive rekursiv erfolgen müsste, da Primitive aus anderen Primitiven aufgebaut sein können.

Ein Baum-Digramm dazu würde mich ja mal interessieren … Auf das erste Googeln hab ich nichts gefunden …

Ist die Frage, wieviel Arbeit ich mir hier machen sollte … Auf der einen Seite wäre es wahrscheinlich eine gute Übung, sich im Detail mit den Kanjis zu beschäftigen … Auf der anderen sind es aber über 2000 Symbole 🙂

Mal kucken …

 

Wie sich die Zeiten ändern …

Noch ganz kurz … Ich bin gerade im Stress 🙂

Heute wurde wieder mal darauf hingewiesen, dass ältere Joomla Installationen (von vor August 2012) eine kritische Sicherheitslücke haben, die die Ausführung von beliebigem PHP-Code auf dem Server ermöglichen.

Meine Joomla Installation ist noch Version 1.4 von vor 3 oder 4 Jahren (ich glaube 2009). Zwischenzeitlich hab ich immer mal versucht, die Webseite zu aktualisieren, wobei mir aber viel Content verloren ging. Z.B. das Seiten-Template, weil ich es in mühsamer Handarbeit selbst angepasst hatte oder die Bilingualität, weil es plötzlich die JoomFish Komponente nicht mehr gab usw usf …

Ich hab meine Bemühungen wieder gelöscht und bin bei der alten Seite geblieben …

Soweit ich mich erinnern kann – naja, ab einem Alter von 16 Jahre – hatte ich immer eine private Homepage, auf der ich meine Elektronik-Basteleien veröffentlichte.

Die Seite entwickelte sich mit meinem Wissen … Wie ein kleines Tagebuch irgendwie 🙂

Nunja, heute hab ich meine Webseite lahmgelegt, weil ich

1. Die Seite von Joomla ohne großen Content-Verlust auf eine höhere Version migrieren kann und

2. ich werde langsam müde, in sowas noch Arbeit zu investieren.

Mein Jugendlicher Ehrgeiz, mein Engagement und meine Energie scheinen aufgebraucht …

Das war’s jetzt wohl … Bisher war meine Webseite immer ein Vorzeigeobjekt, quasi als Untermauerung dessen, was ich über mich z.B. in Bewerbungen behauptete … und mittlerweile ist es mir (fast) egal …

Jetzt liegt sie still … Momentan erscheint ein 5-zeiliger Text, der von „temporarily disabled“ spricht, bis ich die Motivation finde, die Seite komplett auf ein anderes System zu migrieren …

Ich frage mich … Wann wird das sein? Wird es jemals passieren?

 

Lernanalyse: Kanji

Ich hab festgestellt, ich hab ein Problem mit Kanji …

Bisher hab ich sie immer in Form kleiner Bildchen gelernt. Sie nicht in Radikale, nicht in Grapheme und nicht in sonstige Teilstücke zerlegt. Sie auch nicht geschrieben und auch nicht explizit gelernt. Einfach durch die visuelle Wahnehmung versucht zu unterscheiden.

Dieses „unterscheiden“ wird problematischer, wenn neue Kanji dazukommen. Es werden mehr und mehr und die Unterscheidung muss viel differenzierter erfolgen.

Hat man nur insgesamt zwei Kanji, kann man 本 von 日 recht einfach unterscheiden. Wächst die Sammlung, gibt es plötzlich Konflikte zwischen neuen Kanjis und alten Kanjis, die man von der bisherigen Menge gut unterscheiden konnte.

Dies fällt aber nicht sofort auf, sondern erst in der nächsten Wiederholung, was teilweise ein paar Monate dauern kann (bis es im Anki Vokabelkasten wieder drankommt).

Andererseits hat das Erfassen als Bildchen auch noch das Problem, dass man sich nie so wirklich mit der Struktur auseinandergesetzt hat, sich an diese auch nicht erinnern kann und damit informationen zum Merken fehlen. Die sind dann gleich wieder weg …

Dies führt ebenfalls zu Problemen, wenn man versucht, normale Texte zu lesen. Man wird plötzlich mit einer Menge von 2000irgendwas Kanji konfrontiert und hat keine Möglichkeit, exakt zu bestimmen, ob dies oder das Kanji wirklich das ist, das man gelernt hat. So ähnlich sieht es schon aus …

Die Lösung muss sein, Kanji exakt voneinander unterscheidbar zu lernen … Dies setzt voraus, dass man sich mit der Struktur und vlt mit Teilstücken auseinandersetzt.

Jetzt ist natürlich die Frage … Möchte man das in Form von kleinen abstrusen Geschichtchen lernen (Remember the Kanji) oder in Form von neutralen Graphemen (Kanji ABC, das es seit 1995 nicht mehr aktualisiert gibt) oder erarbeitet man sich auf Basis eines uralt Buchs und aktuelleren Erkenntnissen eine eigene Version, mit der man am Besten zurechtkommt?