Aug 5th, 2009
Deutsches Wörterbuch für Eclipse
Wer nicht nur Englisch schreibt sondern auch viele deutsche Texte in JavaDoc- oder Doxygen-Kommentaren sowie in seinem XML und HTML hat, wird von Eclipses Rechschreibhilfe oft eher gestört. Hier gibt es nun speziell für Entwickler ein Wörterbuch mit ~23.000 deutschen Wortformen, das vor allem auch Fachbegriffe aus Java, OO und (Leit-) Technik enthält.
Holen und Installieren
Download: a-weinert.de/frame4j/downloads/de_DE.dic.
Speichern am besten unter: C:\Programme\eclipse\dropins
Installiert in Eclipse wird es einfach als “User defined directory” unter:Â Window>Preferences>General>Editors>Texteditors>spelling.
Hinweis: Eclipse verlangt (vermutlich) Schreibrechte für seinen Benutzer auf der Datei
C:\Programme\eclipse\dropins\de_DE.dic
Unter Windows macht man die entsprechenden Einstellungen mit dem Explorer oder mit cacls in der shell. Unter Linux erreicht man das nötigenfalls sinngemäß so
sudo cp ‘/where/it/is/de_DE.dic’ ‘/usr/lib/eclipse/dropins’
sudo chmod 777 /usr/lib/eclipse/dropins/de_DE.dic
Hinweis 2: Da von allen Eclipse-Editoren die Rechtschreibprüfung beim “Text Editor” am besten funktioniert, sollte man diesen ab und zu nutzen, falls das .java, .html, .php oder was immer einen nennenswerten Anteil lesbaren Texts hat.
Aufbau der Datei
Die hier verwendete einfachste Form einer von Eclipse nutzbaren .dic-Datei ist
- eine Wortform pro Zeile
- keine Wiederholungen auch nicht mit großem Anfangsbuchstaben (wenn “wandern” drin ist, akzeptiert Eclipse “Wandern” sowieso)
- keine Punkte am Ende (Eclipse akzeptiert “etc.” im Text nur mit einem .dic-Eintrag “etc”)
- keine Bindestrichworte (Eclipse prüft “Baden-Württemberg” sowie so nur gegen die getrennten Einträge “baden” und “Württemberg”)
- unsortiert (Eclipse scheint .dic-files beim Laden nach eigenem Ermessen zu sortieren. Andere Informationen?)
Selbst modifizieren
Das Frame4J-Tool UCopy kann eine Textdatei mit Aufruf
java UCopy ausgangs.txt -eclipDic -v ziel.dic
weitgehend in diese Form bringen, indem es
- die Worte in Zeilen separiert
- eine nachlaufenden Punkt beseitigt
- Einzelbuchstaben und Dubletten (auch solche die sich nur durch großen Anfangsbuchstaben unterscheiden) beseitigt
- sowie Worte, die Ziffern oder ausschließlich Großbuchstaben enthalten, entfernt.
Dieses Tool erleichtert die Erstellung und Ergänzung einer solchen .dic-Datei erheblich: Ohne Rücksicht auf Zeilenstruktur und bereits Vorhandenes ergänzt man beliebige korrekt (!) geschriebene Wortformen und lässt dann UCopy mit der -eclipdic Option drüberlaufen.
Ihre Anmerkungen — leave a reply
Please log in
to post a comment.
Use the same link to register as a new (welcome) user.
Hierzu müssen Sie eingeloggt sein.
Mit dem obigen Link können Sie sich gern auch als neues Mitglied registrieren.




