• 4
  • 13
  • 5
  • 1
  • 2
Der MEVA - Blog
Albrecht Weinert


a-weinert.de,  meva-lab.de
|< < > >|


blog... /deutsches-worterbuch-fur-eclipse/   [en]
Albrecht Weinert

Deutsches Wörterbuch für Eclipse

Wer nicht nur Englisch schreibt sondern auch viele deutsche Texte in JavaDoc- oder Doxygen-Kommentaren sowie in seinem XML und HTML hat, wird von Eclipses Rechschreibhilfe oft eher gestört. Hier gibt es nun speziell für Entwickler ein Wörterbuch mit ~23.000 deutschen Wortformen, das vor allem auch Fachbegriffe aus Java, OO und (Leit-) Technik enthält.

Holen und Installieren

 
Download: a-weinert.de/frame4j/downloads/de_DE.dic.
Speichern am besten unter: C:\Programme\eclipse\dropins

Installiert in Eclipse wird es einfach als “User defined directory” unter:  Window>Preferences>General>Editors>Texteditors>spelling.

Hinweis: Eclipse verlangt (vermutlich) Schreibrechte für seinen Benutzer auf der Datei

C:\Programme\eclipse\dropins\de_DE.dic

Unter Windows macht man die entsprechenden Einstellungen mit dem Explorer oder mit cacls in der shell. Unter Linux erreicht man das nötigenfalls sinngemäß so

sudo cp ‘/where/it/is/de_DE.dic’ ‘/usr/lib/eclipse/dropins’
sudo chmod 777 /usr/lib/eclipse/dropins/de_DE.dic

Hinweis 2: Da von allen Eclipse-Editoren die Rechtschreibprüfung beim “Text Editor” am besten funktioniert, sollte man diesen ab und zu nutzen, falls das .java, .html, .php oder was immer einen nennenswerten Anteil lesbaren Texts hat.

Aufbau der Datei

 
Die hier verwendete einfachste Form einer von Eclipse nutzbaren .dic-Datei ist

  • eine Wortform pro Zeile
  • keine Wiederholungen auch nicht mit großem Anfangsbuchstaben (wenn “wandern” drin ist, akzeptiert Eclipse “Wandern” sowieso)
  • keine Punkte am Ende (Eclipse akzeptiert “etc.” im Text nur mit einem .dic-Eintrag “etc”)
  • keine Bindestrichworte (Eclipse prüft “Baden-Württemberg” sowie so nur gegen die getrennten Einträge “baden” und “Württemberg”)
  • unsortiert (Eclipse scheint .dic-files beim Laden nach eigenem Ermessen zu sortieren. Andere Informationen?)

Selbst modifizieren

 
Das Frame4J-Tool UCopy kann eine Textdatei mit Aufruf
java UCopy ausgangs.txt -eclipDic -v ziel.dic
weitgehend in diese Form bringen, indem es

  • die Worte in Zeilen separiert
  • eine nachlaufenden Punkt beseitigt
  • Einzelbuchstaben und Dubletten (auch solche die sich nur durch großen Anfangsbuchstaben unterscheiden) beseitigt
  • sowie Worte, die Ziffern oder ausschließlich Großbuchstaben enthalten, entfernt.

Dieses Tool erleichtert die Erstellung und Ergänzung einer solchen .dic-Datei erheblich: Ohne Rücksicht auf Zeilenstruktur und bereits Vorhandenes ergänzt man beliebige korrekt (!) geschriebene Wortformen und lässt dann UCopy mit der -eclipdic Option drüberlaufen.

Feed für Kommentare zum Beitrag

Ihr Kommentar

Bitte loggen Sie sich zum Kommentieren ein beziehungsweise registrieren Sie sich so als willkommener neuer Nutzer des Blogs.

Copyright   ©   2013   Albrecht Weinert,       E-Mail (webmaster)
Feed on RSS: Post Feed RSS   Beitrags-Feed,   Comments Feed RSS   Kommentar-Feed