[deepamehta-users] utf-8 Probleme
Torsten Ziegler
torsten at ziegi.de
Do Aug 14 17:22:47 CEST 2008
Hallo Jörg,
danke für den schnellen Bugfix,
es funktioniert jetzt einwandfrei.
Ich konnte auch das Problem mit den SCIM-Eingabemethoden lösen,
vielleicht interessiert es ja den einen oder anderen:
Bei Debian und Ubuntu (andere Distributionen scheinen das automatisch
richtig zu machen)
muß die benutzte LOCALE (herauszufinden mit "locale | grep LANG=")
in der Datei /etc/scim/global unter /SupportedUnicodeLocales
eingetragen sein. (z.B.: "/SupportedUnicodeLocales =
de_DE.UTF-8,en_US.UTF-8")
Achtung kein Leerzeichen nach dem Komma wegen des Bugs:
https://bugs.launchpad.net/ubuntu/+source/scim/+bug/98890
siehe auch: http://ubuntuforums.org/showthread.php?t=828631
Liebe Grüße,
Torsten
Jörg Richter schrieb:
>
> Lieber Torsten,
>
> Ja, ich kann Dein Problem nachvollziehen. Inzwischen habe ich den
> Fehler gefunden. In einer Konfigurationsdatei fehlt ein Parameter.
>
> Um den Fehler zu beheben, editiere die Datei
> "install/config/dm-mysql5.properties": füge an die Property "db.url"
> hinten den Parameter "characterEncoding=utf8" an. Die komplette Zeile
> lautet also:
>
> db.url =
> jdbc:mysql://${db.host}/${db.name}?useUnicode=true&characterEncoding=utf8
>
> Beim Neustart von DeepaMehta solltest Du im Log jetzt die
> komplettierte URL sehen;
>
>> [java] Using Database
>> [java] Type : mysql5
>> [java] URL :
>> jdbc:mysql://127.0.0.1/DeepaMehta?useUnicode=true&characterEncoding=utf8
>> [java] Driver : org.gjt.mm.mysql.Driver
>
> Jetzt korrigiere in DeepaMehta die korrupten Topic-Namen von Hand. Von
> nun an sollte alles korrekt funktionieren.
>
> Zu den SCIM-Eingabemethoden: davon hatte ich bisher noch nicht gehört.
> Ich nehme an, daß diese von Sun in das JDK/Linux integriert werden
> müssten, die DeepaMehta-Entwickler da möglicherweise wenig ausrichten
> können. Eine Google-Suche nach "SCIM Java" zeigt, daß das ein "Thema"
> ist.
>
> Hintergrund zum UTF-Problem: dank Deines Hinweises, und durch
> detaillierte Tests habe ich herausgefunden, daß für MySQL 4 und MySQL
> 5 die UTF-Datenablage garnicht funktioniert, sondern Latin1 benutzt
> wird. Daß wir das jetzt erst bemerken, liegt auch daran, daß wir uns
> bisher nicht mit chinesischer Umschrift befasst haben :-)
>
>
>
> Auf dem Screenshot kann man sehen, daß Latin1-Zeichen, z.B. Üäüéè,
> korrekt abgelegt werden, UTF-Zeichen, z.B. o(i-, hingegen nicht. Daß
> die UTF-Zeichen im Feld "Description" allerdings richtig erscheinen,
> liegt daran, daß dies ein "Text Editor"-Feld ist, wo HTML hinterliegt,
> und die UTF-Zeichen dort als Entities kodiert werden (z.B. ǒ).
> Das Feld "Name" hingegen ist ein reines (vormals Latin1-kodiertes)
> Text-Feld.
>
> In HSQL tritt der Fehler nicht auf. Dort funktioniert die UTF-Kodierung.
>
> Vielen Dank für das Feedback!
>
> Grüße
> Jörg
>
>
> On 01.08.2008, at 23:12, Torsten Ziegler wrote:
>
>> Hallo Jörg und Co.,
>>
>> mir sind gerade Zeichensatz Probleme aufgefallen.
>> Und zwar arbeite ich mit pinyin zum schreiben von
>> chinesischen Zeichen und wenn ich ein Topic zum
>> Beispiel:
>> Sho(u Yi-n Fèi Ji-ng
>> nenne wird es nach der Eingabe noch richtig in
>> der Map angezeigt, sobald es aber aus der Datenbank
>> (derzeit mysql5) gelesen wird kommt:
>> Sh?u Y?n Fèi J?ng
>> dabei raus (ich hoffe das erscheint hier in der email richtig)
>> Ich habe mir den entsprechenden Eintrag in mysql angesehen
>> und es wird schon so falsch abgespeichert.
>> Wenn ich den Eintrag von Hand in der Tabelle ändere
>> wird er richtig aus der Datenbank gelesen und angezeigt,
>> er geht erst bei der nächsten Änderung wieder kaputt.
>> Das ist unter Windows und Linux der Fall.
>>
>> Und dann habe ich noch das Problem, daß ich Java unter
>> Linux noch nicht dazu überreden kann die SCIM Eingabemethoden
>> zu benutzen. Ich muss also erst in einen Texteditor schreiben und
>> dann in Deepamehta rüberkopieren. Wenn da jemand
>> Abhilfe weiss wäre ich auch ganz froh.
>>
>> Liebe Grüße
>> Torsten
>>
>>
>> <torsten.vcf>_______________________________________________
>> deepamehta-users mailing list
>> deepamehta-users at lists.berlios.de
>> https://lists.berlios.de/mailman/listinfo/deepamehta-users
> ------------------------------------------------------------------------
>
> _______________________________________________
> deepamehta-users mailing list
> deepamehta-users at lists.berlios.de
> https://lists.berlios.de/mailman/listinfo/deepamehta-users
>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : torsten.vcf
Dateityp : text/x-vcard
Dateigröße : 148 bytes
Beschreibung: nicht verfügbar
URL : <http://lists.deepamehta.de/mailman/private/users-lists.deepamehta.de/attachments/20080814/c5a375d2/attachment.vcf>
Mehr Informationen über die Mailingliste users