[deepamehta-users] utf-8 Probleme

Torsten Ziegler torsten at ziegi.de
Do Aug 14 17:22:47 CEST 2008


Hallo Jörg,

danke für den schnellen Bugfix,
es funktioniert jetzt einwandfrei.

Ich konnte auch das Problem mit den SCIM-Eingabemethoden lösen,
vielleicht interessiert es ja den einen oder anderen:
Bei Debian und Ubuntu (andere Distributionen scheinen das automatisch
richtig zu machen)
muß die benutzte LOCALE (herauszufinden mit "locale | grep LANG=")
in der Datei /etc/scim/global unter /SupportedUnicodeLocales
eingetragen sein. (z.B.: "/SupportedUnicodeLocales =
de_DE.UTF-8,en_US.UTF-8")
Achtung kein Leerzeichen nach dem Komma wegen des Bugs:
https://bugs.launchpad.net/ubuntu/+source/scim/+bug/98890
siehe auch: http://ubuntuforums.org/showthread.php?t=828631

Liebe Grüße,
Torsten

Jörg Richter schrieb:
>
> Lieber Torsten,
>
> Ja, ich kann Dein Problem nachvollziehen. Inzwischen habe ich den 
> Fehler gefunden. In einer Konfigurationsdatei fehlt ein Parameter.
>
> Um den Fehler zu beheben, editiere die Datei 
> "install/config/dm-mysql5.properties": füge an die Property "db.url" 
> hinten den Parameter "characterEncoding=utf8" an. Die komplette Zeile 
> lautet also:
>
> db.url = 
> jdbc:mysql://${db.host}/${db.name}?useUnicode=true&characterEncoding=utf8
>
> Beim Neustart von DeepaMehta solltest Du im Log jetzt die 
> komplettierte URL sehen;
>
>> [java] Using Database
>> [java] Type : mysql5
>> [java] URL : 
>> jdbc:mysql://127.0.0.1/DeepaMehta?useUnicode=true&characterEncoding=utf8
>> [java] Driver : org.gjt.mm.mysql.Driver
>
> Jetzt korrigiere in DeepaMehta die korrupten Topic-Namen von Hand. Von 
> nun an sollte alles korrekt funktionieren.
>
> Zu den SCIM-Eingabemethoden: davon hatte ich bisher noch nicht gehört. 
> Ich nehme an, daß diese von Sun in das JDK/Linux integriert werden 
> müssten, die DeepaMehta-Entwickler da möglicherweise wenig ausrichten 
> können. Eine Google-Suche nach "SCIM Java" zeigt, daß das ein "Thema" 
> ist.
>
> Hintergrund zum UTF-Problem: dank Deines Hinweises, und durch 
> detaillierte Tests habe ich herausgefunden, daß für MySQL 4 und MySQL 
> 5 die UTF-Datenablage garnicht funktioniert, sondern Latin1 benutzt 
> wird. Daß wir das jetzt erst bemerken, liegt auch daran, daß wir uns 
> bisher nicht mit chinesischer Umschrift befasst haben :-)
>
>
>
> Auf dem Screenshot kann man sehen, daß Latin1-Zeichen, z.B. Üäüéè, 
> korrekt abgelegt werden, UTF-Zeichen, z.B. o(i-, hingegen nicht. Daß 
> die UTF-Zeichen im Feld "Description" allerdings richtig erscheinen, 
> liegt daran, daß dies ein "Text Editor"-Feld ist, wo HTML hinterliegt, 
> und die UTF-Zeichen dort als Entities kodiert werden (z.B. ǒ). 
> Das Feld "Name" hingegen ist ein reines (vormals Latin1-kodiertes) 
> Text-Feld.
>
> In HSQL tritt der Fehler nicht auf. Dort funktioniert die UTF-Kodierung.
>
> Vielen Dank für das Feedback!
>
> Grüße
> Jörg
>
>
> On 01.08.2008, at 23:12, Torsten Ziegler wrote:
>
>> Hallo Jörg und Co.,
>>
>> mir sind gerade Zeichensatz Probleme aufgefallen.
>> Und zwar arbeite ich mit pinyin zum schreiben von
>> chinesischen Zeichen und wenn ich ein Topic zum
>> Beispiel:
>> Sho(u Yi-n Fèi Ji-ng
>> nenne wird es nach der Eingabe noch richtig in
>> der Map angezeigt, sobald es aber aus der Datenbank
>> (derzeit mysql5) gelesen wird kommt:
>> Sh?u Y?n Fèi J?ng
>> dabei raus (ich hoffe das erscheint hier in der email richtig)
>> Ich habe mir den entsprechenden Eintrag in mysql angesehen
>> und es wird schon so falsch abgespeichert.
>> Wenn ich den Eintrag von Hand in der Tabelle ändere
>> wird er richtig aus der Datenbank gelesen und angezeigt,
>> er geht erst bei der nächsten Änderung wieder kaputt.
>> Das ist unter Windows und Linux der Fall.
>>
>> Und dann habe ich noch das Problem, daß ich Java unter
>> Linux noch nicht dazu überreden kann die SCIM Eingabemethoden
>> zu benutzen. Ich muss also erst in einen Texteditor schreiben und
>> dann in Deepamehta rüberkopieren. Wenn da jemand
>> Abhilfe weiss wäre ich auch ganz froh.
>>
>> Liebe Grüße
>> Torsten
>>
>>
>> <torsten.vcf>_______________________________________________
>> deepamehta-users mailing list
>> deepamehta-users at lists.berlios.de
>> https://lists.berlios.de/mailman/listinfo/deepamehta-users
> ------------------------------------------------------------------------
>
> _______________________________________________
> deepamehta-users mailing list
> deepamehta-users at lists.berlios.de
> https://lists.berlios.de/mailman/listinfo/deepamehta-users
>   


-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : torsten.vcf
Dateityp    : text/x-vcard
Dateigröße  : 148 bytes
Beschreibung: nicht verfügbar
URL         : <http://lists.deepamehta.de/mailman/private/users-lists.deepamehta.de/attachments/20080814/c5a375d2/attachment.vcf>


Mehr Informationen über die Mailingliste users