[deepamehta-users] utf-8 Probleme
Jörg Richter
jri at deepamehta.de
Fr Aug 8 03:13:05 CEST 2008
Lieber Torsten,
Ja, ich kann Dein Problem nachvollziehen. Inzwischen habe ich den
Fehler gefunden. In einer Konfigurationsdatei fehlt ein Parameter.
Um den Fehler zu beheben, editiere die Datei
"install/config/dm-mysql5.properties": füge an die Property "db.url"
hinten den Parameter "characterEncoding=utf8" an. Die komplette Zeile
lautet also:
db.url =
jdbc:mysql://${db.host}/${db.name}?
useUnicode=true&characterEncoding=utf8
Beim Neustart von DeepaMehta solltest Du im Log jetzt die komplettierte
URL sehen;
> [java] Using Database
> [java] Type : mysql5
> [java] URL :
> jdbc:mysql://127.0.0.1/DeepaMehta?
> useUnicode=true&characterEncoding=utf8
> [java] Driver : org.gjt.mm.mysql.Driver
Jetzt korrigiere in DeepaMehta die korrupten Topic-Namen von Hand. Von
nun an sollte alles korrekt funktionieren.
Zu den SCIM-Eingabemethoden: davon hatte ich bisher noch nicht gehört.
Ich nehme an, daß diese von Sun in das JDK/Linux integriert werden
müssten, die DeepaMehta-Entwickler da möglicherweise wenig ausrichten
können. Eine Google-Suche nach "SCIM Java" zeigt, daß das ein "Thema"
ist.
Hintergrund zum UTF-Problem: dank Deines Hinweises, und durch
detaillierte Tests habe ich herausgefunden, daß für MySQL 4 und MySQL 5
die UTF-Datenablage garnicht funktioniert, sondern Latin1 benutzt wird.
Daß wir das jetzt erst bemerken, liegt auch daran, daß wir uns bisher
nicht mit chinesischer Umschrift befasst haben :-)
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : pastedGraphic2.tiff
Dateityp : image/tiff
Dateigröße : 16562 bytes
Beschreibung: nicht verfügbar
URL : <http://lists.deepamehta.de/mailman/private/users-lists.deepamehta.de/attachments/20080808/cff5699b/attachment.tiff>
-------------- nächster Teil --------------
Auf dem Screenshot kann man sehen, daß Latin1-Zeichen, z.B. Üäüéè,
korrekt abgelegt werden, UTF-Zeichen, z.B. ??, hingegen nicht. Daß die
UTF-Zeichen im Feld "Description" allerdings richtig erscheinen, liegt
daran, daß dies ein "Text Editor"-Feld ist, wo HTML hinterliegt, und
die UTF-Zeichen dort als Entities kodiert werden (z.B. ǒ). Das
Feld "Name" hingegen ist ein reines (vormals Latin1-kodiertes)
Text-Feld.
In HSQL tritt der Fehler nicht auf. Dort funktioniert die UTF-Kodierung.
Vielen Dank für das Feedback!
Grüße
Jörg
On 01.08.2008, at 23:12, Torsten Ziegler wrote:
> Hallo Jörg und Co.,
>
> mir sind gerade Zeichensatz Probleme aufgefallen.
> Und zwar arbeite ich mit pinyin zum schreiben von
> chinesischen Zeichen und wenn ich ein Topic zum
> Beispiel:
> Sh?u Y?n Fèi J?ng
> nenne wird es nach der Eingabe noch richtig in
> der Map angezeigt, sobald es aber aus der Datenbank
> (derzeit mysql5) gelesen wird kommt:
> Sh?u Y?n Fèi J?ng
> dabei raus (ich hoffe das erscheint hier in der email richtig)
> Ich habe mir den entsprechenden Eintrag in mysql angesehen
> und es wird schon so falsch abgespeichert.
> Wenn ich den Eintrag von Hand in der Tabelle ändere
> wird er richtig aus der Datenbank gelesen und angezeigt,
> er geht erst bei der nächsten Änderung wieder kaputt.
> Das ist unter Windows und Linux der Fall.
>
> Und dann habe ich noch das Problem, daß ich Java unter
> Linux noch nicht dazu überreden kann die SCIM Eingabemethoden
> zu benutzen. Ich muss also erst in einen Texteditor schreiben und
> dann in Deepamehta rüberkopieren. Wenn da jemand
> Abhilfe weiss wäre ich auch ganz froh.
>
> Liebe Grüße
> Torsten
>
>
> <torsten.vcf>_______________________________________________
> deepamehta-users mailing list
> deepamehta-users at lists.berlios.de
> https://lists.berlios.de/mailman/listinfo/deepamehta-users
Mehr Informationen über die Mailingliste users