[deepamehta-users] utf-8 Probleme

Jörg Richter jri at deepamehta.de
Fr Aug 8 03:13:05 CEST 2008


Lieber Torsten,

Ja, ich kann Dein Problem nachvollziehen. Inzwischen habe ich den  
Fehler gefunden. In einer Konfigurationsdatei fehlt ein Parameter.

Um den Fehler zu beheben, editiere die Datei  
"install/config/dm-mysql5.properties": füge an die Property "db.url"  
hinten den Parameter "characterEncoding=utf8" an. Die komplette Zeile  
lautet also:

db.url =  
jdbc:mysql://${db.host}/${db.name}? 
useUnicode=true&characterEncoding=utf8

Beim Neustart von DeepaMehta solltest Du im Log jetzt die komplettierte  
URL sehen;

>  [java] Using Database
>  [java]   Type : mysql5
>  [java]   URL :  
> jdbc:mysql://127.0.0.1/DeepaMehta? 
> useUnicode=true&characterEncoding=utf8
>  [java]   Driver : org.gjt.mm.mysql.Driver

Jetzt korrigiere in DeepaMehta die korrupten Topic-Namen von Hand. Von  
nun an sollte alles korrekt funktionieren.

Zu den SCIM-Eingabemethoden: davon hatte ich bisher noch nicht gehört.  
Ich nehme an, daß diese von Sun in das JDK/Linux integriert werden  
müssten, die DeepaMehta-Entwickler da möglicherweise wenig ausrichten  
können. Eine Google-Suche nach "SCIM Java" zeigt, daß das ein "Thema"  
ist.

Hintergrund zum UTF-Problem: dank Deines Hinweises, und durch  
detaillierte Tests habe ich herausgefunden, daß für MySQL 4 und MySQL 5  
die UTF-Datenablage garnicht funktioniert, sondern Latin1 benutzt wird.  
Daß wir das jetzt erst bemerken, liegt auch daran, daß wir uns bisher  
nicht mit chinesischer Umschrift befasst haben :-)

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : pastedGraphic2.tiff
Dateityp    : image/tiff
Dateigröße  : 16562 bytes
Beschreibung: nicht verfügbar
URL         : <http://lists.deepamehta.de/mailman/private/users-lists.deepamehta.de/attachments/20080808/cff5699b/attachment.tiff>
-------------- nächster Teil --------------


Auf dem Screenshot kann man sehen, daß Latin1-Zeichen, z.B. Üäüéè, 
korrekt abgelegt werden, UTF-Zeichen, z.B. ??, hingegen nicht. Daß die 
UTF-Zeichen im Feld "Description" allerdings richtig erscheinen, liegt 
daran, daß dies ein "Text Editor"-Feld ist, wo HTML hinterliegt, und 
die UTF-Zeichen dort als Entities kodiert werden (z.B. ǒ). Das 
Feld "Name" hingegen ist ein reines (vormals Latin1-kodiertes) 
Text-Feld.

In HSQL tritt der Fehler nicht auf. Dort funktioniert die UTF-Kodierung.

Vielen Dank für das Feedback!

Grüße
Jörg


On 01.08.2008, at 23:12, Torsten Ziegler wrote:

> Hallo Jörg und Co.,
>
> mir sind gerade Zeichensatz Probleme aufgefallen.
> Und zwar arbeite ich mit pinyin zum schreiben von
> chinesischen Zeichen und wenn ich ein Topic zum
> Beispiel:
> Sh?u Y?n Fèi J?ng
> nenne wird es nach der Eingabe noch richtig in
> der Map angezeigt, sobald es aber aus der Datenbank
> (derzeit mysql5) gelesen wird kommt:
> Sh?u Y?n Fèi J?ng
> dabei raus (ich hoffe das erscheint hier in der email richtig)
> Ich habe mir den entsprechenden Eintrag in mysql angesehen
> und es wird schon so falsch abgespeichert.
> Wenn ich den Eintrag von Hand in der Tabelle ändere
> wird er richtig aus der Datenbank gelesen und angezeigt,
> er geht erst bei der nächsten Änderung wieder kaputt.
> Das ist unter Windows und Linux der Fall.
>
> Und dann habe ich noch das Problem, daß ich Java unter
> Linux noch nicht dazu überreden kann die SCIM Eingabemethoden
> zu benutzen. Ich muss also erst in einen Texteditor schreiben und
> dann in Deepamehta rüberkopieren. Wenn da jemand
> Abhilfe weiss wäre ich auch ganz froh.
>
> Liebe Grüße
> Torsten
>
>
> <torsten.vcf>_______________________________________________
> deepamehta-users mailing list
> deepamehta-users at lists.berlios.de
> https://lists.berlios.de/mailman/listinfo/deepamehta-users


Mehr Informationen über die Mailingliste users