Datenbank Kollation, PHP Version

06/29/2015 19:11 Masterkroko1#1
Moin,

gehört es hier rein? Ist ja eig. etwas allgemeines naja ich versuche es mal.

Da ich derzeit mein neues Projekt plane wollte ich mich mal erkunden welche Kollation ihr empfehlt.

In meinem Webprojekt sollte es möglich sein Japanische Zeichen zu schreiben sowie die Deutschen Umlaute.

Was brauch ich? Welches sollte man nehmen wenn man an die Zukunft denkt?
Was lohnt sich? UTF8 UTF16 UTF32? noch was ganz anders?




Welche PHP-Version sollte genommen werden?
PHP 7 ist leider noch im "Alpha" Status kann man diesen dennoch ohne Probleme verwenden?
Wenn nicht dann PHP 5.5 oder PHP 5.6? Wieso werden beiden Versionen gleichzeitig Released? ([Only registered and activated users can see links. Click Here To Register...])



Joar ein paar Fragen ich hoffe mir kann wer dabei ein guten Rat zukommen lassen.

Mfg
Masterkroko
06/29/2015 19:36 Else#2
PHP 5.6.x - Eine neue Version bringt schließlich nicht nur neue Features, sondern auch verbesserungen. UTF-8:

Quote:
UTF-8: Die Codierungsform der Wahl [Only registered and activated users can see links. Click Here To Register...]

UTF-8 nutzt Codiereinheiten, die 8 Bit = 1 Byte groß sind. Genau wie bei UTF-16 ist der Gesamtbereich der Unicode-Zeichen mit nur einem Byte nicht abzudecken, also werden bei Bedarf mehrere Bytes zusammengefasst, um einen Codepoint zu codieren.
06/29/2015 20:06 Masterkroko1#3
Dann Frag ich mich wieso 5.5 & 5.6 beide erweitert werden (auch wenn es wahrscheinlich bei 5.5 nur Bugs sind). Da können die doch eig. 5.5 auf der Strecke liegen lassen und nur 5.6 updaten. Nur weil es manche Firmen schaffen ihren Code so zu schreiben das sie "Angst" haben einen größeren Sprung zu wagen? ...

Kann man mit PHP 7 auch schon was anfangen ? (Projekt wird eh noch ne Zeit dauern)
Oder sollte man dort noch die Finger von lassen bis Alpha Phase abgeschlossen ist?


Also kann ich mit UTF-8 Japanische Zeichen darstellen?
und UTF-16 / UTF-32 sind überflüssig?
06/30/2015 02:35 #[Alex]Sascha#4
Quote:
Originally Posted by Masterkroko1 View Post
Also kann ich mit UTF-8 Japanische Zeichen darstellen?
Ja, da Utf-8 eine variable länge von 1-4 bytes pro Zeichen hat d.h also 1.114.112 Möglichkeiten.
So hat ein ASCII Zeichen eine größe von 1 byte.Umlaute, soweit ich mich erinnere, nutzen 2 bytes.
06/30/2015 09:00 Ih¢sãs123#5
Bei php7 sollte man auf den offiziellen Release warten.
06/30/2015 11:03 warfley#6
Umlaute gehören schon zum Ansi codec sind also in der range 0..255. Japanische Zeichen (da japanisch eine nicht so sehr unwichtige Sprache ist) müsste schon mit 2 Byte abgedeckt werden. Da UTF-8 bis zu 4 Byte unterstützt sind diese auf jeden Fall enthalten.

Gedanken solltest du dir nur bei sehr exotischen Zeichen machen, so die wichtigsten Sprachen (deutsch, englisch, japanisch, spanisch, etc) sind alle mit widestrings (1 Word pro Zeichen) abgedeckt. Die ganzen europäischen schon mit nur ansi also 1 Byte pro Charakter
06/30/2015 19:14 Masterkroko1#7
Gut dann wird UTF-8 & PHP 5.6 genommen