Frage Warum enthält der Block Unicode Superscripts und Subscripts keine einfachen Sequenzen aller Buchstaben?


Die Anordnung der Zeichen, die als Super- / Subscript-Buchstaben verwendet werden können, erscheint völlig chaotisch. Die meisten von ihnen sind offensichtlich nicht soll als sup / subscr verwendet werden. Briefe, aber auch solche, die keine sehr vernünftige Ordnung andeuten. In Unicode 6.0 gibt es nun endlich eine alphabetisch geordnete Teilmenge der tiefgestellten Buchstaben ht in U + 2095 bis U + 209C, die aber offensichtlich in den verbleibenden Platz im Block eingequetscht wurde und weniger als 1/3 aller Buchstaben umfasst .

Warum hat das Konsortium nicht einfach genug Platz für mindestens ein sup und ein tiefgestelltes Alphabet in Kleinbuchstaben reserviert?


6
2017-07-10 00:48


Ursprung


Antworten:


Die Desorganisation in der Anordnung dieser Zeichen besteht darin, dass sie Stück für Stück codiert wurden, da Skripte, die sie verwendeten, codiert waren, und als Round-Trip-Kompatibilität mit anderen Zeichensätzen hinzugefügt wurde. Kapitel 15 Der Unicode - Standard hat einige Diskussionen über ihre Herkunft: zum Beispiel waren die hochgestellten Ziffern 1 bis 3 in ISO Latin-1 während die anderen wurden codiert, um die zu unterstützen MARC-8 bibliographischer Zeichensatz (Siehe Tabelle hier); und U + 2071 SUPERSCRIPT LATIN KLEINER BUCHSTABE I und U + 207F SUPERSCRIPT LATIN KLEINER BUCHSTABE N wurden kodiert, um die Uralisch phonetisches Alphabet.

Das Unicode-Konsortium hat die allgemeine Regel, Zeichen nicht zu codieren, es sei denn, es gibt Hinweise darauf, dass Personen die Zeichen verwenden, um semantische Unterscheidungen zu treffen, die eine Codierung erfordern. So werden Zeichen nicht nur codiert, um das Set zu vervollständigen oder um die Dinge ordentlich aussehen zu lassen.


6
2017-07-10 01:09