エニグマダッシュのUnicode情報

#Tech

エニグマダッシュのUnicode情報 エニグマダッシュ Unico

Unicode 6.1で定義されたエニグマダッシュ(Three-Em Dash)は、サプリメンタル句読点ブロックに属する文字です。

文字コードはU+2E3Bで、HTMLエンティティは⸻⸻と表現されます。

UTF-8では0xE2 0xB8 0xBB、UTF-16では0x2E3B、UTF-32では0x00002E3Bとしてエンコードされます。

この文字は、句読点(Pd)として分類され、双方向性クラスはOther Neutral (ON)です。

Unicodeの規格情報から、特定の記号「Three-Em Dash」(三点ダッシュ)に関する詳細なデータが公開されました。この記号は、文章中で区切りや強調を示すために使われる句読点の一つです。本記事では、この記号の技術的な背景や、なぜこのような詳細な情報が公開されるのかを解説します。

記号の技術的詳細

この「Three-Em Dash」は、Unicodeバージョン6.1(2012年1月)で正式に定義された文字です。Unicodeは、世界中のあらゆる言語や記号をデジタル上で統一的に表現するための国際標準規格です。この記号は「Supplemental Punctuation」(補足句読点)ブロックに分類されています。

その技術的な識別子(U+2E3B)や、HTMLエンティティ(⸻)といった情報が、デジタルシステムがこの記号を正確に認識し、表示するために不可欠な要素となっています。

Unicodeの役割と重要性

Unicodeの最大の役割は、文字コードの国際的な統一です。もし各システムが独自の文字コードを使用していた場合、異なる環境間で文字化けが発生する問題が生じます。例えば、日本語の「あ」と英語の

原文の冒頭を表示(英語・3段落のみ)

Name:Three-Em Dash[1]Unicode Version:6.1 (January 2012)[2]Block:Supplemental Punctuation, U+2E00 - U+2E7F[3]Plane:Basic Multilingual Plane, U+0000 - U+FFFF[3]Script:Code for undetermined script (Zyyy) [4]Category:Dash Punctuation (Pd) [1]Bidirectional Class:Other Neutral (ON) [1]Combining Class:Not Reordered (0) [1]Character is Mirrored:No [1]HTML Entity:⸻⸻UTF-8 Encoding:0xE2 0xB8 0xBBUTF-16 Encoding:0x2E3BUTF-32 Encoding:0x00002E3B

※ 著作権に配慮し、引用は冒頭3段落までです。続きは元記事をご覧ください。

元記事を読む ↗