International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F391AA

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑪀
D1A80
󑪁
D1A81
󑪂
D1A82
󑪃
D1A83
󑪄
D1A84
󑪅
D1A85
󑪆
D1A86
󑪇
D1A87
󑪈
D1A88
󑪉
D1A89
󑪊
D1A8A
󑪋
D1A8B
󑪌
D1A8C
󑪍
D1A8D
󑪎
D1A8E
󑪏
D1A8F
80
90
󑪐
D1A90
󑪑
D1A91
󑪒
D1A92
󑪓
D1A93
󑪔
D1A94
󑪕
D1A95
󑪖
D1A96
󑪗
D1A97
󑪘
D1A98
󑪙
D1A99
󑪚
D1A9A
󑪛
D1A9B
󑪜
D1A9C
󑪝
D1A9D
󑪞
D1A9E
󑪟
D1A9F
90
A0
󑪠
D1AA0
󑪡
D1AA1
󑪢
D1AA2
󑪣
D1AA3
󑪤
D1AA4
󑪥
D1AA5
󑪦
D1AA6
󑪧
D1AA7
󑪨
D1AA8
󑪩
D1AA9
󑪪
D1AAA
󑪫
D1AAB
󑪬
D1AAC
󑪭
D1AAD
󑪮
D1AAE
󑪯
D1AAF
A0
B0
󑪰
D1AB0
󑪱
D1AB1
󑪲
D1AB2
󑪳
D1AB3
󑪴
D1AB4
󑪵
D1AB5
󑪶
D1AB6
󑪷
D1AB7
󑪸
D1AB8
󑪹
D1AB9
󑪺
D1ABA
󑪻
D1ABB
󑪼
D1ABC
󑪽
D1ABD
󑪾
D1ABE
󑪿
D1ABF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]