International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A383

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󣃀
E30C0
󣃁
E30C1
󣃂
E30C2
󣃃
E30C3
󣃄
E30C4
󣃅
E30C5
󣃆
E30C6
󣃇
E30C7
󣃈
E30C8
󣃉
E30C9
󣃊
E30CA
󣃋
E30CB
󣃌
E30CC
󣃍
E30CD
󣃎
E30CE
󣃏
E30CF
80
90
󣃐
E30D0
󣃑
E30D1
󣃒
E30D2
󣃓
E30D3
󣃔
E30D4
󣃕
E30D5
󣃖
E30D6
󣃗
E30D7
󣃘
E30D8
󣃙
E30D9
󣃚
E30DA
󣃛
E30DB
󣃜
E30DC
󣃝
E30DD
󣃞
E30DE
󣃟
E30DF
90
A0
󣃠
E30E0
󣃡
E30E1
󣃢
E30E2
󣃣
E30E3
󣃤
E30E4
󣃥
E30E5
󣃦
E30E6
󣃧
E30E7
󣃨
E30E8
󣃩
E30E9
󣃪
E30EA
󣃫
E30EB
󣃬
E30EC
󣃭
E30ED
󣃮
E30EE
󣃯
E30EF
A0
B0
󣃰
E30F0
󣃱
E30F1
󣃲
E30F2
󣃳
E30F3
󣃴
E30F4
󣃵
E30F5
󣃶
E30F6
󣃷
E30F7
󣃸
E30F8
󣃹
E30F9
󣃺
E30FA
󣃻
E30FB
󣃼
E30FC
󣃽
E30FD
󣃾
E30FE
󣃿
E30FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]