International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A783

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󧃀
E70C0
󧃁
E70C1
󧃂
E70C2
󧃃
E70C3
󧃄
E70C4
󧃅
E70C5
󧃆
E70C6
󧃇
E70C7
󧃈
E70C8
󧃉
E70C9
󧃊
E70CA
󧃋
E70CB
󧃌
E70CC
󧃍
E70CD
󧃎
E70CE
󧃏
E70CF
80
90
󧃐
E70D0
󧃑
E70D1
󧃒
E70D2
󧃓
E70D3
󧃔
E70D4
󧃕
E70D5
󧃖
E70D6
󧃗
E70D7
󧃘
E70D8
󧃙
E70D9
󧃚
E70DA
󧃛
E70DB
󧃜
E70DC
󧃝
E70DD
󧃞
E70DE
󧃟
E70DF
90
A0
󧃠
E70E0
󧃡
E70E1
󧃢
E70E2
󧃣
E70E3
󧃤
E70E4
󧃥
E70E5
󧃦
E70E6
󧃧
E70E7
󧃨
E70E8
󧃩
E70E9
󧃪
E70EA
󧃫
E70EB
󧃬
E70EC
󧃭
E70ED
󧃮
E70EE
󧃯
E70EF
A0
B0
󧃰
E70F0
󧃱
E70F1
󧃲
E70F2
󧃳
E70F3
󧃴
E70F4
󧃵
E70F5
󧃶
E70F6
󧃷
E70F7
󧃸
E70F8
󧃹
E70F9
󧃺
E70FA
󧃻
E70FB
󧃼
E70FC
󧃽
E70FD
󧃾
E70FE
󧃿
E70FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]