International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F39183

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑃀
D10C0
󑃁
D10C1
󑃂
D10C2
󑃃
D10C3
󑃄
D10C4
󑃅
D10C5
󑃆
D10C6
󑃇
D10C7
󑃈
D10C8
󑃉
D10C9
󑃊
D10CA
󑃋
D10CB
󑃌
D10CC
󑃍
D10CD
󑃎
D10CE
󑃏
D10CF
80
90
󑃐
D10D0
󑃑
D10D1
󑃒
D10D2
󑃓
D10D3
󑃔
D10D4
󑃕
D10D5
󑃖
D10D6
󑃗
D10D7
󑃘
D10D8
󑃙
D10D9
󑃚
D10DA
󑃛
D10DB
󑃜
D10DC
󑃝
D10DD
󑃞
D10DE
󑃟
D10DF
90
A0
󑃠
D10E0
󑃡
D10E1
󑃢
D10E2
󑃣
D10E3
󑃤
D10E4
󑃥
D10E5
󑃦
D10E6
󑃧
D10E7
󑃨
D10E8
󑃩
D10E9
󑃪
D10EA
󑃫
D10EB
󑃬
D10EC
󑃭
D10ED
󑃮
D10EE
󑃯
D10EF
A0
B0
󑃰
D10F0
󑃱
D10F1
󑃲
D10F2
󑃳
D10F3
󑃴
D10F4
󑃵
D10F5
󑃶
D10F6
󑃷
D10F7
󑃸
D10F8
󑃹
D10F9
󑃺
D10FA
󑃻
D10FB
󑃼
D10FC
󑃽
D10FD
󑃾
D10FE
󑃿
D10FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]