International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A28B

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󢋀
E22C0
󢋁
E22C1
󢋂
E22C2
󢋃
E22C3
󢋄
E22C4
󢋅
E22C5
󢋆
E22C6
󢋇
E22C7
󢋈
E22C8
󢋉
E22C9
󢋊
E22CA
󢋋
E22CB
󢋌
E22CC
󢋍
E22CD
󢋎
E22CE
󢋏
E22CF
80
90
󢋐
E22D0
󢋑
E22D1
󢋒
E22D2
󢋓
E22D3
󢋔
E22D4
󢋕
E22D5
󢋖
E22D6
󢋗
E22D7
󢋘
E22D8
󢋙
E22D9
󢋚
E22DA
󢋛
E22DB
󢋜
E22DC
󢋝
E22DD
󢋞
E22DE
󢋟
E22DF
90
A0
󢋠
E22E0
󢋡
E22E1
󢋢
E22E2
󢋣
E22E3
󢋤
E22E4
󢋥
E22E5
󢋦
E22E6
󢋧
E22E7
󢋨
E22E8
󢋩
E22E9
󢋪
E22EA
󢋫
E22EB
󢋬
E22EC
󢋭
E22ED
󢋮
E22EE
󢋯
E22EF
A0
B0
󢋰
E22F0
󢋱
E22F1
󢋲
E22F2
󢋳
E22F3
󢋴
E22F4
󢋵
E22F5
󢋶
E22F6
󢋷
E22F7
󢋸
E22F8
󢋹
E22F9
󢋺
E22FA
󢋻
E22FB
󢋼
E22FC
󢋽
E22FD
󢋾
E22FE
󢋿
E22FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]