International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A283

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󢃀
E20C0
󢃁
E20C1
󢃂
E20C2
󢃃
E20C3
󢃄
E20C4
󢃅
E20C5
󢃆
E20C6
󢃇
E20C7
󢃈
E20C8
󢃉
E20C9
󢃊
E20CA
󢃋
E20CB
󢃌
E20CC
󢃍
E20CD
󢃎
E20CE
󢃏
E20CF
80
90
󢃐
E20D0
󢃑
E20D1
󢃒
E20D2
󢃓
E20D3
󢃔
E20D4
󢃕
E20D5
󢃖
E20D6
󢃗
E20D7
󢃘
E20D8
󢃙
E20D9
󢃚
E20DA
󢃛
E20DB
󢃜
E20DC
󢃝
E20DD
󢃞
E20DE
󢃟
E20DF
90
A0
󢃠
E20E0
󢃡
E20E1
󢃢
E20E2
󢃣
E20E3
󢃤
E20E4
󢃥
E20E5
󢃦
E20E6
󢃧
E20E7
󢃨
E20E8
󢃩
E20E9
󢃪
E20EA
󢃫
E20EB
󢃬
E20EC
󢃭
E20ED
󢃮
E20EE
󢃯
E20EF
A0
B0
󢃰
E20F0
󢃱
E20F1
󢃲
E20F2
󢃳
E20F3
󢃴
E20F4
󢃵
E20F5
󢃶
E20F6
󢃷
E20F7
󢃸
E20F8
󢃹
E20F9
󢃺
E20FA
󢃻
E20FB
󢃼
E20FC
󢃽
E20FD
󢃾
E20FE
󢃿
E20FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]