International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F48EAA

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
􎪀
10EA80
􎪁
10EA81
􎪂
10EA82
􎪃
10EA83
􎪄
10EA84
􎪅
10EA85
􎪆
10EA86
􎪇
10EA87
􎪈
10EA88
􎪉
10EA89
􎪊
10EA8A
􎪋
10EA8B
􎪌
10EA8C
􎪍
10EA8D
􎪎
10EA8E
􎪏
10EA8F
80
90
􎪐
10EA90
􎪑
10EA91
􎪒
10EA92
􎪓
10EA93
􎪔
10EA94
􎪕
10EA95
􎪖
10EA96
􎪗
10EA97
􎪘
10EA98
􎪙
10EA99
􎪚
10EA9A
􎪛
10EA9B
􎪜
10EA9C
􎪝
10EA9D
􎪞
10EA9E
􎪟
10EA9F
90
A0
􎪠
10EAA0
􎪡
10EAA1
􎪢
10EAA2
􎪣
10EAA3
􎪤
10EAA4
􎪥
10EAA5
􎪦
10EAA6
􎪧
10EAA7
􎪨
10EAA8
􎪩
10EAA9
􎪪
10EAAA
􎪫
10EAAB
􎪬
10EAAC
􎪭
10EAAD
􎪮
10EAAE
􎪯
10EAAF
A0
B0
􎪰
10EAB0
􎪱
10EAB1
􎪲
10EAB2
􎪳
10EAB3
􎪴
10EAB4
􎪵
10EAB5
􎪶
10EAB6
􎪷
10EAB7
􎪸
10EAB8
􎪹
10EAB9
􎪺
10EABA
􎪻
10EABB
􎪼
10EABC
􎪽
10EABD
􎪾
10EABE
􎪿
10EABF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]