International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29A98

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򚘀
9A600
򚘁
9A601
򚘂
9A602
򚘃
9A603
򚘄
9A604
򚘅
9A605
򚘆
9A606
򚘇
9A607
򚘈
9A608
򚘉
9A609
򚘊
9A60A
򚘋
9A60B
򚘌
9A60C
򚘍
9A60D
򚘎
9A60E
򚘏
9A60F
80
90
򚘐
9A610
򚘑
9A611
򚘒
9A612
򚘓
9A613
򚘔
9A614
򚘕
9A615
򚘖
9A616
򚘗
9A617
򚘘
9A618
򚘙
9A619
򚘚
9A61A
򚘛
9A61B
򚘜
9A61C
򚘝
9A61D
򚘞
9A61E
򚘟
9A61F
90
A0
򚘠
9A620
򚘡
9A621
򚘢
9A622
򚘣
9A623
򚘤
9A624
򚘥
9A625
򚘦
9A626
򚘧
9A627
򚘨
9A628
򚘩
9A629
򚘪
9A62A
򚘫
9A62B
򚘬
9A62C
򚘭
9A62D
򚘮
9A62E
򚘯
9A62F
A0
B0
򚘰
9A630
򚘱
9A631
򚘲
9A632
򚘳
9A633
򚘴
9A634
򚘵
9A635
򚘶
9A636
򚘷
9A637
򚘸
9A638
򚘹
9A639
򚘺
9A63A
򚘻
9A63B
򚘼
9A63C
򚘽
9A63D
򚘾
9A63E
򚘿
9A63F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]