International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A3A2

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󣢀
E3880
󣢁
E3881
󣢂
E3882
󣢃
E3883
󣢄
E3884
󣢅
E3885
󣢆
E3886
󣢇
E3887
󣢈
E3888
󣢉
E3889
󣢊
E388A
󣢋
E388B
󣢌
E388C
󣢍
E388D
󣢎
E388E
󣢏
E388F
80
90
󣢐
E3890
󣢑
E3891
󣢒
E3892
󣢓
E3893
󣢔
E3894
󣢕
E3895
󣢖
E3896
󣢗
E3897
󣢘
E3898
󣢙
E3899
󣢚
E389A
󣢛
E389B
󣢜
E389C
󣢝
E389D
󣢞
E389E
󣢟
E389F
90
A0
󣢠
E38A0
󣢡
E38A1
󣢢
E38A2
󣢣
E38A3
󣢤
E38A4
󣢥
E38A5
󣢦
E38A6
󣢧
E38A7
󣢨
E38A8
󣢩
E38A9
󣢪
E38AA
󣢫
E38AB
󣢬
E38AC
󣢭
E38AD
󣢮
E38AE
󣢯
E38AF
A0
B0
󣢰
E38B0
󣢱
E38B1
󣢲
E38B2
󣢳
E38B3
󣢴
E38B4
󣢵
E38B5
󣢶
E38B6
󣢷
E38B7
󣢸
E38B8
󣢹
E38B9
󣢺
E38BA
󣢻
E38BB
󣢼
E38BC
󣢽
E38BD
󣢾
E38BE
󣢿
E38BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]