International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A193

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡓀
E14C0
󡓁
E14C1
󡓂
E14C2
󡓃
E14C3
󡓄
E14C4
󡓅
E14C5
󡓆
E14C6
󡓇
E14C7
󡓈
E14C8
󡓉
E14C9
󡓊
E14CA
󡓋
E14CB
󡓌
E14CC
󡓍
E14CD
󡓎
E14CE
󡓏
E14CF
80
90
󡓐
E14D0
󡓑
E14D1
󡓒
E14D2
󡓓
E14D3
󡓔
E14D4
󡓕
E14D5
󡓖
E14D6
󡓗
E14D7
󡓘
E14D8
󡓙
E14D9
󡓚
E14DA
󡓛
E14DB
󡓜
E14DC
󡓝
E14DD
󡓞
E14DE
󡓟
E14DF
90
A0
󡓠
E14E0
󡓡
E14E1
󡓢
E14E2
󡓣
E14E3
󡓤
E14E4
󡓥
E14E5
󡓦
E14E6
󡓧
E14E7
󡓨
E14E8
󡓩
E14E9
󡓪
E14EA
󡓫
E14EB
󡓬
E14EC
󡓭
E14ED
󡓮
E14EE
󡓯
E14EF
A0
B0
󡓰
E14F0
󡓱
E14F1
󡓲
E14F2
󡓳
E14F3
󡓴
E14F4
󡓵
E14F5
󡓶
E14F6
󡓷
E14F7
󡓸
E14F8
󡓹
E14F9
󡓺
E14FA
󡓻
E14FB
󡓼
E14FC
󡓽
E14FD
󡓾
E14FE
󡓿
E14FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]