International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A381

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󣁀
E3040
󣁁
E3041
󣁂
E3042
󣁃
E3043
󣁄
E3044
󣁅
E3045
󣁆
E3046
󣁇
E3047
󣁈
E3048
󣁉
E3049
󣁊
E304A
󣁋
E304B
󣁌
E304C
󣁍
E304D
󣁎
E304E
󣁏
E304F
80
90
󣁐
E3050
󣁑
E3051
󣁒
E3052
󣁓
E3053
󣁔
E3054
󣁕
E3055
󣁖
E3056
󣁗
E3057
󣁘
E3058
󣁙
E3059
󣁚
E305A
󣁛
E305B
󣁜
E305C
󣁝
E305D
󣁞
E305E
󣁟
E305F
90
A0
󣁠
E3060
󣁡
E3061
󣁢
E3062
󣁣
E3063
󣁤
E3064
󣁥
E3065
󣁦
E3066
󣁧
E3067
󣁨
E3068
󣁩
E3069
󣁪
E306A
󣁫
E306B
󣁬
E306C
󣁭
E306D
󣁮
E306E
󣁯
E306F
A0
B0
󣁰
E3070
󣁱
E3071
󣁲
E3072
󣁳
E3073
󣁴
E3074
󣁵
E3075
󣁶
E3076
󣁷
E3077
󣁸
E3078
󣁹
E3079
󣁺
E307A
󣁻
E307B
󣁼
E307C
󣁽
E307D
󣁾
E307E
󣁿
E307F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]