International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A188

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡈀
E1200
󡈁
E1201
󡈂
E1202
󡈃
E1203
󡈄
E1204
󡈅
E1205
󡈆
E1206
󡈇
E1207
󡈈
E1208
󡈉
E1209
󡈊
E120A
󡈋
E120B
󡈌
E120C
󡈍
E120D
󡈎
E120E
󡈏
E120F
80
90
󡈐
E1210
󡈑
E1211
󡈒
E1212
󡈓
E1213
󡈔
E1214
󡈕
E1215
󡈖
E1216
󡈗
E1217
󡈘
E1218
󡈙
E1219
󡈚
E121A
󡈛
E121B
󡈜
E121C
󡈝
E121D
󡈞
E121E
󡈟
E121F
90
A0
󡈠
E1220
󡈡
E1221
󡈢
E1222
󡈣
E1223
󡈤
E1224
󡈥
E1225
󡈦
E1226
󡈧
E1227
󡈨
E1228
󡈩
E1229
󡈪
E122A
󡈫
E122B
󡈬
E122C
󡈭
E122D
󡈮
E122E
󡈯
E122F
A0
B0
󡈰
E1230
󡈱
E1231
󡈲
E1232
󡈳
E1233
󡈴
E1234
󡈵
E1235
󡈶
E1236
󡈷
E1237
󡈸
E1238
󡈹
E1239
󡈺
E123A
󡈻
E123B
󡈼
E123C
󡈽
E123D
󡈾
E123E
󡈿
E123F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]