International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A38D

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󣍀
E3340
󣍁
E3341
󣍂
E3342
󣍃
E3343
󣍄
E3344
󣍅
E3345
󣍆
E3346
󣍇
E3347
󣍈
E3348
󣍉
E3349
󣍊
E334A
󣍋
E334B
󣍌
E334C
󣍍
E334D
󣍎
E334E
󣍏
E334F
80
90
󣍐
E3350
󣍑
E3351
󣍒
E3352
󣍓
E3353
󣍔
E3354
󣍕
E3355
󣍖
E3356
󣍗
E3357
󣍘
E3358
󣍙
E3359
󣍚
E335A
󣍛
E335B
󣍜
E335C
󣍝
E335D
󣍞
E335E
󣍟
E335F
90
A0
󣍠
E3360
󣍡
E3361
󣍢
E3362
󣍣
E3363
󣍤
E3364
󣍥
E3365
󣍦
E3366
󣍧
E3367
󣍨
E3368
󣍩
E3369
󣍪
E336A
󣍫
E336B
󣍬
E336C
󣍭
E336D
󣍮
E336E
󣍯
E336F
A0
B0
󣍰
E3370
󣍱
E3371
󣍲
E3372
󣍳
E3373
󣍴
E3374
󣍵
E3375
󣍶
E3376
󣍷
E3377
󣍸
E3378
󣍹
E3379
󣍺
E337A
󣍻
E337B
󣍼
E337C
󣍽
E337D
󣍾
E337E
󣍿
E337F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]