International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A38E

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󣎀
E3380
󣎁
E3381
󣎂
E3382
󣎃
E3383
󣎄
E3384
󣎅
E3385
󣎆
E3386
󣎇
E3387
󣎈
E3388
󣎉
E3389
󣎊
E338A
󣎋
E338B
󣎌
E338C
󣎍
E338D
󣎎
E338E
󣎏
E338F
80
90
󣎐
E3390
󣎑
E3391
󣎒
E3392
󣎓
E3393
󣎔
E3394
󣎕
E3395
󣎖
E3396
󣎗
E3397
󣎘
E3398
󣎙
E3399
󣎚
E339A
󣎛
E339B
󣎜
E339C
󣎝
E339D
󣎞
E339E
󣎟
E339F
90
A0
󣎠
E33A0
󣎡
E33A1
󣎢
E33A2
󣎣
E33A3
󣎤
E33A4
󣎥
E33A5
󣎦
E33A6
󣎧
E33A7
󣎨
E33A8
󣎩
E33A9
󣎪
E33AA
󣎫
E33AB
󣎬
E33AC
󣎭
E33AD
󣎮
E33AE
󣎯
E33AF
A0
B0
󣎰
E33B0
󣎱
E33B1
󣎲
E33B2
󣎳
E33B3
󣎴
E33B4
󣎵
E33B5
󣎶
E33B6
󣎷
E33B7
󣎸
E33B8
󣎹
E33B9
󣎺
E33BA
󣎻
E33BB
󣎼
E33BC
󣎽
E33BD
󣎾
E33BE
󣎿
E33BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]