International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29E8E

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򞎀
9E380
򞎁
9E381
򞎂
9E382
򞎃
9E383
򞎄
9E384
򞎅
9E385
򞎆
9E386
򞎇
9E387
򞎈
9E388
򞎉
9E389
򞎊
9E38A
򞎋
9E38B
򞎌
9E38C
򞎍
9E38D
򞎎
9E38E
򞎏
9E38F
80
90
򞎐
9E390
򞎑
9E391
򞎒
9E392
򞎓
9E393
򞎔
9E394
򞎕
9E395
򞎖
9E396
򞎗
9E397
򞎘
9E398
򞎙
9E399
򞎚
9E39A
򞎛
9E39B
򞎜
9E39C
򞎝
9E39D
򞎞
9E39E
򞎟
9E39F
90
A0
򞎠
9E3A0
򞎡
9E3A1
򞎢
9E3A2
򞎣
9E3A3
򞎤
9E3A4
򞎥
9E3A5
򞎦
9E3A6
򞎧
9E3A7
򞎨
9E3A8
򞎩
9E3A9
򞎪
9E3AA
򞎫
9E3AB
򞎬
9E3AC
򞎭
9E3AD
򞎮
9E3AE
򞎯
9E3AF
A0
B0
򞎰
9E3B0
򞎱
9E3B1
򞎲
9E3B2
򞎳
9E3B3
򞎴
9E3B4
򞎵
9E3B5
򞎶
9E3B6
򞎷
9E3B7
򞎸
9E3B8
򞎹
9E3B9
򞎺
9E3BA
򞎻
9E3BB
򞎼
9E3BC
򞎽
9E3BD
򞎾
9E3BE
򞎿
9E3BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]