International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3B18E

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󱎀
F1380
󱎁
F1381
󱎂
F1382
󱎃
F1383
󱎄
F1384
󱎅
F1385
󱎆
F1386
󱎇
F1387
󱎈
F1388
󱎉
F1389
󱎊
F138A
󱎋
F138B
󱎌
F138C
󱎍
F138D
󱎎
F138E
󱎏
F138F
80
90
󱎐
F1390
󱎑
F1391
󱎒
F1392
󱎓
F1393
󱎔
F1394
󱎕
F1395
󱎖
F1396
󱎗
F1397
󱎘
F1398
󱎙
F1399
󱎚
F139A
󱎛
F139B
󱎜
F139C
󱎝
F139D
󱎞
F139E
󱎟
F139F
90
A0
󱎠
F13A0
󱎡
F13A1
󱎢
F13A2
󱎣
F13A3
󱎤
F13A4
󱎥
F13A5
󱎦
F13A6
󱎧
F13A7
󱎨
F13A8
󱎩
F13A9
󱎪
F13AA
󱎫
F13AB
󱎬
F13AC
󱎭
F13AD
󱎮
F13AE
󱎯
F13AF
A0
B0
󱎰
F13B0
󱎱
F13B1
󱎲
F13B2
󱎳
F13B3
󱎴
F13B4
󱎵
F13B5
󱎶
F13B6
󱎷
F13B7
󱎸
F13B8
󱎹
F13B9
󱎺
F13BA
󱎻
F13BB
󱎼
F13BC
󱎽
F13BD
󱎾
F13BE
󱎿
F13BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]