International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3B19C

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󱜀
F1700
󱜁
F1701
󱜂
F1702
󱜃
F1703
󱜄
F1704
󱜅
F1705
󱜆
F1706
󱜇
F1707
󱜈
F1708
󱜉
F1709
󱜊
F170A
󱜋
F170B
󱜌
F170C
󱜍
F170D
󱜎
F170E
󱜏
F170F
80
90
󱜐
F1710
󱜑
F1711
󱜒
F1712
󱜓
F1713
󱜔
F1714
󱜕
F1715
󱜖
F1716
󱜗
F1717
󱜘
F1718
󱜙
F1719
󱜚
F171A
󱜛
F171B
󱜜
F171C
󱜝
F171D
󱜞
F171E
󱜟
F171F
90
A0
󱜠
F1720
󱜡
F1721
󱜢
F1722
󱜣
F1723
󱜤
F1724
󱜥
F1725
󱜦
F1726
󱜧
F1727
󱜨
F1728
󱜩
F1729
󱜪
F172A
󱜫
F172B
󱜬
F172C
󱜭
F172D
󱜮
F172E
󱜯
F172F
A0
B0
󱜰
F1730
󱜱
F1731
󱜲
F1732
󱜳
F1733
󱜴
F1734
󱜵
F1735
󱜶
F1736
󱜷
F1737
󱜸
F1738
󱜹
F1739
󱜺
F173A
󱜻
F173B
󱜼
F173C
󱜽
F173D
󱜾
F173E
󱜿
F173F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]