International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A19E

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡞀
E1780
󡞁
E1781
󡞂
E1782
󡞃
E1783
󡞄
E1784
󡞅
E1785
󡞆
E1786
󡞇
E1787
󡞈
E1788
󡞉
E1789
󡞊
E178A
󡞋
E178B
󡞌
E178C
󡞍
E178D
󡞎
E178E
󡞏
E178F
80
90
󡞐
E1790
󡞑
E1791
󡞒
E1792
󡞓
E1793
󡞔
E1794
󡞕
E1795
󡞖
E1796
󡞗
E1797
󡞘
E1798
󡞙
E1799
󡞚
E179A
󡞛
E179B
󡞜
E179C
󡞝
E179D
󡞞
E179E
󡞟
E179F
90
A0
󡞠
E17A0
󡞡
E17A1
󡞢
E17A2
󡞣
E17A3
󡞤
E17A4
󡞥
E17A5
󡞦
E17A6
󡞧
E17A7
󡞨
E17A8
󡞩
E17A9
󡞪
E17AA
󡞫
E17AB
󡞬
E17AC
󡞭
E17AD
󡞮
E17AE
󡞯
E17AF
A0
B0
󡞰
E17B0
󡞱
E17B1
󡞲
E17B2
󡞳
E17B3
󡞴
E17B4
󡞵
E17B5
󡞶
E17B6
󡞷
E17B7
󡞸
E17B8
󡞹
E17B9
󡞺
E17BA
󡞻
E17BB
󡞼
E17BC
󡞽
E17BD
󡞾
E17BE
󡞿
E17BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]