International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A19A

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡚀
E1680
󡚁
E1681
󡚂
E1682
󡚃
E1683
󡚄
E1684
󡚅
E1685
󡚆
E1686
󡚇
E1687
󡚈
E1688
󡚉
E1689
󡚊
E168A
󡚋
E168B
󡚌
E168C
󡚍
E168D
󡚎
E168E
󡚏
E168F
80
90
󡚐
E1690
󡚑
E1691
󡚒
E1692
󡚓
E1693
󡚔
E1694
󡚕
E1695
󡚖
E1696
󡚗
E1697
󡚘
E1698
󡚙
E1699
󡚚
E169A
󡚛
E169B
󡚜
E169C
󡚝
E169D
󡚞
E169E
󡚟
E169F
90
A0
󡚠
E16A0
󡚡
E16A1
󡚢
E16A2
󡚣
E16A3
󡚤
E16A4
󡚥
E16A5
󡚦
E16A6
󡚧
E16A7
󡚨
E16A8
󡚩
E16A9
󡚪
E16AA
󡚫
E16AB
󡚬
E16AC
󡚭
E16AD
󡚮
E16AE
󡚯
E16AF
A0
B0
󡚰
E16B0
󡚱
E16B1
󡚲
E16B2
󡚳
E16B3
󡚴
E16B4
󡚵
E16B5
󡚶
E16B6
󡚷
E16B7
󡚸
E16B8
󡚹
E16B9
󡚺
E16BA
󡚻
E16BB
󡚼
E16BC
󡚽
E16BD
󡚾
E16BE
󡚿
E16BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]