International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A1BA

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡺀
E1E80
󡺁
E1E81
󡺂
E1E82
󡺃
E1E83
󡺄
E1E84
󡺅
E1E85
󡺆
E1E86
󡺇
E1E87
󡺈
E1E88
󡺉
E1E89
󡺊
E1E8A
󡺋
E1E8B
󡺌
E1E8C
󡺍
E1E8D
󡺎
E1E8E
󡺏
E1E8F
80
90
󡺐
E1E90
󡺑
E1E91
󡺒
E1E92
󡺓
E1E93
󡺔
E1E94
󡺕
E1E95
󡺖
E1E96
󡺗
E1E97
󡺘
E1E98
󡺙
E1E99
󡺚
E1E9A
󡺛
E1E9B
󡺜
E1E9C
󡺝
E1E9D
󡺞
E1E9E
󡺟
E1E9F
90
A0
󡺠
E1EA0
󡺡
E1EA1
󡺢
E1EA2
󡺣
E1EA3
󡺤
E1EA4
󡺥
E1EA5
󡺦
E1EA6
󡺧
E1EA7
󡺨
E1EA8
󡺩
E1EA9
󡺪
E1EAA
󡺫
E1EAB
󡺬
E1EAC
󡺭
E1EAD
󡺮
E1EAE
󡺯
E1EAF
A0
B0
󡺰
E1EB0
󡺱
E1EB1
󡺲
E1EB2
󡺳
E1EB3
󡺴
E1EB4
󡺵
E1EB5
󡺶
E1EB6
󡺷
E1EB7
󡺸
E1EB8
󡺹
E1EB9
󡺺
E1EBA
󡺻
E1EBB
󡺼
E1EBC
󡺽
E1EBD
󡺾
E1EBE
󡺿
E1EBF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]