International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A186

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡆀
E1180
󡆁
E1181
󡆂
E1182
󡆃
E1183
󡆄
E1184
󡆅
E1185
󡆆
E1186
󡆇
E1187
󡆈
E1188
󡆉
E1189
󡆊
E118A
󡆋
E118B
󡆌
E118C
󡆍
E118D
󡆎
E118E
󡆏
E118F
80
90
󡆐
E1190
󡆑
E1191
󡆒
E1192
󡆓
E1193
󡆔
E1194
󡆕
E1195
󡆖
E1196
󡆗
E1197
󡆘
E1198
󡆙
E1199
󡆚
E119A
󡆛
E119B
󡆜
E119C
󡆝
E119D
󡆞
E119E
󡆟
E119F
90
A0
󡆠
E11A0
󡆡
E11A1
󡆢
E11A2
󡆣
E11A3
󡆤
E11A4
󡆥
E11A5
󡆦
E11A6
󡆧
E11A7
󡆨
E11A8
󡆩
E11A9
󡆪
E11AA
󡆫
E11AB
󡆬
E11AC
󡆭
E11AD
󡆮
E11AE
󡆯
E11AF
A0
B0
󡆰
E11B0
󡆱
E11B1
󡆲
E11B2
󡆳
E11B3
󡆴
E11B4
󡆵
E11B5
󡆶
E11B6
󡆷
E11B7
󡆸
E11B8
󡆹
E11B9
󡆺
E11BA
󡆻
E11BB
󡆼
E11BC
󡆽
E11BD
󡆾
E11BE
󡆿
E11BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]