International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29A86

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򚆀
9A180
򚆁
9A181
򚆂
9A182
򚆃
9A183
򚆄
9A184
򚆅
9A185
򚆆
9A186
򚆇
9A187
򚆈
9A188
򚆉
9A189
򚆊
9A18A
򚆋
9A18B
򚆌
9A18C
򚆍
9A18D
򚆎
9A18E
򚆏
9A18F
80
90
򚆐
9A190
򚆑
9A191
򚆒
9A192
򚆓
9A193
򚆔
9A194
򚆕
9A195
򚆖
9A196
򚆗
9A197
򚆘
9A198
򚆙
9A199
򚆚
9A19A
򚆛
9A19B
򚆜
9A19C
򚆝
9A19D
򚆞
9A19E
򚆟
9A19F
90
A0
򚆠
9A1A0
򚆡
9A1A1
򚆢
9A1A2
򚆣
9A1A3
򚆤
9A1A4
򚆥
9A1A5
򚆦
9A1A6
򚆧
9A1A7
򚆨
9A1A8
򚆩
9A1A9
򚆪
9A1AA
򚆫
9A1AB
򚆬
9A1AC
򚆭
9A1AD
򚆮
9A1AE
򚆯
9A1AF
A0
B0
򚆰
9A1B0
򚆱
9A1B1
򚆲
9A1B2
򚆳
9A1B3
򚆴
9A1B4
򚆵
9A1B5
򚆶
9A1B6
򚆷
9A1B7
򚆸
9A1B8
򚆹
9A1B9
򚆺
9A1BA
򚆻
9A1BB
򚆼
9A1BC
򚆽
9A1BD
򚆾
9A1BE
򚆿
9A1BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]