International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes EE8B

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
E2C0
E2C1
E2C2
E2C3
E2C4
E2C5
E2C6
E2C7
E2C8
E2C9
E2CA
E2CB
E2CC
E2CD
E2CE
E2CF
80
90
E2D0
E2D1
E2D2
E2D3
E2D4
E2D5
E2D6
E2D7
E2D8
E2D9
E2DA
E2DB
E2DC
E2DD
E2DE
E2DF
90
A0
E2E0
E2E1
E2E2
E2E3
E2E4
E2E5
E2E6
E2E7
E2E8
E2E9
E2EA
E2EB
E2EC
E2ED
E2EE
E2EF
A0
B0
E2F0
E2F1
E2F2
E2F3
E2F4
E2F5
E2F6
E2F7
E2F8
E2F9
E2FA
E2FB
E2FC
E2FD
E2FE
E2FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]