International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F391A2

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑢀
D1880
󑢁
D1881
󑢂
D1882
󑢃
D1883
󑢄
D1884
󑢅
D1885
󑢆
D1886
󑢇
D1887
󑢈
D1888
󑢉
D1889
󑢊
D188A
󑢋
D188B
󑢌
D188C
󑢍
D188D
󑢎
D188E
󑢏
D188F
80
90
󑢐
D1890
󑢑
D1891
󑢒
D1892
󑢓
D1893
󑢔
D1894
󑢕
D1895
󑢖
D1896
󑢗
D1897
󑢘
D1898
󑢙
D1899
󑢚
D189A
󑢛
D189B
󑢜
D189C
󑢝
D189D
󑢞
D189E
󑢟
D189F
90
A0
󑢠
D18A0
󑢡
D18A1
󑢢
D18A2
󑢣
D18A3
󑢤
D18A4
󑢥
D18A5
󑢦
D18A6
󑢧
D18A7
󑢨
D18A8
󑢩
D18A9
󑢪
D18AA
󑢫
D18AB
󑢬
D18AC
󑢭
D18AD
󑢮
D18AE
󑢯
D18AF
A0
B0
󑢰
D18B0
󑢱
D18B1
󑢲
D18B2
󑢳
D18B3
󑢴
D18B4
󑢵
D18B5
󑢶
D18B6
󑢷
D18B7
󑢸
D18B8
󑢹
D18B9
󑢺
D18BA
󑢻
D18BB
󑢼
D18BC
󑢽
D18BD
󑢾
D18BE
󑢿
D18BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]