International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F48EA2

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
􎢀
10E880
􎢁
10E881
􎢂
10E882
􎢃
10E883
􎢄
10E884
􎢅
10E885
􎢆
10E886
􎢇
10E887
􎢈
10E888
􎢉
10E889
􎢊
10E88A
􎢋
10E88B
􎢌
10E88C
􎢍
10E88D
􎢎
10E88E
􎢏
10E88F
80
90
􎢐
10E890
􎢑
10E891
􎢒
10E892
􎢓
10E893
􎢔
10E894
􎢕
10E895
􎢖
10E896
􎢗
10E897
􎢘
10E898
􎢙
10E899
􎢚
10E89A
􎢛
10E89B
􎢜
10E89C
􎢝
10E89D
􎢞
10E89E
􎢟
10E89F
90
A0
􎢠
10E8A0
􎢡
10E8A1
􎢢
10E8A2
􎢣
10E8A3
􎢤
10E8A4
􎢥
10E8A5
􎢦
10E8A6
􎢧
10E8A7
􎢨
10E8A8
􎢩
10E8A9
􎢪
10E8AA
􎢫
10E8AB
􎢬
10E8AC
􎢭
10E8AD
􎢮
10E8AE
􎢯
10E8AF
A0
B0
􎢰
10E8B0
􎢱
10E8B1
􎢲
10E8B2
􎢳
10E8B3
􎢴
10E8B4
􎢵
10E8B5
􎢶
10E8B6
􎢷
10E8B7
􎢸
10E8B8
􎢹
10E8B9
􎢺
10E8BA
􎢻
10E8BB
􎢼
10E8BC
􎢽
10E8BD
􎢾
10E8BE
􎢿
10E8BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]