International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3B1A2

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󱢀
F1880
󱢁
F1881
󱢂
F1882
󱢃
F1883
󱢄
F1884
󱢅
F1885
󱢆
F1886
󱢇
F1887
󱢈
F1888
󱢉
F1889
󱢊
F188A
󱢋
F188B
󱢌
F188C
󱢍
F188D
󱢎
F188E
󱢏
F188F
80
90
󱢐
F1890
󱢑
F1891
󱢒
F1892
󱢓
F1893
󱢔
F1894
󱢕
F1895
󱢖
F1896
󱢗
F1897
󱢘
F1898
󱢙
F1899
󱢚
F189A
󱢛
F189B
󱢜
F189C
󱢝
F189D
󱢞
F189E
󱢟
F189F
90
A0
󱢠
F18A0
󱢡
F18A1
󱢢
F18A2
󱢣
F18A3
󱢤
F18A4
󱢥
F18A5
󱢦
F18A6
󱢧
F18A7
󱢨
F18A8
󱢩
F18A9
󱢪
F18AA
󱢫
F18AB
󱢬
F18AC
󱢭
F18AD
󱢮
F18AE
󱢯
F18AF
A0
B0
󱢰
F18B0
󱢱
F18B1
󱢲
F18B2
󱢳
F18B3
󱢴
F18B4
󱢵
F18B5
󱢶
F18B6
󱢷
F18B7
󱢸
F18B8
󱢹
F18B9
󱢺
F18BA
󱢻
F18BB
󱢼
F18BC
󱢽
F18BD
󱢾
F18BE
󱢿
F18BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]