International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F48EA8

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
􎨀
10EA00
􎨁
10EA01
􎨂
10EA02
􎨃
10EA03
􎨄
10EA04
􎨅
10EA05
􎨆
10EA06
􎨇
10EA07
􎨈
10EA08
􎨉
10EA09
􎨊
10EA0A
􎨋
10EA0B
􎨌
10EA0C
􎨍
10EA0D
􎨎
10EA0E
􎨏
10EA0F
80
90
􎨐
10EA10
􎨑
10EA11
􎨒
10EA12
􎨓
10EA13
􎨔
10EA14
􎨕
10EA15
􎨖
10EA16
􎨗
10EA17
􎨘
10EA18
􎨙
10EA19
􎨚
10EA1A
􎨛
10EA1B
􎨜
10EA1C
􎨝
10EA1D
􎨞
10EA1E
􎨟
10EA1F
90
A0
􎨠
10EA20
􎨡
10EA21
􎨢
10EA22
􎨣
10EA23
􎨤
10EA24
􎨥
10EA25
􎨦
10EA26
􎨧
10EA27
􎨨
10EA28
􎨩
10EA29
􎨪
10EA2A
􎨫
10EA2B
􎨬
10EA2C
􎨭
10EA2D
􎨮
10EA2E
􎨯
10EA2F
A0
B0
􎨰
10EA30
􎨱
10EA31
􎨲
10EA32
􎨳
10EA33
􎨴
10EA34
􎨵
10EA35
􎨶
10EA36
􎨷
10EA37
􎨸
10EA38
􎨹
10EA39
􎨺
10EA3A
􎨻
10EA3B
􎨼
10EA3C
􎨽
10EA3D
􎨾
10EA3E
􎨿
10EA3F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]