International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F39184

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑄀
D1100
󑄁
D1101
󑄂
D1102
󑄃
D1103
󑄄
D1104
󑄅
D1105
󑄆
D1106
󑄇
D1107
󑄈
D1108
󑄉
D1109
󑄊
D110A
󑄋
D110B
󑄌
D110C
󑄍
D110D
󑄎
D110E
󑄏
D110F
80
90
󑄐
D1110
󑄑
D1111
󑄒
D1112
󑄓
D1113
󑄔
D1114
󑄕
D1115
󑄖
D1116
󑄗
D1117
󑄘
D1118
󑄙
D1119
󑄚
D111A
󑄛
D111B
󑄜
D111C
󑄝
D111D
󑄞
D111E
󑄟
D111F
90
A0
󑄠
D1120
󑄡
D1121
󑄢
D1122
󑄣
D1123
󑄤
D1124
󑄥
D1125
󑄦
D1126
󑄧
D1127
󑄨
D1128
󑄩
D1129
󑄪
D112A
󑄫
D112B
󑄬
D112C
󑄭
D112D
󑄮
D112E
󑄯
D112F
A0
B0
󑄰
D1130
󑄱
D1131
󑄲
D1132
󑄳
D1133
󑄴
D1134
󑄵
D1135
󑄶
D1136
󑄷
D1137
󑄸
D1138
󑄹
D1139
󑄺
D113A
󑄻
D113B
󑄼
D113C
󑄽
D113D
󑄾
D113E
󑄿
D113F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]