International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3918C

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑌀
D1300
󑌁
D1301
󑌂
D1302
󑌃
D1303
󑌄
D1304
󑌅
D1305
󑌆
D1306
󑌇
D1307
󑌈
D1308
󑌉
D1309
󑌊
D130A
󑌋
D130B
󑌌
D130C
󑌍
D130D
󑌎
D130E
󑌏
D130F
80
90
󑌐
D1310
󑌑
D1311
󑌒
D1312
󑌓
D1313
󑌔
D1314
󑌕
D1315
󑌖
D1316
󑌗
D1317
󑌘
D1318
󑌙
D1319
󑌚
D131A
󑌛
D131B
󑌜
D131C
󑌝
D131D
󑌞
D131E
󑌟
D131F
90
A0
󑌠
D1320
󑌡
D1321
󑌢
D1322
󑌣
D1323
󑌤
D1324
󑌥
D1325
󑌦
D1326
󑌧
D1327
󑌨
D1328
󑌩
D1329
󑌪
D132A
󑌫
D132B
󑌬
D132C
󑌭
D132D
󑌮
D132E
󑌯
D132F
A0
B0
󑌰
D1330
󑌱
D1331
󑌲
D1332
󑌳
D1333
󑌴
D1334
󑌵
D1335
󑌶
D1336
󑌷
D1337
󑌸
D1338
󑌹
D1339
󑌺
D133A
󑌻
D133B
󑌼
D133C
󑌽
D133D
󑌾
D133E
󑌿
D133F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]