International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3B18A

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󱊀
F1280
󱊁
F1281
󱊂
F1282
󱊃
F1283
󱊄
F1284
󱊅
F1285
󱊆
F1286
󱊇
F1287
󱊈
F1288
󱊉
F1289
󱊊
F128A
󱊋
F128B
󱊌
F128C
󱊍
F128D
󱊎
F128E
󱊏
F128F
80
90
󱊐
F1290
󱊑
F1291
󱊒
F1292
󱊓
F1293
󱊔
F1294
󱊕
F1295
󱊖
F1296
󱊗
F1297
󱊘
F1298
󱊙
F1299
󱊚
F129A
󱊛
F129B
󱊜
F129C
󱊝
F129D
󱊞
F129E
󱊟
F129F
90
A0
󱊠
F12A0
󱊡
F12A1
󱊢
F12A2
󱊣
F12A3
󱊤
F12A4
󱊥
F12A5
󱊦
F12A6
󱊧
F12A7
󱊨
F12A8
󱊩
F12A9
󱊪
F12AA
󱊫
F12AB
󱊬
F12AC
󱊭
F12AD
󱊮
F12AE
󱊯
F12AF
A0
B0
󱊰
F12B0
󱊱
F12B1
󱊲
F12B2
󱊳
F12B3
󱊴
F12B4
󱊵
F12B5
󱊶
F12B6
󱊷
F12B7
󱊸
F12B8
󱊹
F12B9
󱊺
F12BA
󱊻
F12BB
󱊼
F12BC
󱊽
F12BD
󱊾
F12BE
󱊿
F12BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]