International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3918A

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑊀
D1280
󑊁
D1281
󑊂
D1282
󑊃
D1283
󑊄
D1284
󑊅
D1285
󑊆
D1286
󑊇
D1287
󑊈
D1288
󑊉
D1289
󑊊
D128A
󑊋
D128B
󑊌
D128C
󑊍
D128D
󑊎
D128E
󑊏
D128F
80
90
󑊐
D1290
󑊑
D1291
󑊒
D1292
󑊓
D1293
󑊔
D1294
󑊕
D1295
󑊖
D1296
󑊗
D1297
󑊘
D1298
󑊙
D1299
󑊚
D129A
󑊛
D129B
󑊜
D129C
󑊝
D129D
󑊞
D129E
󑊟
D129F
90
A0
󑊠
D12A0
󑊡
D12A1
󑊢
D12A2
󑊣
D12A3
󑊤
D12A4
󑊥
D12A5
󑊦
D12A6
󑊧
D12A7
󑊨
D12A8
󑊩
D12A9
󑊪
D12AA
󑊫
D12AB
󑊬
D12AC
󑊭
D12AD
󑊮
D12AE
󑊯
D12AF
A0
B0
󑊰
D12B0
󑊱
D12B1
󑊲
D12B2
󑊳
D12B3
󑊴
D12B4
󑊵
D12B5
󑊶
D12B6
󑊷
D12B7
󑊸
D12B8
󑊹
D12B9
󑊺
D12BA
󑊻
D12BB
󑊼
D12BC
󑊽
D12BD
󑊾
D12BE
󑊿
D12BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]