International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F39187

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑇀
D11C0
󑇁
D11C1
󑇂
D11C2
󑇃
D11C3
󑇄
D11C4
󑇅
D11C5
󑇆
D11C6
󑇇
D11C7
󑇈
D11C8
󑇉
D11C9
󑇊
D11CA
󑇋
D11CB
󑇌
D11CC
󑇍
D11CD
󑇎
D11CE
󑇏
D11CF
80
90
󑇐
D11D0
󑇑
D11D1
󑇒
D11D2
󑇓
D11D3
󑇔
D11D4
󑇕
D11D5
󑇖
D11D6
󑇗
D11D7
󑇘
D11D8
󑇙
D11D9
󑇚
D11DA
󑇛
D11DB
󑇜
D11DC
󑇝
D11DD
󑇞
D11DE
󑇟
D11DF
90
A0
󑇠
D11E0
󑇡
D11E1
󑇢
D11E2
󑇣
D11E3
󑇤
D11E4
󑇥
D11E5
󑇦
D11E6
󑇧
D11E7
󑇨
D11E8
󑇩
D11E9
󑇪
D11EA
󑇫
D11EB
󑇬
D11EC
󑇭
D11ED
󑇮
D11EE
󑇯
D11EF
A0
B0
󑇰
D11F0
󑇱
D11F1
󑇲
D11F2
󑇳
D11F3
󑇴
D11F4
󑇵
D11F5
󑇶
D11F6
󑇷
D11F7
󑇸
D11F8
󑇹
D11F9
󑇺
D11FA
󑇻
D11FB
󑇼
D11FC
󑇽
D11FD
󑇾
D11FE
󑇿
D11FF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]