International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F48E96

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
􎖀
10E580
􎖁
10E581
􎖂
10E582
􎖃
10E583
􎖄
10E584
􎖅
10E585
􎖆
10E586
􎖇
10E587
􎖈
10E588
􎖉
10E589
􎖊
10E58A
􎖋
10E58B
􎖌
10E58C
􎖍
10E58D
􎖎
10E58E
􎖏
10E58F
80
90
􎖐
10E590
􎖑
10E591
􎖒
10E592
􎖓
10E593
􎖔
10E594
􎖕
10E595
􎖖
10E596
􎖗
10E597
􎖘
10E598
􎖙
10E599
􎖚
10E59A
􎖛
10E59B
􎖜
10E59C
􎖝
10E59D
􎖞
10E59E
􎖟
10E59F
90
A0
􎖠
10E5A0
􎖡
10E5A1
􎖢
10E5A2
􎖣
10E5A3
􎖤
10E5A4
􎖥
10E5A5
􎖦
10E5A6
􎖧
10E5A7
􎖨
10E5A8
􎖩
10E5A9
􎖪
10E5AA
􎖫
10E5AB
􎖬
10E5AC
􎖭
10E5AD
􎖮
10E5AE
􎖯
10E5AF
A0
B0
􎖰
10E5B0
􎖱
10E5B1
􎖲
10E5B2
􎖳
10E5B3
􎖴
10E5B4
􎖵
10E5B5
􎖶
10E5B6
􎖷
10E5B7
􎖸
10E5B8
􎖹
10E5B9
􎖺
10E5BA
􎖻
10E5BB
􎖼
10E5BC
􎖽
10E5BD
􎖾
10E5BE
􎖿
10E5BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]