International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F48DB4

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
􍴀
10DD00
􍴁
10DD01
􍴂
10DD02
􍴃
10DD03
􍴄
10DD04
􍴅
10DD05
􍴆
10DD06
􍴇
10DD07
􍴈
10DD08
􍴉
10DD09
􍴊
10DD0A
􍴋
10DD0B
􍴌
10DD0C
􍴍
10DD0D
􍴎
10DD0E
􍴏
10DD0F
80
90
􍴐
10DD10
􍴑
10DD11
􍴒
10DD12
􍴓
10DD13
􍴔
10DD14
􍴕
10DD15
􍴖
10DD16
􍴗
10DD17
􍴘
10DD18
􍴙
10DD19
􍴚
10DD1A
􍴛
10DD1B
􍴜
10DD1C
􍴝
10DD1D
􍴞
10DD1E
􍴟
10DD1F
90
A0
􍴠
10DD20
􍴡
10DD21
􍴢
10DD22
􍴣
10DD23
􍴤
10DD24
􍴥
10DD25
􍴦
10DD26
􍴧
10DD27
􍴨
10DD28
􍴩
10DD29
􍴪
10DD2A
􍴫
10DD2B
􍴬
10DD2C
􍴭
10DD2D
􍴮
10DD2E
􍴯
10DD2F
A0
B0
􍴰
10DD30
􍴱
10DD31
􍴲
10DD32
􍴳
10DD33
􍴴
10DD34
􍴵
10DD35
􍴶
10DD36
􍴷
10DD37
􍴸
10DD38
􍴹
10DD39
􍴺
10DD3A
􍴻
10DD3B
􍴼
10DD3C
􍴽
10DD3D
􍴾
10DD3E
􍴿
10DD3F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]