International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29AB1

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򚱀
9AC40
򚱁
9AC41
򚱂
9AC42
򚱃
9AC43
򚱄
9AC44
򚱅
9AC45
򚱆
9AC46
򚱇
9AC47
򚱈
9AC48
򚱉
9AC49
򚱊
9AC4A
򚱋
9AC4B
򚱌
9AC4C
򚱍
9AC4D
򚱎
9AC4E
򚱏
9AC4F
80
90
򚱐
9AC50
򚱑
9AC51
򚱒
9AC52
򚱓
9AC53
򚱔
9AC54
򚱕
9AC55
򚱖
9AC56
򚱗
9AC57
򚱘
9AC58
򚱙
9AC59
򚱚
9AC5A
򚱛
9AC5B
򚱜
9AC5C
򚱝
9AC5D
򚱞
9AC5E
򚱟
9AC5F
90
A0
򚱠
9AC60
򚱡
9AC61
򚱢
9AC62
򚱣
9AC63
򚱤
9AC64
򚱥
9AC65
򚱦
9AC66
򚱧
9AC67
򚱨
9AC68
򚱩
9AC69
򚱪
9AC6A
򚱫
9AC6B
򚱬
9AC6C
򚱭
9AC6D
򚱮
9AC6E
򚱯
9AC6F
A0
B0
򚱰
9AC70
򚱱
9AC71
򚱲
9AC72
򚱳
9AC73
򚱴
9AC74
򚱵
9AC75
򚱶
9AC76
򚱷
9AC77
򚱸
9AC78
򚱹
9AC79
򚱺
9AC7A
򚱻
9AC7B
򚱼
9AC7C
򚱽
9AC7D
򚱾
9AC7E
򚱿
9AC7F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]