International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F39181

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑁀
D1040
󑁁
D1041
󑁂
D1042
󑁃
D1043
󑁄
D1044
󑁅
D1045
󑁆
D1046
󑁇
D1047
󑁈
D1048
󑁉
D1049
󑁊
D104A
󑁋
D104B
󑁌
D104C
󑁍
D104D
󑁎
D104E
󑁏
D104F
80
90
󑁐
D1050
󑁑
D1051
󑁒
D1052
󑁓
D1053
󑁔
D1054
󑁕
D1055
󑁖
D1056
󑁗
D1057
󑁘
D1058
󑁙
D1059
󑁚
D105A
󑁛
D105B
󑁜
D105C
󑁝
D105D
󑁞
D105E
󑁟
D105F
90
A0
󑁠
D1060
󑁡
D1061
󑁢
D1062
󑁣
D1063
󑁤
D1064
󑁥
D1065
󑁦
D1066
󑁧
D1067
󑁨
D1068
󑁩
D1069
󑁪
D106A
󑁫
D106B
󑁬
D106C
󑁭
D106D
󑁮
D106E
󑁯
D106F
A0
B0
󑁰
D1070
󑁱
D1071
󑁲
D1072
󑁳
D1073
󑁴
D1074
󑁵
D1075
󑁶
D1076
󑁷
D1077
󑁸
D1078
󑁹
D1079
󑁺
D107A
󑁻
D107B
󑁼
D107C
󑁽
D107D
󑁾
D107E
󑁿
D107F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]