International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F39182

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑂀
D1080
󑂁
D1081
󑂂
D1082
󑂃
D1083
󑂄
D1084
󑂅
D1085
󑂆
D1086
󑂇
D1087
󑂈
D1088
󑂉
D1089
󑂊
D108A
󑂋
D108B
󑂌
D108C
󑂍
D108D
󑂎
D108E
󑂏
D108F
80
90
󑂐
D1090
󑂑
D1091
󑂒
D1092
󑂓
D1093
󑂔
D1094
󑂕
D1095
󑂖
D1096
󑂗
D1097
󑂘
D1098
󑂙
D1099
󑂚
D109A
󑂛
D109B
󑂜
D109C
󑂝
D109D
󑂞
D109E
󑂟
D109F
90
A0
󑂠
D10A0
󑂡
D10A1
󑂢
D10A2
󑂣
D10A3
󑂤
D10A4
󑂥
D10A5
󑂦
D10A6
󑂧
D10A7
󑂨
D10A8
󑂩
D10A9
󑂪
D10AA
󑂫
D10AB
󑂬
D10AC
󑂭
D10AD
󑂮
D10AE
󑂯
D10AF
A0
B0
󑂰
D10B0
󑂱
D10B1
󑂲
D10B2
󑂳
D10B3
󑂴
D10B4
󑂵
D10B5
󑂶
D10B6
󑂷
D10B7
󑂸
D10B8
󑂹
D10B9
󑂺
D10BA
󑂻
D10BB
󑂼
D10BC
󑂽
D10BD
󑂾
D10BE
󑂿
D10BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]