International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29A8A

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򚊀
9A280
򚊁
9A281
򚊂
9A282
򚊃
9A283
򚊄
9A284
򚊅
9A285
򚊆
9A286
򚊇
9A287
򚊈
9A288
򚊉
9A289
򚊊
9A28A
򚊋
9A28B
򚊌
9A28C
򚊍
9A28D
򚊎
9A28E
򚊏
9A28F
80
90
򚊐
9A290
򚊑
9A291
򚊒
9A292
򚊓
9A293
򚊔
9A294
򚊕
9A295
򚊖
9A296
򚊗
9A297
򚊘
9A298
򚊙
9A299
򚊚
9A29A
򚊛
9A29B
򚊜
9A29C
򚊝
9A29D
򚊞
9A29E
򚊟
9A29F
90
A0
򚊠
9A2A0
򚊡
9A2A1
򚊢
9A2A2
򚊣
9A2A3
򚊤
9A2A4
򚊥
9A2A5
򚊦
9A2A6
򚊧
9A2A7
򚊨
9A2A8
򚊩
9A2A9
򚊪
9A2AA
򚊫
9A2AB
򚊬
9A2AC
򚊭
9A2AD
򚊮
9A2AE
򚊯
9A2AF
A0
B0
򚊰
9A2B0
򚊱
9A2B1
򚊲
9A2B2
򚊳
9A2B3
򚊴
9A2B4
򚊵
9A2B5
򚊶
9A2B6
򚊷
9A2B7
򚊸
9A2B8
򚊹
9A2B9
򚊺
9A2BA
򚊻
9A2BB
򚊼
9A2BC
򚊽
9A2BD
򚊾
9A2BE
򚊿
9A2BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]