International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F39290

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󒐀
D2400
󒐁
D2401
󒐂
D2402
󒐃
D2403
󒐄
D2404
󒐅
D2405
󒐆
D2406
󒐇
D2407
󒐈
D2408
󒐉
D2409
󒐊
D240A
󒐋
D240B
󒐌
D240C
󒐍
D240D
󒐎
D240E
󒐏
D240F
80
90
󒐐
D2410
󒐑
D2411
󒐒
D2412
󒐓
D2413
󒐔
D2414
󒐕
D2415
󒐖
D2416
󒐗
D2417
󒐘
D2418
󒐙
D2419
󒐚
D241A
󒐛
D241B
󒐜
D241C
󒐝
D241D
󒐞
D241E
󒐟
D241F
90
A0
󒐠
D2420
󒐡
D2421
󒐢
D2422
󒐣
D2423
󒐤
D2424
󒐥
D2425
󒐦
D2426
󒐧
D2427
󒐨
D2428
󒐩
D2429
󒐪
D242A
󒐫
D242B
󒐬
D242C
󒐭
D242D
󒐮
D242E
󒐯
D242F
A0
B0
󒐰
D2430
󒐱
D2431
󒐲
D2432
󒐳
D2433
󒐴
D2434
󒐵
D2435
󒐶
D2436
󒐷
D2437
󒐸
D2438
󒐹
D2439
󒐺
D243A
󒐻
D243B
󒐼
D243C
󒐽
D243D
󒐾
D243E
󒐿
D243F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]