International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A291

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󢑀
E2440
󢑁
E2441
󢑂
E2442
󢑃
E2443
󢑄
E2444
󢑅
E2445
󢑆
E2446
󢑇
E2447
󢑈
E2448
󢑉
E2449
󢑊
E244A
󢑋
E244B
󢑌
E244C
󢑍
E244D
󢑎
E244E
󢑏
E244F
80
90
󢑐
E2450
󢑑
E2451
󢑒
E2452
󢑓
E2453
󢑔
E2454
󢑕
E2455
󢑖
E2456
󢑗
E2457
󢑘
E2458
󢑙
E2459
󢑚
E245A
󢑛
E245B
󢑜
E245C
󢑝
E245D
󢑞
E245E
󢑟
E245F
90
A0
󢑠
E2460
󢑡
E2461
󢑢
E2462
󢑣
E2463
󢑤
E2464
󢑥
E2465
󢑦
E2466
󢑧
E2467
󢑨
E2468
󢑩
E2469
󢑪
E246A
󢑫
E246B
󢑬
E246C
󢑭
E246D
󢑮
E246E
󢑯
E246F
A0
B0
󢑰
E2470
󢑱
E2471
󢑲
E2472
󢑳
E2473
󢑴
E2474
󢑵
E2475
󢑶
E2476
󢑷
E2477
󢑸
E2478
󢑹
E2479
󢑺
E247A
󢑻
E247B
󢑼
E247C
󢑽
E247D
󢑾
E247E
󢑿
E247F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]