International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F2ADB4

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򭴀
ADD00
򭴁
ADD01
򭴂
ADD02
򭴃
ADD03
򭴄
ADD04
򭴅
ADD05
򭴆
ADD06
򭴇
ADD07
򭴈
ADD08
򭴉
ADD09
򭴊
ADD0A
򭴋
ADD0B
򭴌
ADD0C
򭴍
ADD0D
򭴎
ADD0E
򭴏
ADD0F
80
90
򭴐
ADD10
򭴑
ADD11
򭴒
ADD12
򭴓
ADD13
򭴔
ADD14
򭴕
ADD15
򭴖
ADD16
򭴗
ADD17
򭴘
ADD18
򭴙
ADD19
򭴚
ADD1A
򭴛
ADD1B
򭴜
ADD1C
򭴝
ADD1D
򭴞
ADD1E
򭴟
ADD1F
90
A0
򭴠
ADD20
򭴡
ADD21
򭴢
ADD22
򭴣
ADD23
򭴤
ADD24
򭴥
ADD25
򭴦
ADD26
򭴧
ADD27
򭴨
ADD28
򭴩
ADD29
򭴪
ADD2A
򭴫
ADD2B
򭴬
ADD2C
򭴭
ADD2D
򭴮
ADD2E
򭴯
ADD2F
A0
B0
򭴰
ADD30
򭴱
ADD31
򭴲
ADD32
򭴳
ADD33
򭴴
ADD34
򭴵
ADD35
򭴶
ADD36
򭴷
ADD37
򭴸
ADD38
򭴹
ADD39
򭴺
ADD3A
򭴻
ADD3B
򭴼
ADD3C
򭴽
ADD3D
򭴾
ADD3E
򭴿
ADD3F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]