十进制 |
十六进制 |
控制字符 |
转义字符 |
说明 |
Ctrl + 下列字母 |
0 |
00 |
NUL |
\0 |
Null character(空字符) |
@ |
1 |
01 |
SOH |
|
Start of Header(标题开始) |
A |
2 |
02 |
STX |
|
Start of Text(正文开始) |
B |
3 |
03 |
ETX |
|
End of Text(正文结束) |
C |
4 |
04 |
EOT |
|
End of Transmission(传输结束) |
D |
5 |
05 |
ENQ |
|
Enquiry(请求) |
E |
6 |
06 |
ACK |
|
Acknowledgment(收到通知/响应) |
F |
7 |
07 |
BEL |
\a |
Bell(响铃) |
G |
8 |
08 |
BS |
\b |
Backspace(退格) |
H |
9 |
09 |
HT |
\t |
Horizontal Tab(水平制表符) |
I |
10 |
0A |
LF |
\n |
Line feed(换行键) |
J |
11 |
0B |
VT |
\v |
Vertical Tab(垂直制表符) |
K |
12 |
0C |
FF |
\f |
Form feed(换页键) |
L |
13 |
0D |
CR |
\r |
Carriage return(回车键) |
M |
14 |
0E |
SO |
|
Shift Out(不用切换) |
N |
15 |
0F |
SI |
|
Shift In(启用切换) |
O |
16 |
10 |
DLE |
|
Data Link Escape(数据链路转义) |
P |
17 |
11 |
DC1 |
|
Device Control 1(设备控制1) /XON(Transmit On) |
Q |
18 |
12 |
DC2 |
|
Device Control 2(设备控制2) |
R |
19 |
13 |
DC3 |
|
Device Control 3(设备控制3) /XOFF(Transmit Off) |
S |
20 |
14 |
DC4 |
|
Device Control 4(设备控制4) |
T |
21 |
15 |
NAK |
|
Negative Acknowledgement(拒绝接收/无响应) |
U |
22 |
16 |
SYN |
|
Synchronous Idle(同步空闲) |
V |
23 |
17 |
ETB |
|
End of Trans the Block(传输块结束) |
W |
24 |
18 |
CAN |
|
Cancel(取消) |
X |
25 |
19 |
EM |
|
End of Medium(已到介质末端/介质存储已满) |
Y |
26 |
1A |
SUB |
|
Substitute(替补/替换) |
Z |
27 |
1B |
ESC |
\e |
Escape(溢出/逃离/取消) |
[ |
28 |
1C |
FS |
|
File Separator(文件分割符) |
\ |
29 |
1D |
GS |
|
Group Separator(分组符) |
] |
30 |
1E |
RS |
|
Record Separator(记录分隔符) |
^ |
31 |
1F |
US |
|
Unit Separator(单元分隔符) |
_ |
32 |
20 |
SP |
|
White space |
[Space] |
127 |
7F |
DEL |
|
Delete(删除) |
? |
以上的为控制字符,会影响文本的显示以及处理,必然在拷贝的时候会将出现此类字符之后的字符串截断
re.sub(ur'[\u0000-\u0020]','', line)
以上正则就是过滤控制字符,注意 \uxxxx要写出unicode的形式,也就是说必须要占4位,并且用16进制表示