现在的位置: 首页 > 综合 > 正文

Python中尽量少用加号“+”连接字符串的原因

2018年03月22日 ⁄ 综合 ⁄ 共 694字 ⁄ 字号 评论关闭

在Python中,String对象是定长对象,一旦创建,长度就不可变化,若是使用+号连接两个字符串,则会新开辟一段长度总和长度的内存,再将两个字符串memcpy进去。如果要连接N个String对象,则要进行N-1次内存申请和拷贝。

string_concat(register PyStringObject *a, register PyObject *bb)
{
    register Py_ssize_t size;
    register PyStringObject *op;
//................
    op = (PyStringObject *)PyObject_MALLOC(PyStringObject_SIZE + size);
    if (op == NULL)
        return PyErr_NoMemory();
    PyObject_INIT_VAR(op, &PyString_Type, size);
    op->ob_shash = -1;
    op->ob_sstate = SSTATE_NOT_INTERNED;
    Py_MEMCPY(op->ob_sval, a->ob_sval, Py_SIZE(a));
    Py_MEMCPY(op->ob_sval + Py_SIZE(a), b->ob_sval, Py_SIZE(b));
    op->ob_sval[size] = '\0';
    return (PyObject *) op;
#undef b
}

官方推荐的是使用字符串的join方法,该方法对于连接一个list或tuple中的元素非常有效,他会先统计所有元素的长度,申请内存,然后拷贝。

''.join(['a', 'b', 'c'])    //better
'a' + 'b' + 'c'

抱歉!评论已关闭.