Dict对象

散列表

PyDictObject采用了散列表,搜索效率高。python使用开放定址法(二次搜索法)来解决散列冲突的问题,所以dict的删除其实为伪删除。

考虑对dict的优化为:定期整理一下dict,重新构建

元素结构

typedef struct {
    Py_ssize_t me_hash;  // 缓存的key的hash值
    PyObject *me_key;
    PyObject *me_value;
} PyDictEntry;

元素有三种状态

Unused

还没有存储东西,key、value都为NULL。

Active

存储了一个值,key、value都非空,同时key不能为dummy

dummy

已被删除(伪),key为dummy,value为NULL

容器实现

typedef struct _dictobject PyDictObject;
struct _dictobject {
    PyObject_HEAD
    Py_ssize_t ma_fill;  // 已分配元素总个数(active+dummy)
    Py_ssize_t ma_used;  // 活着的元素个数(active)
    Py_ssize_t ma_mask;  // 元素可容纳的总个数 也就是数组的大小

    PyDictEntry *ma_table;  // 指向存放dict元素的数组 初始指向默认的8个元素的字典ma_smalltable
    PyDictEntry *(*ma_lookup)(PyDictObject *mp, PyObject *key, long hash);
    PyDictEntry ma_smalltable[PyDict_MINSIZE];  // 默认的8个元素的字典
};

创建

创建时同样利用了free_dicts缓冲池技术,和list类似

搜索

lookdict_string(PyDictObject *mp, PyObject *key, register long hash)

1、根据hash值获得entry的索引,取得entry
2、如果该entry为Unused 搜索失败 结束;
3、如果该entry处于Active状态,比较key,如果key相同,搜索成功 结束
3、设置free_slot 继续搜索

lookdict_string(PyDictObject *mp, PyObject *key, register long hash)

针对搜索key为str类型时的特殊处理

插入和修改

调整table大小

删除元素

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 由于Python内部大量使用dict这种结构,效率要求很高,所以Python没有使用STL map的平衡二叉树,而...
    lintong阅读 5,070评论 0 5
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 6,707评论 0 17
  • Python源码剖析笔记4-内建数据类型 Python内建数据类型包括整数对象PyIntObject,字符串对象P...
    __七把刀__阅读 1,175评论 0 2
  • 文/苏小呆 如果你们有缘分走到一起,先不要兴奋欢喜,要准备好如何走下去,因为命运已无形中在你们之间放了一扇窗。 初...
    苏小呆阅读 1,026评论 0 5
  • 知乎上有一个话题:出身富贵人家到底有什么地方值得向往? 最直接的回答是钱。 拜金不是目的,但优越的物质条件、高品质...
    风雅狂月阅读 312评论 0 0