资讯专栏INFORMATION COLUMN

Python两个对象相等的原理

rottengeek / 2525人阅读

摘要:因此我们可以得出结论,如果两个对象相等的话,那它们的值必然也是相等的。如果定义了一个可比较的对象,那么最好保证对象值相关的属性在生命周期内不能发生改变,不然会发生意想不到的错误。

概述

  大部分的python程序员平时编程的时候,很少关心两个对象为什么相等,因为教程和经验来说,他们就应该相等,比如1==1就应该返回True,可是当我们想要定义自己的对象或者修改默认的对象行为时,通常会因为不了解原理而导致各种奇奇怪怪的错误。

两个对象如何相等

  两个对象如何才能相等要比我们想象的复杂很多,但核心的方法是重写__eq__方法,这个方法返回True,则表示两个对象相等,否则,就不相等。相反的,如果两个对象不相等,则重写__ne__方法。
  默认情况下,如果你没有实现这个方法,则使用父类(object)的方法。父类的方法比较是的两个对象的ID(可以通过id方法获取对象ID),也就是说,如果对象的ID相等,则两个对象也就相等。因此,我们可以得知,默认情况下,对象只和自己相等。例如:

</>复制代码

  1. >>> class A(object):
  2. ... pass
  3. ...
  4. >>>
  5. >>> a = A()
  6. >>> b = A()
  7. >>> a == a
  8. True
  9. >>> a == b
  10. False
  11. >>> id(a)
  12. 4343310992
  13. >>> id(b)
  14. 4343310928

  Python2程序员经常犯的一个错误是,只重写了__eq__方法,而没有重写__ne__方法,导致不可预计的错误。而Python3会自动重写__ne__方法,如果你没有重写的话。

对象的Hash方法

  Python里可Hash的对象,都有一个数字ID代表了它在python里的值,这个ID是由对象的__hash__方法返回的。因此,如果想让一个对象可Hash,那必须实现__hash__方法和之前提到的__eq__方法。和对象相等一样,默认情况下,对象的__hash__方法继承自Object对象,而Object对象的__hash__方法只计算对象ID,因此两个对象始终拥有两个不一样的hash id,不管他们是多么相似。
  当我们把一个不可Hash的对象加入到set或者dict时,会发生什么了?

</>复制代码

  1. >>> set().add({})
  2. Traceback (most recent call last):
  3. File "", line 1, in
  4. TypeError: unhashable type: "dict"
  5. unhashable type: "dict"

原因是set()和dict()使用对象的hash值作为内部索引,以便能快速索引到指定对象。因此,同一个对象返回相同的hash id就很重要了。

对象的Hash值在它的生命周期内不能改变

  如果你想定义一个比较完美的对象,并且实现了__eq__和__hash__方法来定义对象的比较行为和hash值,那么你就需要保证对象的相关属性不能发生更改。不然会导致很诡异的错误,比如下面的例子。

</>复制代码

  1. >>> class C:
  2. ... def __init__(self, x):
  3. ... self.x = x
  4. ... def __repr__(self):
  5. ... return "C({"+str(self.x)+"})"
  6. ... def __hash__(self):
  7. ... return hash(self.x)
  8. ... def __eq__(self, other):
  9. ... return (
  10. ... self.__class__ == other.__class__ and
  11. ... self.x == other.x
  12. ... )
  13. >>> d = dict()
  14. >>> s = set()
  15. >>> c = C(1)
  16. >>> d[c] = 42
  17. >>> s.add(c)
  18. >>> d, s
  19. ({C(1): 42}, {C(1)})
  20. >>> c in s and c in d # c is in both!
  21. True
  22. >>> c.x = 2
  23. >>> c in s or c in d # c is in neither!?
  24. False
  25. >>> d, s
  26. ({C(2): 42}, {C(2)}) # but...it"s right there!

在我们没有修改对象的属性时(c.x=2)之前,所有行为都符合预期。当我们通过c.x=2时修改属性后,执行c in s or c in d返回False,但是内容却是修改后的,是不是很奇怪。这也就解释了为什么str、tuple是可Hash的,而list和dict是不可hash的。

因此我们可以得出结论,如果两个对象相等的话,那它们的hash值必然也是相等的。

总结

讲了这么多有什么用了。

当我们遇到unhashable type这个异常时,我们能够知道为什么报这个错误。

如果定义了一个可比较的对象,那么最好保证对象hash值相关的属性在生命周期内不能发生改变,不然会发生意想不到的错误。

转载自我的博客捕蛇者说

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41048.html

相关文章

  • Python无缝集成----基本特殊方法.(Mastering Objecting-orient

    摘要:第二章与的无缝集成基本特殊方法笔记中有有一些特殊的方法它们允许我们的类和更好的集成和方法通常方法表示的对象对用户更加友好这个方法是有对象的方法实现的什么时候重写跟非集合对象一个不包括其他集合对象的简单对象这类对象格式通常不会特别复 第二章 与Python的无缝集成----基本特殊方法.(Mastering Objecting-oriented Python 笔记) python中有有一...

    iamyoung001 评论0 收藏0
  • [译] 与 Python 无缝集成——基本特殊方法 2

    摘要:有三个用例通过和方法定义相等性检测和值不可变对象对于有些无状态对象,例如这些不能被更新的类型。请注意,我们将为不可变对象定义以上两个。 注:原书作者 Steven F. Lott,原书名为 Mastering Object-oriented Python __hash__() 方法 内置hash()函数会调用给定对象的__hash__()方法。这里hash就是将(可能是复杂的)值缩减...

    hzc 评论0 收藏0
  • python学习笔记 序列

    内置序列 容器序列 list, tuple, collections.deque等这些序列能存放不同类型的数据 扁平序列 str, byte, bytearray, memoryview, array.array, 这些序列只能容纳一种类型数据 以上,容器序列存放的是他们所含任意类型对象的引用,而扁平序列存放的是值而不是引用 列表(list)是最基础也是最重要的序列类型 列表推导 >>> symb...

    godiscoder 评论0 收藏0
  • Python is 和 == 弄懂了吗?

    摘要:中对象包含的三个基本要素,分别是身份标识数据类型值对象之间比较是否相等可以用,也可以用。和都是对对象进行比较判断作用的,但对对象比较判断的内容并不相同。是标准操作符中的比较操作符,用来比较判断两个对象的值是否相等。 showImg(https://segmentfault.com/img/remote/1460000018591895?w=601&h=203); 在Python中一切都...

    zhongmeizhi 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<