Zbiory

https://docs.python.org/3/library/stdtypes.html#set-types-set-frozenset

WPROWADZENIE

Zbiory są dostępne bez importu od Pythona 2.4. Są dwa rodzaje wbudowanych zbiorów: set (mutable) i frozenset (immutable, hashable). Konstrukcja zbiorów bazuje na doświadczeniach z modułem sets. Elementy zbioru muszą być hashowalne, tak jak klucze słowników. Jeżeli chcemy utworzyć zbiór zbiorów, to wewnętrzne zbiory muszą być klasy frozenset.

+------------------------------+--------------+--------------------------+
| Operacja                     | Równoważne   | Wynik                    |
+------------------------------+--------------+--------------------------+
| S = set() ; S = frozenset()  |              | zbiór pusty              |
| S = {1, 3, 4}                |              | tworzenie zbioru         |
| S = set(iterable)            |              | tworzenie zbioru         |
| S = frozenset(iterable)      |              | zbiór niezmienny         |
| S = {x**2 for x in iterable} |              | set comprehension        |
| len(S)                       |              | liczebność               |
| for item in S: pass          |              | iteracja                 |
| item in S                    |              | należenie do zbioru      |
| item not in S                |              | nienależenie do zbioru   |
| S1.issubset(S2)              | S1 <= S2     | czy S1 jest zawarty w S2 |
| S1.issuperset(S2)            | S1 >= S2     | czy S1 zawiera S2        |
| S1.union(S2)                 | S1 | S2      | suma zbiorów             |
| S1.union(S2, S3)             | S1 | S2 | S3 | suma zbiorów             |
| S1.intersection(S2)          | S1 & S2      | iloczyn zbiorów          |
| S1.intersection(S2, S3)      | S1 & S2 & S3 | iloczyn zbiorów          |
| S1.difference(S2)            | S1 - S2      | różnica zbiorów          |
| S1.difference(S2, S3)        | S1 - S2 - S3 | różnica zbiorów          |
| S1.symmetric_difference(S2)  | S1 ^ S2      | (S1-S2)|(S2-S1)          |
| S1.isdisjoint(S2)            |              | czy rozłączne            |
| S2 = S1.copy()               |              | shallow copy of S1       |
| S2 = set(S1)                 |              | shallow copy of S1       |
+------------------------------+--------------+--------------------------+

Operacje dostępne tylko dla zbiorów zmiennych, ponieważ zbiory mogą zmienić swój skład.

+------------------------------------+---------------+
| Operacja                           | Równoważne    |
+------------------------------------+---------------+
| S1.update(S2)                      | S1 |= S2      |
| S1.update(S2, S3)                  | S1 |= S2 | S3 |
| S1.intersection_update(S2)         | S1 &= S2      |
| S1.intersection_update(S2, S3)     | S1 &= S2 & S3 |
| S1.difference_update(S2)           | S1 -= S2      |
| S1.difference_update(S2, S3)       | S1 -= S2 | S3 |
| S1.symmetric_difference_update(S2) | S1 ^= S2      |
| S.add(item)                        |               |
| S.remove(item) [item musi należeć] |               |
| S.discard(item)                    |               |
| S.pop() [zbiór niepusty]           |               |
| S.clear() [zostanie pusty]         |               |
+------------------------------------+---------------+

Porównywanie dwóch zbiorów ma sens, gdy jeden zawiera się w drugim. W przeciwnym razie otrzymamy False. Zbiory nie implementują metody __cmp__().


# Konstrukcja: set(iterable)
# Budowanie zbioru z sekwencji.
X = set("alfa")
Y = set(["b", "e", "t", "a"])
print("{} {}".format(X, Y))
print("iloczyn {}".format(X & Y))
print("suma {}".format(X | Y))
print("różnica {}".format(X - Y))

# Konstrukcja: frozenset([iterable])
X = frozenset()       # zbiór pusty
X = frozenset([])     # zbiór pusty
X = frozenset(["b", "e", "t", "a"])
X = frozenset("beta")     # jw

# Przy mieszanych instancjach zbiorów wynik jest typu pierwszego.
X = frozenset("ab") | set("bc")   # wynik to frozenset
X = set("bc") | frozenset("ab")   # wynik to set

# Sprawdzanie: isinstance(x, (set, frozenset))
set('abc') == frozenset('abc')   # wynik to True

Zbiory można wykorzystać do odfiltrowania duplikatów z listy.


>>> L = [1, 2, 2, 2, 3, 3]
>>> set(L)
set([1, 2, 3])
>>> L = list(set(L))     # [1, 2, 3]
>>>

SET COMPREHENSION

Analogicznie do list i słowników od Pythona 2.7 występują zbiory składane.


# UWAGA {} oznacza pusty słownik, a set() to pusty zbiór.
>>> {1, 3, 1, 4, 5}   # równoważne set([1, 3, 1, 4, 5])
{1, 3, 1, 4, 5}   # set([1, 3, 4, 5]) w Py2.7
>>> {s for s in [1, 2, 1, 0]}   # set comprehension
{0, 1, 2}   # set([0, 1, 2]) w Py2.7
>>> {s**2 for s in range(10)}
{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}
>>> {s for s in [1, 2, 3] if s % 2}
{1, 3}
>>> {(i, j) for j in range(2) for i in range(3, 5)}
{(3, 0), (3, 1), (4, 1), (4, 0)}