python - 関数 - referenced before assignment 意味




どのようにオブジェクトの属性に基づいてオブジェクトのリストをソートするのですか? (5)

オブジェクトの属性によって並べ替えるPythonオブジェクトのリストがあります。 リストは次のようになります。

>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
 <Tag: aes>, <Tag: ajax> ...]

各オブジェクトには数があります:

>>> ut[1].count
1L

私は、カウントの降順でリストをソートする必要があります。

私はこれについていくつかの方法を見てきましたが、私はPythonでベストプラクティスを探しています。


オブジェクト指向アプローチ

オブジェクトの並べ替えロジックを、該当する場合は、注文が必要な各インスタンスに組み込むのではなく、クラスのプロパティにすることをお勧めします。

これにより一貫性が保証され、定型コードの必要性が排除されます。

少なくともこれを動作さ__eq____lt__ __eq____lt__操作を指定する必要があります。 次にsorted(list_of_objects)使用します。

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

これは、Django ORMモデルのインスタンスのリストによく似ています。

なぜこのようなクエリでそれらをソートしないでください:

ut = Tag.objects.order_by('-count')

特にあなたのリストにたくさんのレコードがある場合は、 operator.attrgetter("count")を使うことです。 しかし、これはPythonのプリオペレータ版で実行される可能性があるため、フォールバックの仕組みを持たせるとよいでしょう。 あなたは次のことをしたいかもしれない:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

読者はkey =メソッドに注意する必要があります:

ut.sort(key=lambda x: x.count, reverse=True)

豊富な比較演算子をオブジェクトに追加するよりも何倍も高速です。 私はこれを読んで驚いた(「Python in a Nutshell」の485ページ)。 この小さなプログラムでテストを実行することでこれを確認できます:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

私の非常に少ないテストでは、最初のソートは10倍以上遅くなっていますが、本書では一般的には5倍程度しか遅くないと書かれています。 彼らが言う理由は、Python( timsort )で使われているソートアルゴリズムを高度に最適化するためです。

それでも、.sort(lambda)は普通の.sort()より高速です。 彼らはそれを修正したいと思う。


from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)




count