python شرح - كيفية فرز قائمة من الكائنات على أساس سمة من الكائنات؟




counting sort (7)

لدي قائمة من كائنات Python التي أرغب في ترتيبها حسب سمة الكائنات نفسها. تبدو القائمة كما يلي:

>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
 <Tag: aes>, <Tag: ajax> ...]

يحتوي كل كائن على عدد:

>>> ut[1].count
1L

أحتاج لفرز القائمة حسب عدد التهم التنازلي.

لقد رأيت عدة طرق لهذا ، لكني أبحث عن أفضل الممارسات في بايثون.


Answers

يجب أن يلاحظ القراء أن المفتاح = الطريقة:

ut.sort(key=lambda x: x.count, reverse=True)

أسرع بعدة مرات من إضافة عوامل المقارنة الغنية إلى الكائنات. لقد فوجئت بقراءة هذا (صفحة 485 من "Python in a Nutshell"). يمكنك تأكيد ذلك عن طريق إجراء اختبارات على هذا البرنامج الصغير:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

وتبين الاختبارات التي أجريتها ضئيلة للغاية أن النوع الأول أكثر بطئًا من 10 مرات ، لكن الكتاب يقول إنه أبطأ بنحو 5 مرات بشكل عام. والسبب في قولهم يرجع إلى خوارزمية الفرز المتطورة للغاية المستخدمة في python ( timsort ).

لا يزال ، من الغريب جدا أن. sort (lambda) أسرع من .sort () القديمة. آمل أن يحددوا ذلك.


نهج وجوه المنحى

من الممارسات الجيدة جعل منطق فرز الكائنات ، إن أمكن ، خاصية من الطبقة بدلاً من دمجها في كل حالة يتطلب الأمر الطلب.

هذا يضمن التناسق ويزيل الحاجة إلى رمز النص المتداول.

كحد أدنى ، يجب عليك تحديد عمليات __lt__ و __lt__ لهذا العمل. ثم مجرد استخدام sorted(list_of_objects) .

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

الطريقة التي يمكن أن تكون أسرع ، خاصة إذا كانت قائمتك تحتوي على الكثير من السجلات ، هي استخدام operator.attrgetter("count") . ومع ذلك ، قد يعمل هذا على إصدار ما قبل المشغل من بيثون ، لذلك سيكون من الجيد أن يكون لديك آلية احتياطية. قد ترغب في القيام بما يلي ، ثم:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

يبدو إلى حد كبير مثل قائمة نماذج نموذج جانغو ORM.

لماذا لا فرزها على الاستعلام مثل هذا:

ut = Tag.objects.order_by('-count')

# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)

# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)

المزيد حول الفرز حسب المفاتيح »


from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)

def list_test (L):
    if   L is None  : print 'list is None'
    elif not L      : print 'list is empty'
    else: print 'list has %d elements' % len(L)

list_test(None)
list_test([])
list_test([1,2,3])

في بعض الأحيان يكون من الجيد اختبار None والفراغ بشكل منفصل لأن هاتين الحالتين مختلفتين. ينتج الرمز أعلاه الإخراج التالي:

list is None 
list is empty 
list has 3 elements

على الرغم من أنه لا شيء يستحق أن None هو كاذب. لذلك إذا كنت لا تريد فصل اختبار لـ None ، فلن تضطر إلى القيام بذلك.

def list_test2 (L):
    if not L      : print 'list is empty'
    else: print 'list has %d elements' % len(L)

list_test2(None)
list_test2([])
list_test2([1,2,3])

تنتج المتوقع

list is empty
list is empty
list has 3 elements




python sorting count