algorithm - العلامة/توصية تستند إلى الكلمات الرئيسية




machine-learning recommendation-engine (4)

إذا استطعت، تعقب نسخة من الاستخبارات الجماعية للبرمجة أوريلي، من قبل توبي سيغاران. هناك حل نموذج في ذلك بالضبط لهذه المشكلة (مع مجموعة كاملة من حقا، أشياء أخرى جيدة حقا).

أنا أتساءل ما الخوارزمية ستكون ذكية لاستخدام لعلامة مدفوعة التجارة الإلكترونية البيئة:

  • يحتوي كل عنصر على عدة علامات. أي:

    اسم العنصر: "ميتاليكا - الأسود ألبوم سد"، العلامات: "ميتاليكا"، "الأسود ألبوم"، "روك"، "الموسيقى"

  • كل مستخدم لديه العديد من العلامات والأصدقاء (المستخدمين الآخرين) ملزمة لهم. أي:

    اسم المستخدم: "تيستوي"، الاهتمامات: "بيثون"، "روك"، "ميتال"، "كومبيوتر-سسينس" فريندس: "testguy2"، "testguy3"

أنا بحاجة إلى تقديم توصيات لهؤلاء المستخدمين عن طريق التحقق من علامات الفائدة الخاصة بهم وتوليد توصيات بطريقة متطورة.

الأفكار:

  • ويمكن استخدام خوارزمية توصية هجين كما كل مستخدم لديه أصدقاء. (خليط من التعاونية + التوصيات القائمة على السياق).
  • ربما باستخدام علامات المستخدم، يمكن العثور على المستخدمين مماثلة (أقرانهم) لتوليد توصيات.

  • ربما مطابقة مباشرة العلامات بين المستخدمين والعناصر عبر العلامات.

أي اقتراح هو موضع ترحيب. أي مكتبة مقرها الثعبان هو أيضا موضع ترحيب وأنا سوف تفعل هذا المحرك التجريبي على لغة الثعبان.


مشكلتك مشابهة لمحركات توصيات المنتج، مثل موقع أمازون المدعوم بشكل جيد. هذه تستخدم خوارزمية التعلم يسمى قواعد الجمعية ، والتي تبني أساسا احتمال شرطي للمستخدم X شراء المنتج Y على أساس السمات المشتركة Z بين المستخدم والمنتج. وهناك الكثير من تولكيتس مفتوحة المصدر تنفيذ قواعد الجمعيات، مثل أورانج وويكا .


1) وزن العلامات الخاصة بك.

العلامات تقع في عدة مجموعات من الاهتمام:

  • علاماتي التي لا يشاركها أي من أصدقائي
  • علامات عدد من أصدقائي حصة، ولكن أنا لا
  • علاماتي التي يتم مشاركتها من قبل عدد من أصدقائي.

(في بعض الأحيان قد ترغب في النظر صديق من صديق علامات جدا، ولكن في تجربتي لم يكن الجهد يستحق ذلك. يمف.)

حدد جميع العلامات التي يملكها الشخص و / أو أصدقاءه في المصالح، وأرفق وزنا بالعلامات لهذا الشخص. إحدى الصيغ الممكنة البسيطة لعلامة الوسم هي

(tag_is_in_my_list) * 2 + (friends_with_tag)/(number_of_friends)

لاحظ السحر رقم 2، الأمر الذي يجعل رأيك بنفسك يستحق ضعف قدر من أن كل من أصدقائك وضعت معا. لا تتردد في تعديل :-)

2) الوزن البنود الخاصة بك

لكل عنصر يحتوي على أي من العلامات في قائمتك، ما عليك سوى إضافة كل القيم المرجحة للعلامات. قيمة أعلى = مزيد من الاهتمام.

3) تطبيق عتبة.

أبسط طريقة لإظهار المستخدم أعلى النتائج n .

وتطبق أنظمة أكثر تطورا أيضا العلامات المضادة (أي مواضيع غير الفائدة) وتفعل أشياء أخرى كثيرة، ولكنني وجدت هذه الصيغة البسيطة فعالة وسريعة.


وأود أن استخدام آلة بولتزمان مقيدة. يحصل حول مشكلة علامات مماثلة ولكن ليست متطابقة تماما بدقة.





recommendation-engine