[Image] اكتشاف صورة شبه مكررة


Answers

أود أن أوصي النظر في الابتعاد عن مجرد استخدام الرسم البياني رغب.

ويمكن الحصول على هضم أفضل من الصورة الخاصة بك إذا كنت تأخذ مويجة هار 2D من الصورة (أسهل بكثير مما يبدو، لها مجرد الكثير من المتوسط ​​وبعض الجذور التربيعية المستخدمة لوزن المعاملات الخاصة بك) وتحتفظ فقط k أكبر والمعاملات المرجحة في المويجة كمتجه متفرق، وتطبيعه، وحفظ ذلك لتقليل حجمه. يجب عليك إعادة تنظيم رغ و B باستخدام الأوزان الإدراكية مسبقا أو على الأقل أوصي التحول إلى يق (أو يكوسغ، لتجنب الضوضاء تكميم) حتى تتمكن من عينة المعلومات التلون مع انخفاض أهمية.

يمكنك الآن استخدام المنتج نقطة من اثنين من هذه ناقلات تطبيع متفرق كمقياس للتشابه. سوف أزواج الصورة مع أكبر نقطة المنتجات ستكون مشابهة جدا في هيكل. هذا له فائدة من أن تكون مقاومة قليلا لتغيير الحجم، هوى التحول والعلامة المائية، ويجري حقا سهلة لتنفيذ والتعاقد.

يمكنك التداول خارج التخزين والدقة عن طريق زيادة أو تقليل k.

الفرز من قبل نتيجة رقمية واحدة سيكون من المستعصية على هذا النوع من مشكلة التصنيف. إذا كنت تفكر في ذلك فإنه يتطلب الصور لتكون قادرة على 'التغيير' على طول محور واحد، لكنها لا تفعل ذلك. هذا هو السبب في أنك بحاجة إلى متجه من الميزات. في حالة الموجة هار لها تقريبا حيث تحدث الانقطاعات الحادة في الصورة. يمكنك حساب المسافة بين الصور الزوجية، ولكن بما أن كل ما عليك هو مقياس المسافة ليس للترتيب الخطي أي طريقة للتعبير عن "مثلث" من 3 صور كلها بعيدة بالتساوي. (أي التفكير في صورة خضراء، وهي صورة باللون الأحمر وصورة باللون الأزرق.)

وهذا يعني أن أي حل حقيقي لمشكلتك سوف تحتاج O (n ^ 2) العمليات في عدد من الصور لديك. في حين أنه إذا كان من الممكن أن خطي التدبير، هل يمكن أن تتطلب فقط O (ن لوغ ن)، أو O (ن) إذا كان هذا الإجراء مناسبا، على سبيل المثال، نوع الجذر. ومع ذلك، لا تحتاج إلى إنفاق O (n ^ 2) لأنه في الممارسة العملية لا تحتاج إلى فرز من خلال مجموعة كاملة، تحتاج فقط للعثور على الأشياء التي هي أقرب من بعض العتبة. لذلك من خلال تطبيق واحدة من عدة تقنيات لتقسيم مساحة متجهات متفرق الخاص بك يمكنك الحصول على أسرع بكثير أسيمبتوتيكش 'العثور على لي من الصور التي هي أكثر مماثلة من عتبة معينة' مشكلة من مقارنة ساذجة كل صورة ضد كل صورة، مما يتيح لك ما من المحتمل أن تحتاج ... إن لم يكن بالضبط ما طلبته.

على أي حال، لقد استخدمت هذا قبل بضع سنوات إلى تأثير جيد شخصيا عند محاولة تقليل عدد من القوام مختلفة كنت تخزين، ولكن كان هناك أيضا الكثير من الضوضاء البحث في هذا الفضاء تبين فعاليتها (وفي هذه الحالة مقارنة إلى شكل أكثر تعقيدا من تصنيف المدرج الإحصائي):

http://www.cs.princeton.edu/cass/papers/spam_ceas07.pdf

إذا كنت بحاجة إلى دقة أفضل في الكشف، يمكن استخدام خوارزميات مينهاش و تف-إدف مع الموجة هار (أو الرسم البياني) للتعامل مع تعديلات أكثر قوة:

http://cmp.felk.cvut.cz/~chum/papers/chum_bmvc08.pdf

وأخيرا، لدى ستانفورد بحثا عن الصور يستند إلى متغير أكثر غرابة من هذا النوع من النهج، استنادا إلى إجراء المزيد من ميزة الاستخراج من الموجات للعثور على أجزاء مدورة أو مقطعة من الصور، وما إلى ذلك، ولكن ذلك ربما يذهب إلى أبعد من مقدار العمل الذي 'د تريد أن تفعل.

http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi

Question

ما هي طريقة سريعة لفرز مجموعة معينة من الصور عن طريق التشابه مع بعضها البعض.

في هذه اللحظة لدي نظام يقوم بتحليل الرسم البياني بين صورتين، ولكن هذه عملية مكلفة للغاية ويبدو مبالغا فيه جدا.

على النحو الأمثل أنا أبحث عن خوارزمية من شأنها أن تعطي كل صورة على درجة (على سبيل المثال على عدد صحيح، مثل رغب متوسط) وأنا يمكن أن مجرد فرز بهذه النتيجة. عشرات متطابقة أو عشرات بجانب بعضها البعض هي التكرارات المحتملة.

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994 

رغب متوسط ​​لكل صورة تمتص، هل هناك شيء مشابه؟




الصورة لديها العديد من الميزات، لذلك إلا إذا كنت تضييق نفسك إلى واحد، مثل متوسط ​​السطوع، كنت تتعامل مع مساحة مشكلة ن الأبعاد.

إذا طلبت منك تعيين عدد صحيح واحد إلى مدن العالم، حتى أتمكن من معرفة أي منها قريبة، فإن النتائج لن تكون كبيرة. يمكنك، على سبيل المثال، اختيار المنطقة الزمنية كعدد صحيح واحد والحصول على نتائج جيدة مع مدن معينة. ومع ذلك، فإن مدينة بالقرب من القطب الشمالي ومدينة أخرى بالقرب من القطب الجنوبي يمكن أن تكون أيضا في نفس المنطقة الزمنية، على الرغم من أنها في الطرف المقابل من الكوكب. إذا كنت تتيح لك استخدام اثنين من الأعداد الصحيحة، هل يمكن الحصول على نتائج جيدة جدا مع خطوط الطول والعرض. المشكلة هي نفسها لتشابه الصورة.

كل ما قال، هناك خوارزميات تحاول تجميع صور مماثلة معا، وهو ما تطلبه بشكل فعال. وهذا ما يحدث عند اكتشاف الوجه مع بيكاسا. حتى قبل تحديد أي وجوه، فإنه يجمع بعضها البعض معا بحيث أنه من السهل أن تذهب من خلال مجموعة من وجوه مماثلة وإعطاء معظمهم من نفس الاسم.

وهناك أيضا تقنية تسمى تحليل مكون المبدأ، والذي يتيح لك تقليل البيانات ن الأبعاد إلى أي عدد أصغر من الأبعاد. لذلك صورة مع ن ميزات يمكن تخفيضها إلى ميزة واحدة. ومع ذلك، هذا لا يزال ليس أفضل نهج لمقارنة الصور.




أحد الحلول هو إجراء مقارنة رمز / رسس على كل زوج من الصور المطلوبة لأداء نوع فقاعة. ثانيا، يمكنك إجراء ففت على كل صورة والقيام ببعض المحاور المتوسط ​​لاسترداد عدد صحيح واحد لكل صورة التي يمكنك استخدامها كدليل لفرز حسب. قد تفكر في القيام بأي مقارنة على حجم (25٪، 10٪) نسخة من الأصل اعتمادا على كيفية صغيرة الفرق الذي اخترت تجاهل وكم السرعة المطلوبة. واسمحوا لي أن أعرف إذا كانت هذه الحلول مثيرة للاهتمام، ويمكننا مناقشة أو يمكنني تقديم نموذج التعليمات البرمجية.




عليك أن تقرر ما هو "مماثل". تناقض؟ مسحة؟

هي صورة "مماثلة" لنفس الصورة رأسا على عقب؟

أراهن أنك يمكن أن تجد الكثير من "المكالمات وثيقة" عن طريق كسر الصور تصل إلى قطع 4x4 والحصول على متوسط ​​اللون لكل خلية الشبكة. سيكون لديك ستة عشر درجة لكل صورة. للحكم على التشابه، كنت مجرد القيام بمجموع مربعات من الاختلافات بين الصور.

أنا لا أعتقد أن تجزئة واحدة المنطقي، إلا إذا كان ضد مفهوم واحد مثل هوى، أو السطوع، أو التباين.

إليك فكرتك:

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994

أولا وقبل كل شيء، أنا ذاهب لتفترض هذه هي الأرقام العشرية التي هي R * (2 ^ 16) + G * (2 ^ 8) + B، أو شيء من هذا القبيل. ومن الواضح أن هذا ليس جيدا لأن الأحمر هو مرجح بشكل غير معقول.

الانتقال إلى الفضاء هسف سيكون أفضل. هل يمكن أن تنتشر بت من هسف خارج في التجزئة، أو هل يمكن أن مجرد تسوية H أو S أو V بشكل فردي، أو هل يمكن أن يكون ثلاثة تجزئة لكل صورة.

شيء اخر. إذا كنت لا الوزن R، G، و B. الوزن الأخضر أعلى، ثم الأحمر، ثم الأزرق لتتناسب مع حساسية بصرية الإنسان.