c++ لماذا يجب علي استخدام مؤشر بدلاً من الكائن نفسه؟




pointers c++11 (18)

A pointer directly references the memory location of an object. Java has nothing like this. Java has references that reference the location of object through hash tables. You cannot do anything like pointer arithmetic in Java with these references.

To answer your question, it's just your preference. I prefer using the Java-like syntax.

أنا قادم من خلفية جافا وبدأت العمل مع الكائنات في C ++. ولكن الشيء الوحيد الذي حدث لي هو أن الناس غالباً ما يستخدمون المؤشرات للأشياء بدلاً من الأشياء نفسها ، على سبيل المثال هذا الإعلان:

Object *myObject = new Object;

بدلا من:

Object myObject;

أو بدلاً من استخدام دالة ، لنفترض testFunc() ، على testFunc() :

myObject.testFunc();

علينا أن نكتب:

myObject->testFunc();

لكن لا أستطيع معرفة لماذا يجب أن نفعلها بهذه الطريقة. أنا أفترض أن لها علاقة بالكفاءة والسرعة لأننا نحصل على الوصول المباشر إلى عنوان الذاكرة. هل انا على حق؟


لكن لا أستطيع معرفة لماذا يجب أن نستخدمها هكذا؟

سأقارن كيف يعمل داخل جسم الوظيفة ، إذا كنت تستخدم:

Object myObject;

داخل وظيفة ، سيتم تدمير myObject الخاص بك مرة واحدة بمجرد عودة هذه الوظيفة. لذلك هذا مفيد إذا كنت لا تحتاج إلى كائن خارج وظيفتك. سيتم وضع هذا الكائن على مكدس مؤشر الترابط الحالي.

إذا كتبت داخل جسم الوظيفة:

 Object *myObject = new Object;

ثم لن تحصل على إتلاف كائن فئة المشار إليها myObject بمجرد انتهاء وظيفة ، والتخصيص في كومة الذاكرة المؤقتة.

الآن إذا كنت مبرمج جافا ، فإن المثال الثاني أقرب إلى كيفية عمل تخصيصات الكائنات تحت جافا. هذا الخط: Object *myObject = new Object; يعادل جافا: Object myObject = new Object(); . الفرق هو أنه في ظل java myObject سوف تحصل على جمع القمامة ، بينما تحت C ++ لن يتم تحريرها ، يجب عليك في مكان ما الاتصال بصراحة `حذف myObject ؛ ' وإلا سوف إدخال تسرب الذاكرة.

نظرًا لأن c ++ 11 يمكنك استخدام طرق آمنة للتوزيعات الديناميكية: new Object ، عن طريق تخزين القيم في shared_ptr / unique_ptr.

std::shared_ptr<std::string> safe_str = make_shared<std::string>("make_shared");

// since c++14
std::unique_ptr<std::string> safe_str = make_unique<std::string>("make_shared"); 

أيضًا ، يتم تخزين الكائنات في حاويات كثيرة جدًا ، مثل map-s أو vector-s ، وستقوم تلقائيًا بإدارة عمر الكائنات الخاصة بك.


Well the main question is Why should I use a pointer rather than the object itself? And my answer, you should (almost) never use pointer instead of object, because C++ has references , it is safer then pointers and guarantees the same performance as pointers.

Another thing you mentioned in your question:

Object *myObject = new Object;

كيف يعمل؟ It creates pointer of Object type, allocates memory to fit one object and calls default constructor, sounds good, right? But actually it isn't so good, if you dynamically allocated memory (used keyword new ), you also have to free memory manually, that means in code you should have:

delete myObject;

This calls destructor and frees memory, looks easy, however in big projects may be difficult to detect if one thread freed memory or not, but for that purpose you can try shared pointers , these slightly decreases performance, but it is much easier to work with them.

And now some introduction is over and go back to question.

You can use pointers instead of objects to get better performance while transferring data between function.

Take a look, you have std::string (it is also object) and it contains really much data, for example big XML, now you need to parse it, but for that you have function void foo(...) which can be declarated in different ways:

  1. void foo(std::string xml); In this case you will copy all data from your variable to function stack, it takes some time, so your performance will be low.
  2. void foo(std::string* xml); In this case you will pass pointer to object, same speed as passing size_t variable, however this declaration has error prone, because you can pass NULL pointer or invalid pointer. Pointers usually used in C because it doesn't have references.
  3. void foo(std::string& xml); Here you pass reference, basically it is the same as passing pointer, but compiler does some stuff and you cannot pass invalid reference (actually it is possible to create situation with invalid reference, but it is tricking compiler).
  4. void foo(const std::string* xml); Here is the same as second, just pointer value cannot be changed.
  5. void foo(const std::string& xml); Here is the same as third, but object value cannot be changed.

What more I want to mention, you can use these 5 ways to pass data no matter which allocation way you have chosen (with new or regular ).

Another thing to mention, when you create object in regular way, you allocate memory in stack, but while you create it with new you allocate heap. It is much faster to allocate stack, but it is kind a small for really big arrays of data, so if you need big object you should use heap, because you may get , but usually this issue is solved using STL containers and remember std::string is also container, some guys forgot it :)


You shouldn't . People (many people, sadly) write it out of ignorance.

Sometimes dynamic allocation has its place but, in the examples you give, it is wrong .

If you want to think about efficiency, then this is worse , because it introduces indirection for no good reason. This sort of programming is slower and more error-prone .


Let's say that you have class A that contain class B When you want to call some function of class B outside class A you will simply obtain a pointer to this class and you can do whatever you want and it will also change context of class B in your class A

But be careful with dynamic object


هناك العديد من الإجابات الممتازة على هذا السؤال ، بما في ذلك حالات الاستخدام الهامة للإعلانات المتقدمة ، تعدد الأشكال إلخ. لكني أشعر أن جزءًا من "روح" سؤالك لا يتم الإجابة عليه - أي ما تعنيه الجمل المختلفة عبر جافا و C ++.

دعونا نفحص الوضع الذي يقارن بين اللغتين:

جافا:

Object object1 = new Object(); //A new object is allocated by Java
Object object2 = new Object(); //Another new object is allocated by Java

object1 = object2; 
//object1 now points to the object originally allocated for object2
//The object originally allocated for object1 is now "dead" - nothing points to it, so it
//will be reclaimed by the Garbage Collector.
//If either object1 or object2 is changed, the change will be reflected to the other

أقرب ما يعادل هذا ، هو:

C ++:

Object * object1 = new Object(); //A new object is allocated on the heap
Object * object2 = new Object(); //Another new object is allocated on the heap
delete object1;
//Since C++ does not have a garbage collector, if we don't do that, the next line would 
//cause a "memory leak", i.e. a piece of claimed memory that the app cannot use 
//and that we have no way to reclaim...

object1 = object2; //Same as Java, object1 points to object2.

لنرى طريقة C ++ البديلة:

Object object1; //A new object is allocated on the STACK
Object object2; //Another new object is allocated on the STACK
object1 = object2;//!!!! This is different! The CONTENTS of object2 are COPIED onto object1,
//using the "copy assignment operator", the definition of operator =.
//But, the two objects are still different. Change one, the other remains unchanged.
//Also, the objects get automatically destroyed once the function returns...

أفضل طريقة للتفكير في ذلك - أكثر أو أقل - يعالج Java (ضمنيًا) مؤشرات إلى كائنات ، بينما قد يتعامل C ++ مع أي من المؤشرات إلى الكائنات أو الكائنات نفسها. توجد استثناءات لهذا - على سبيل المثال ، إذا قمت بتعريف أنواع Java "بدائية" ، فهي قيم فعلية يتم نسخها وليس مؤشرات. وبالتالي،

جافا:

int object1; //An integer is allocated on the stack.
int object2; //Another integer is allocated on the stack.
object1 = object2; //The value of object2 is copied to object1.

ومع ذلك ، فإن استخدام المؤشرات ليس بالضرورة الطريقة الصحيحة أو الخاطئة للتعامل مع الأشياء ؛ ومع ذلك فقد غطت الإجابات الأخرى ذلك بشكل مرض. الفكرة العامة هي أنه في C ++ لديك الكثير من السيطرة على عمر الأشياء ، وعلى المكان الذي سيعيشون فيه.

خذ نقطة المنزل - Object * object = new Object() بناء هو في الواقع ما هو أقرب إلى semantics Java (أو C # لهذا الأمر) النموذجي.


يمنحك C ++ ثلاث طرق لتمرير كائن: بواسطة المؤشر أو حسب المرجع أو حسب القيمة. جاوة تحد لك مع الأخير (الاستثناء الوحيد هو الأنواع البدائية مثل int ، boolean الخ). إذا كنت تريد استخدام C ++ ليس فقط مثل لعبة غريبة ، فمن الأفضل لك أن تعرف الفرق بين هذه الطرق الثلاثة.

تدّعي جافا أنه لا توجد مشكلة من هذا القبيل مثل "من ومتى يجب تدمير هذا؟". الجواب هو: جامع القمامة ، عظيم ونبيل. ومع ذلك ، فإنه لا يمكن توفير حماية 100 ٪ ضد تسرب الذاكرة (نعم ، يمكن للجافا تسرب الذاكرة ). في الواقع ، يمنحك GC شعورًا زائفًا بالأمان. كلما كبرت سيارات الدفع الرباعي الخاصة بك ، زاد طول طريقك إلى المخفر.

يتركك C ++ وجهًا لوجه مع إدارة دورة حياة الكائن. حسنا ، هناك وسائل للتعامل مع ذلك (عائلة المؤشرات الذكية ، QObject في كيو تي وهلم جرا) ، ولكن أيا منها لا يمكن أن تستخدم في طريقة "النار وننسى" مثل GC: يجب عليك أن تأخذ في الاعتبار دائما التعامل مع الذاكرة. لا يجب أن تهتم بتدمير أي شيء فحسب ، بل يجب عليك أيضًا تجنب تدمير نفس الكائن أكثر من مرة.

لا خائف حتى الآن؟ طيب: مراجع دورية - تعامل معهم بنفسك ، الإنسان. وتذكر: قتل كل كائن على وجه التحديد مرة واحدة ، ونحن C ++ runtimes لا يحبون أولئك الذين تعبث مع الجثث ، وترك الأموات وحدها.

لذا ، عد إلى سؤالك.

عندما تقوم بتمرير الكائن حول القيمة ، وليس بالمؤشر أو بالرجوع ، فإنك تقوم بنسخ الكائن (الكائن بالكامل ، سواء أكان زوجًا من البايتات أو تفريغ قاعدة بيانات ضخمة - فأنت ذكي بما يكفي لرعايتك لتجنب الأخير ، أو " هل أنت؟) في كل مرة تفعل فيها "=". وللوصول إلى أعضاء الكائن ، استخدم "." (نقطة).

عندما تقوم بتمرير الكائن بواسطة المؤشر ، تقوم بنسخ عدد قليل من وحدات البايت (4 على أنظمة 32 بت ، 8 على أنظمة 64 بت) ، وهي - عنوان هذا الكائن. ولإظهار ذلك للجميع ، يمكنك استخدام هذا المشغل "-" عند الدخول إلى الأعضاء. أو يمكنك استخدام تركيبة "*" و ".".

عندما تستخدم المراجع ، تحصل على المؤشر الذي يدعي أنه قيمة. إنه مؤشر ، ولكن يمكنك الوصول إلى الأعضاء من خلال ".".

ولتفجير عقلك مرة أخرى: عندما تعلن عن عدة متغيرات مفصولة بفواصل ، ثم (مشاهدة اليدين):

  • النوع معطى للجميع
  • القيمة / المؤشر / معدل التعديل هو فرد

مثال:

struct MyStruct
{
    int* someIntPointer, someInt; //here comes the surprise
    MyStruct *somePointer;
    MyStruct &someReference;
};

MyStruct s1; //we allocated an object on stack, not in heap

s1.someInt = 1; //someInt is of type 'int', not 'int*' - value/pointer modifier is individual
s1.someIntPointer = &s1.someInt;
*s1.someIntPointer = 2; //now s1.someInt has value '2'
s1.somePointer = &s1;
s1.someReference = s1; //note there is no '&' operator: reference tries to look like value
s1.somePointer->someInt = 3; //now s1.someInt has value '3'
*(s1.somePointer).someInt = 3; //same as above line
*s1.somePointer->someIntPointer = 4; //now s1.someInt has value '4'

s1.someReference.someInt = 5; //now s1.someInt has value '5'
                              //although someReference is not value, it's members are accessed through '.'

MyStruct s2 = s1; //'NO WAY' the compiler will say. Go define your '=' operator and come back.

//OK, assume we have '=' defined in MyStruct

s2.someInt = 0; //s2.someInt == 0, but s1.someInt is still 5 - it's two completely different objects, not the references to the same one

There are many excellent answers already, but let me give you one example:

I have an simple Item class:

 class Item
    {
    public: 
      std::string name;
      int weight;
      int price;
    };

I make a vector to hold a bunch of them.

std::vector<Item> inventory;

I create one million Item objects, and push them back onto the vector. I sort the vector by name, and then do a simple iterative binary search for a particular item name. I test the program, and it takes over 8 minutes to finish executing. Then I change my inventory vector like so:

std::vector<Item *> inventory;

...and create my million Item objects via new. The ONLY changes I make to my code are to use the pointers to Items, excepting a loop I add for memory cleanup at the end. That program runs in under 40 seconds, or better than a 10x speed increase. EDIT: The code is at http://pastebin.com/DK24SPeW With compiler optimizations it shows only a 3.4x increase on the machine I just tested it on, which is still considerable.


Object *myObject = new Object;

Doing this will create a reference to an Object (on the heap) which has to be deleted explicitly to avoid memory leak .

Object myObject;

Doing this will create an object(myObject) of the automatic type (on the stack) that will be automatically deleted when the object(myObject) goes out of scope.


One reason for using pointers is to interface with C functions. Another reason is to save memory; for example: instead of passing an object which contains a lot of data and has a processor-intensive copy-constructor to a function, just pass a pointer to the object, saving memory and speed especially if you're in a loop, however a reference would be better in that case, unless you're using an C-style array.


من الناحية الفنية ، فهي قضية تخصيص الذاكرة ، ولكن هنا جانبان عمليان أكثر من ذلك. يتعلق الأمر بأمرين: 1) النطاق ، عندما تقوم بتعريف كائن بدون مؤشر ، لن تتمكن من الوصول إليه بعد حظر الكود الذي تم تعريفه به ، بينما إذا قمت بتعريف مؤشر بـ "جديد" فإنك can access it from anywhere you have a pointer to this memory until you call "delete" on the same pointer. 2) If you want to pass arguments to a function you want to pass a pointer or a reference in order to be more efficient. When you pass an Object then the object is copied, if this is an object that uses a lot of memory this might be CPU consuming (eg you copy a vector full of data). When you pass a pointer all you pass is one int (depending of implementation but most of them are one int).

Other than that you need to understand that "new" allocates memory on the heap that needs to be freed at some point. When you don't have to use "new" I suggest you use a regular object definition "on the stack".


"Necessity is the mother of invention." The most of important difference that I would like to point out is the outcome of my own experience of coding. Sometimes you need to pass objects to functions . In that case if your object is of a very big class then passing it as an object will copy its state (which you might not want ..AND CAN BE BIG OVERHEAD) thus resulting in overhead of copying object .while pointer is fixed 4 byte size (assuming 32 bit).Other reasons are already mentioned above...


في C ++ ، الكائنات الموجودة على المكدس (باستخدام Object object; عبارة ضمن كتلة) ستعيش فقط ضمن النطاق الذي يتم التصريح به. عند انتهاء كتلة التعليمات البرمجية ، يتم إتلاف الكائن المُعلن. بينما إذا قمت بتخصيص ذاكرة على كومة الذاكرة المؤقتة ، باستخدام Object* obj = new Object() ، فإنها تستمر في العيش في كومة الذاكرة المؤقتة حتى تقوم باستدعاء delete obj .

وأود أن إنشاء كائن على كومة عندما كنت ترغب في استخدام الكائن ليس فقط في كتلة من التعليمات البرمجية التي أعلنت / المخصصة لها.


I will include one important use case of pointer. When you are storing some object in the base class, but it could be polymorphic.

Class Base1 {
};

Class Derived1 : public Base1 {
};


Class Base2 {
  Base *bObj;
  virtual void createMemerObects() = 0;
};

Class Derived2 {
  virtual void createMemerObects() {
    bObj = new Derived1();
  }
};

So in this case you can't declare bObj as an direct object, you have to have pointer.


من المؤسف أنك ترى التوزيع الديناميكي في كثير من الأحيان. هذا يظهر فقط عدد المبرمجين السيئين ++ C هناك.

بمعنى من المعاني ، لديك سؤالان مجمعين في واحد. الأول هو متى يجب أن نستخدم التخصيص الديناميكي (باستخدام new )؟ والثاني هو متى يجب أن نستخدم المؤشرات؟

إن الرسالة المهمة في المنزل هي أنه يجب عليك دائمًا استخدام الأداة المناسبة للمهمة . في معظم الحالات ، هناك شيء أكثر ملاءمة وأكثر أمانًا من أداء التوزيع الديناميكي اليدوي و / أو استخدام المؤشرات الأولية.

التخصيص الديناميكي

في سؤالك ، لقد أظهرت طريقتين لإنشاء كائن. والفرق الرئيسي هو مدة تخزين الكائن. عندما تفعل Object myObject; داخل كتلة ، يتم إنشاء الكائن مع مدة التخزين التلقائي ، مما يعني أنه سيتم تدميره تلقائيًا عندما يخرج عن نطاقه. عندما تقوم بعمل new Object() ، فإن الكائن به مدة تخزين ديناميكية ، مما يعني أنه يبقى على قيد الحياة حتى تقوم delete بشكل صريح. يجب عليك فقط استخدام مدة التخزين الديناميكية عندما تحتاج إليها. أي ، يجب دائمًا تفضيل إنشاء كائنات ذات مدة تخزين تلقائية عندما تستطيع ذلك .

الموقفان الرئيسيان اللذان قد تحتاج فيهما إلى تخصيص ديناميكي:

  1. تحتاج إلى أن يتجاوز الكائن النطاق الحالي - ذلك الكائن المحدد في ذلك الموقع المحدد للذاكرة ، وليس نسخة منه. إذا كنت معتادًا على نسخ / تحريك الكائن (معظم الوقت الذي يجب أن تكون عليه) ، يجب أن تفضل كائنًا تلقائيًا.
  2. تحتاج إلى تخصيص الكثير من الذاكرة ، والتي قد تملأ المكدس بسهولة. سيكون من اللطيف إذا لم يكن علينا أن نهتم بهذا (معظم الوقت لا يجب عليك) ، حيث أنه خارج نطاق سي ++ ، ولكن للأسف علينا التعامل مع واقع الأنظمة تتطور ل.

عندما تتطلب تخصيصًا ديناميكيًا ، يجب عليك تغليفه في مؤشر ذكي أو أي نوع آخر ينفذ RAII (مثل الحاويات القياسية). توفر المؤشرات الذكية دلالات الملكية للأجسام المخصصة ديناميكيًا. إلقاء نظرة على std::unique_ptr و std::shared_ptr ، على سبيل المثال. إذا كنت تستخدمها بشكل مناسب ، فيمكنك تقريبًا تجنب أداء إدارة الذاكرة الخاصة بك (راجع قاعدة الصفر ).

مؤشرات

ومع ذلك ، هناك استخدامات عامة أخرى للمؤشرات الأولية تتجاوز التخصيص الديناميكي ، ولكن معظمها يحتوي على بدائل يجب عليك تفضيلها. وكما كان الحال من قبل ، تفضل دائمًا البدائل ما لم تحتاج إلى مؤشرات بالفعل .

  1. تحتاج دلالات مرجعية . في بعض الأحيان ، ترغب في تمرير كائن باستخدام مؤشر (بغض النظر عن كيفية تخصيصه) لأنك تريد أن تقوم الوظيفة التي تمرر إليها بالوصول إلى ذلك الكائن المحدد (وليس نسخة منه). ومع ذلك ، في معظم الحالات ، يجب أن تفضل أنواع المراجع إلى المؤشرات ، لأن هذا هو ما تم تصميمه خصيصًا له. لاحظ أن هذا ليس بالضرورة حول تمديد عمر الكائن خارج النطاق الحالي ، كما هو الحال في الموقف 1 أعلاه. كما كان الأمر من قبل ، إذا كنت على ما يرام في تمرير نسخة من الكائن ، فإنك لا تحتاج إلى دلالات مرجعية.

  2. تحتاج تعدد الأشكال . يمكنك فقط استدعاء وظائف متعددة الأشكال (أي ، وفقًا لنوع الكائن الديناميكي) من خلال مؤشر أو مرجع إلى الكائن. إذا كان هذا هو السلوك الذي تحتاجه ، فأنت بحاجة إلى استخدام المؤشرات أو المراجع. مرة أخرى ، يجب أن يكون المفضل المراجع.

  3. تريد أن تمثل أن الكائن اختياري عن طريق السماح nullptr عند حذف الكائن. إذا كانت عبارة عن وسيطة ، فيجب أن تفضل استخدام الوسيطات الافتراضية أو الحمل الزائد للدالة. خلاف ذلك ، يجب أن تفضل استخدام نوع بتغليف هذا السلوك ، مثل std::optional (تم تقديمه في C ++ 17 - مع معايير C ++ السابقة ، استخدم boost::optional ).

  4. تريد فصل وحدات تجميع لتحسين وقت التحويل البرمجي . الخاصية المفيدة للمؤشر هي أنك تحتاج فقط إلى تصريح أمامي للنوع المشار إليه (لاستخدام الكائن فعليًا ، ستحتاج إلى تعريف). هذا يسمح لك بفك أجزاء من عملية التجميع الخاصة بك ، والتي قد تحسن بشكل كبير وقت التجميع. انظر لغة Pimpl .

  5. تحتاج إلى التفاعل مع مكتبة C أو مكتبة نمط C. في هذه المرحلة ، تضطر إلى استخدام المؤشرات الأولية. أفضل شيء يمكنك القيام به هو التأكد من السماح فقط لمؤشرات الخام الخاصة بك في آخر لحظة ممكنة. يمكنك الحصول على مؤشر أولي من مؤشر ذكي ، على سبيل المثال ، باستخدام الدالة العضو get . إذا قامت إحدى المكتبات بإجراء بعض التخصيصات لك والتي تتوقع منك إلغاء تخصيصها عن طريق مقبض ، يمكنك غالبًا التفاف المؤشر لأعلى في مؤشر ذكي باستخدام أداة تخصيص مخصصة تقوم بإلغاء تخصيص الكائن بشكل مناسب.


This is has been discussed at length, but in Java everything is a pointer. It makes no distinction between stack and heap allocations (all objects are allocated on the heap), so you don't realize you're using pointers. In C++, you can mix the two, depending on your memory requirements. Performance and memory usage is more deterministic in C++ (duh).


There are many benefits of using pointers to object -

  1. Efficiency (as you already pointed out). Passing objects to functions mean creating new copies of object.
  2. Working with objects from third party libraries. If your object belongs to a third party code and the authors intend the usage of their objects through pointers only (no copy constructors etc) the only way you can pass around this object is using pointers. Passing by value may cause issues. (Deep copy / shallow copy issues).
  3. if the object owns a resource and you want that the ownership should not be sahred with other objects.

In areas where memory utilization is at its premium , pointers comes handy. For example consider a minimax algorithm, where thousands of nodes will be generated using recursive routine, and later use them to evaluate the next best move in game, ability to deallocate or reset (as in smart pointers) significantly reduces memory consumption. Whereas the non-pointer variable continues to occupy space till it's recursive call returns a value.





c++11