گوگل مصنوعی ذہانت 'الفا گو زیرو' سیکھنے کے طریقہ پر بس دبائیں

یاد رکھیں (مبہم طور پر) آپ نے چلنا ، بات کرنا ، موٹر سائیکل چلانا ، یا ڈرائیو کرنا سیکھ لیا۔ یہ گندا اور غلطیوں سے بھرا ہوا تھا ، لیکن آپ نے جس مہارت کو اس طرح سیکھ لیا وہ قائم رہا۔ نظامِ زندگی کے باہر ، 'حقیقی زندگی کا تجربہ' لینے اور مصنوعی ذہانت کے ل stick چپچپا ، موافقت پذیر طرز عمل کی تیاری کے ل strong مضبوط کافی الگورتھم کی تشکیل مشکل ہے۔

ٹھیک ہے ، الفا گو زیرو نے ابھی کیا۔

'یہ ایک خالی سلیٹ سے شروع ہوتی ہے اور صرف اپنے آپ کو ، صرف خود کھیل سے ، اور بغیر کسی انسانی معلومات ، یا کسی انسانی اعداد و شمار ، خصوصیات یا مثال کے طور پر ، یا انسانوں کی مداخلت کے اعداد و شمار کا پتہ لگاتا ہے۔ ڈیپ مائنڈ کے پروفیسر ڈیوڈ سلور کا کہنا ہے کہ اس سے پہلے اصولوں سے گو کے کھیل کو کھیلنے کا پتہ چلتا ہے۔

اے آئی میں متعدد تکرار ہوئے ہیں ، ہر ایک ہوشیار اور پہلے سے کہیں زیادہ قابل۔ پچھلے ورژن میں الگورتھم کے ایک گروپ کے ساتھ پچھلے گیمز کا ایک بہت بڑا ڈیٹا بیس استعمال کیا گیا تھا جس نے اسے جیتنے کی طرف اشارہ کیا تھا۔ اس نقطہ نظر نے برتری حاصل کرنے والے عالمی چیمپیئن پروفیشنل گو پلیئر کی شکست کا باعث بنی۔ پوکر میں ، AI لائبریٹس نے حال ہی میں دنیا کے اعلی پوکر کھلاڑیوں کو تقریبا$ 2 ملین ڈالر کی مدد سے تیار کیا ، انسانی کھیل کے اعداد و شمار کی بجائے خود کھیل کے ذریعے بھی سیکھ کر۔

اب ، الفا گو کے اس تازہ ترین ورژن میں ، مصنوعی ذہانت کے پروگرام نے پڑھایا ہے خود کس طرح کھیلیں - کوئی انسانی پس منظر کے ساتھ کھیلنا ہے۔

شروع سے ہی - کھیل کے لاکھوں نقوشوں کو اپنے خلاف چلاتے ہوئے ، اس کو سیکھنے میں 40 دن لگے - شروع سے - خود کو ورلڈ چیمپیئن ورژن کو کیسے شکست دی۔ یہ نہ صرف گو کے لئے ، بلکہ یہ بھی ہے کہ نیا علم کس طرح دریافت ہوتا ہے ، واقعی ، کھیل کو تبدیل کرنے والا ہے۔ آپ کے ڈومین کی مہارت کتنی درست یا مکمل ہے؟ وہاں ہے بہت سارا مزید دریافت کرنے کے لئے ، الفا گو زیرو کے ساتھ سیکھنے کا یہ دلچسپ تجربہ ہمیں کیا بتا رہا ہے۔

'کے بارے میں یوٹیوب پوسٹ میں سلور کے مطابق ،' الفا گو کا خیال انسانوں کو باہر جانے اور شکست دینے کا نہیں ، بلکہ حقیقت میں یہ دریافت کرنا ہے کہ سائنس کا کیا مطلب ہے - تاکہ کسی پروگرام سے خود ہی یہ سیکھ سکے کہ علم کیا ہے '۔ کامیابی۔

الفا گو زیرو ڈیپ مائنڈ ٹیم اسے سب سے پہلے اصول ، 'ٹیبولا رسا' (خالی سلیٹ) کہتے ہیں۔

'اگر آپ حاصل کرسکتے ہیں ٹیبولا رسا سیکھتے ہوئے ، آپ کے پاس ایک ایجنٹ ہے جسے گو کسی دوسرے ڈومین پر جانے کے کھیل سے ٹرانسپلانٹ کیا جاسکتا ہے ، اور آپ جس کھیل میں ہو اس کی خصوصیات ، آپ ایک الگورتھم لے کر آتے ہیں جو اتنا عام ہے کہ اسے کہیں بھی لاگو کیا جاسکتا ہے ، 'وہ کہتے ہیں۔ . جب آپ تصور کو بڑھا دیتے ہیں تو یہ اشتعال انگیز خیال ہے۔ ذرا سوچئے کہ ہم مضبوط ، سیکھنے والے الگورتھم کے ایک سیٹ کے ساتھ کیا کرسکتے ہیں جو منظم طریقے سے سخت پریشانیوں سے نپٹ سکتے ہیں اور ہماری تہذیب کے اجتماعی علم سے زیادہ تیزی سے سیکھ سکتے ہیں۔ . . دنوں میں ، دہائیاں نہیں۔

سلور نے کہا ، اب الگ الگ بات ہے ، 'الگورتھم کمپیوٹنگ یا دستیاب ڈیٹا سے کہیں زیادہ اہمیت رکھتے ہیں'۔ ہم تنہا یہ معلوم کرتے ہیں کہ ہم کس طرح معروف دنیا میں توسیع کرتے ہیں۔ جبکہ الفا گو تقریبا hardware 25 ملین ڈالر ہارڈ ویئر میں چلاتا ہے - یہ بالکل ہلکا پھلکا نظام نہیں ہے - آپ جانتے ہو کہ اے آئی گرو طویل عرصے سے کلینر ، بہتر ڈیٹا سیٹ بنانے پر کام کر رہے ہیں۔ مصنوعی ذہانت کی درست تربیت کے ل Today آج ، بہت سے بڑے اعداد و شمار کے سیٹوں کو بہت زیادہ شور سمجھا جاتا ہے - خراب ڈیٹا سے بھرا ہوا۔ اگر AI اعداد و شمار سے سیکھ رہا ہے ، اور ڈیٹا خراب ہے ، تو یہ سیکھ نہیں سکتا ہے۔ بڑا مسئلہ.

کیا ہوگا اگر آپ کو صاف ڈیٹا کی ضرورت نہ ہو ، لیکن صرف تجربہ ہو ، اور مصنوعی ذہانت خود تربیت دے سکے؟

الفا گو زیرو میں یہ حیرت انگیز کارنامہ ہے۔ اگرچہ یہ کھیل کی حکمرانی پر مبنی دنیا میں ہے ، اس کی جسمانی قواعد سے کام کرنے والی ہر صنعت میں اس کے بڑے مضمرات ہیں۔ سوچئے کہ کیمسٹری ، ٹریفک ، حیاتیات ، فارماسولوجی ، سفر ، لاجسٹک اور مینوفیکچرنگ۔ اگر ہم قواعد کو اتنے لچکدار بنائیں کہ وہ وسیع تر تجربے سے کام کرسکیں ، اور اس قدر دشوار گزار ہیں کہ وہ ہمیشہ مضبوط مہارت پیدا کرتے ہیں جیسے الفا گو زیرو - تو پھر مصنوعی ذہانت کا حصول ممکن ہے جو نظام کو ماسٹر مائنڈ کرتا ہے۔ ان سسٹم کو باہر کے اعداد و شمار کی ضرورت نہیں ہوگی ، ڈیٹا صاف کرنے میں کوئی پریشانی نہیں ہوگی ، اور نہ ہی انسان میں دیئے گئے سست روی کی ضرورت ہے۔ اس کی وجہ یہ ہے کہ گوگل کی بنیادی کمپنی ، الفبیٹ ، مصنوعی ذہانت پر کمپنی سے شرط لگاتی ہے اور تیزی سے شرح پر مصنوعی ذہانت میں سرمایہ کاری کررہی ہے۔ (ایمیزون بھی اپنے تازہ ترین اے آئی حصول باڈی لیبز کی طرح مصنوعی ذہانت میں سرمایہ کاری کر رہا ہے۔)

ڈیپ مائنڈ پروفیسر ڈیوڈ سلور کا کہنا ہے کہ ، 'یہ حقیقت کہ ہم نے ایک پروگرام کو ایک اعلی سطحی کارکردگی کا حصول دیکھا ہے ... اس کا مطلب اب یہ ہونا چاہئے کہ ہم انسانیت کے لئے سب سے مشکل اور مؤثر مسائل سے نمٹنے کے لئے شروع کر سکتے ہیں۔'

اس پوسٹ کو یہ واضح کرنے کے لئے اپ ڈیٹ کیا گیا ہے کہ اے لیبریٹس نے حال ہی میں ایسی حکمت عملی استعمال کرتے ہوئے ٹاپ پوکر کھلاڑیوں کو شکست دی ہے جس میں انسانوں میں داخل ہونے والے اعداد و شمار کے بجائے خود کھیلنا شامل ہے۔