آزمون تورینگ چیست؟ قسمت 1
آزمونتورینگ
آزمون تورینگ روشی برای سنجش میزان هوشمندی ماشین است. آزمون به این صورت انجام میگیرد که یک شخص به عنوان قاضی، با یک ماشین و یک انسان به گفتگو مینشیند، و سعی در تشخیص ماشین از انسان دارد. در صورتی که ماشین بتواند قاضی را به گونهای بفریبد که در قضاوت خود دچار اشتباه شود، توانسته است آزمون را با موفقیت پشت سر بگذارد.
برای اینکه تمرکز آزمون بر روی هوشمندی ماشین باشد، و نه توانایی آن در تقلید صدای انسان، مکالمه تنها از طریق متن و صفحه کلید و نمایشگر کامپیوتر صورت میگیرد.
آزمون تورینگ
تست تورینگ یک تست از توانایی ماشین است برای نمایش دادن رفتاری هوشمندانه شبیه به انسان. آزمون تورینگ در سال ۱۹۵۰ توسط آلن تورینگ،ریاضیدان انگلیسی مطرح گردید. از نظر تورینگ، پرسش «آیا ماشینها میتوانند تفکر کنند» بیمعنیتر از آن بود که بتوان پاسخ روشنی به آن داد. چرا که نمیتوان تعریف مشخصی برای تفکر ارائه داد. بنابراین تورینگ پرسش را به این گونه مطرح نمود: آیا میتوان ماشینی ساخت که آزمون تورینگ را پشت سر بگذارد؟
هم اکنون دو نسخهٔ مختلف از این آزمون وجود دارد: آزمون استاندارد تورینگ، و آزمون تقلید.
آزمون تقلید
در این آزمون، دو شخص با جنسیتهای متفاوت، از طریق یادداشت با شخص سومی که قاضی است گفتگو میکنند. قاضی این دو بازیکن را نمیبیند، و با پرسش و پاسخ سعی دارد تشخیص دهد کدام یک مرد و کدام یک زن هستند. نقش بازیکن اول این است که قاضی را به نحوی بفریبد که در تشخیص جنست آن دو اشتباه کند.
تورینگ نقش بازیکن فریبکار را به ماشین سپرد، و در صورتی که این ماشین موفق شود که قاضی را بفریبد، از آزمون موفق بیرون آمده است و میتوان آن را ماشین هوشمند نامید.
مشکلات آزمون تورینگ
آزمون تورینگ فرض میکند که انسانها میتوانند با مقایسهٔ میان رفتار ماشین و انسان، پی به میزان هوشمند بودن آن ببرند. به دلیل این فرض، و تعدادی پیش فرضهای دیگر، دانشمندان حوزهٔهوش مصنوعی صحت آزمون تورینگ را مورد تردید قرار دادند.
اولین نکتهای که مطرح میگردد این است که تعدادی از رفتارهای انسان هوشمندانه نیستند. به عنوان مثال، توانایی توهین به دیگران، یا اشتباههای تایپی مکرر هنگام نوشتن با صفحه کلید.
نکتهٔ دومی که به آن اشاره میگردد این است که بعضی از رفتارهای هوشمندانه، انسانی نیستند. به عنوان مثال، کامپیوترها بسیار سریعتر از انسان محاسبه میکنند.
تورینگ پیشنهاد داده است که ماشین میتواند به صورت اتفاقی در خروجی خود اشتباهاتی را وارد کند، یا مدت زمان زیادی را صرف محاسبات کرده و در انتها پاسخی اشتباه دهد که قاضی را بفریبد، تا «بازیکن» بهتری باشد.
آزمون تورینگ چیست و چه کاربردی دارد؟
آزمون تورینگ چیست؟
در سال 1950 آلنتورینگ در مقالهای با عنوان «ساز و کار رایانش و هوشمندی» برای نخستینبار آزمون تورینگ را به جهانیان معرفی کرد. به پیشنهاد تورینگ، این آزمون که میتوان به آسانی آن را اجرا کرد، مشخص میکند که آیا یک ماشین به حد کافی هوشمند است یا خیر. در نسخه ابتدایی تعریف شده توسط تورینگ یک انسان در نقش داور از طریق ترمینالی متنی با یک مجموعه از شرکتکنندگان که ترکیبی از انسانها و ماشینها هستند، ارتباط برقرار میکند. در صورتی که داور انسانی نتواند شرکتکننده ماشین را از شرکتکنندگان انسانی تشخیص دهد، آن ماشین از نظر تورینگ شایسته صفت هوشمند است.
توجه داشته باشید که لزومی ندارد ماشین به سؤالات مطرح شده توسط داور پاسخ صحیح دهد، بلکه تنها تقلید رفتار انسانی است که هوشمند بودن یا نبودن ماشین را مشخص میکند.
تورینگ مقاله مورد نظر را این گونه آغاز میکند: «من پیشنهاد میکنم که این پرسش را مد نظر قرار دهید: آیا ماشینها میتوانند فکر کنند؟» سپس از آنجا که تعریف دقیق تفکر بسیار مشکل است، تورینگ پیشنهاد میکند که این پرسش به گونه دیگری مطرح شود: «آیا قابل تصور است که کامپیوترهای دیجیتال بتوانند در بازی تقلید، عملکرد مناسبی از خود ارائه دهند؟» پرسشی که به گمان تورینگ دلیلی برای منفی بودن پاسخ آن وجود نداشت. در مورد شرایط دقیق آزمون تورینگ بحثهای زیادی مطرح است که باعث شده نسخههای مختلفی از این آزمون به وجود آید.
نکته اول شیوه انجام این آزمایش است که تقریباً همه اعتقاد دارند که نمیتوان تنها به یک آزمایش اتکا کرد و باید درصد موفقیت در تعداد زیادی آزمایش محاسبه شود. نکته بعدی در میزان اطلاعات پیش از آزمایش داور است. به عنوان مثال، برخی پیشنهاد کردهاند که لزومی ندارد داور بداند یکی از افراد درگیر در آزمایش کامپیوتر است و برخی دیگر اعتقاد دارند که مشکلی با دانستن این موضوع وجود ندارد چرا که در واقع آزمون تورینگ برای توانایی فریب دادن داور طراحی نشده بلکه صرفاً سنجش میزان توانایی ماشین در شبیهسازی رفتارهای انسانی مدنظر است.
در اینجا باید به نکته مهمی در رابطه با آزمون تورینگ اشاره کرد. تا قبل از ارائه آزمون تورینگ، دانشمندان فعال در زمینه علوم شناختی و هوش مصنوعی مشکلات فراوانی را برای تعریف دقیق هوشمندی و مشخصکردن اینکه چه زمانی میتوان یک فرآیند را تفکر نامید، تجربه میکردند. تورینگ که یک ریاضیدان خبره بود با ارائه آزمون تورینگ در واقع سعی داشت تا از دنیای تعاریف نادقیقی که هضم آن برای حوزههای دقیقی مانند علوم کامپیوتر مشکل بود، فاصله گرفته و معیاری مشخص برای میزان هوشمندی ماشینها ارائه کند. دانیل کلمنت دنت، دانشمند علوم شناختی و فیلسوف امریکایی در این رابطه میگوید: «هنگامي كه تورینگ، آزمون مورد نظر را برای هوشمندی ماشینها ارائه کرد، هدف وی بنا کردن پلتفرمی برای انجام تحقیقات علمی نبود بلکه وی آزمون تورینگ را به عنوان یک ختمالکلام برای بحثهای مورد نظر در آن زمان ارائه کرد.
در واقع، کلام اصلی تورینگ در مقابل کسانی که اصولاً تعریف هوشمندی برای ماشین را غیرقابل قبول میدانستند، این بود که: هر ماشینی که بتواند این آزمون را به صورت عادلانهای پشت سر بگذارد، قطعاً یک موجود هوشمند است و دیگر بحثی در این زمینه باقی نمیماند.» دنت سپس به بحث در مورد هوشمندی در قرن 17 توسط دکارت اشاره میکند و متذکر میشود که وی نیز روشی مشابه برای تعریف هوشمندی ارائه داده بود که براساس برقرارکردن یک مکالمه با موجود مورد نظر بنا شده بود. در نتیجه تورینگ ادعا نمیکند ماشینی که نتواند با ما به شکل درستی مکالمه برقرار کند هوشمند نیست، بلکه صرفاً ادعا دارد اگر ماشینی این توانایی را داشته باشد شکی در هوشمندی آن باقی نمیماند.
تلاشهای نیمه تمام
از اواسط دهه 1960 بسیاری از افراد فعال در زمینه هوش مصنوعی سعی کردند تا به ساخت ماشینهایی روی بیاورند که با در اختیار داشتن توانایی درک زبان انسان و استفاده از اطلاعات گنجانده شده در آنها، بتوانند به گذراندن آزمون تورینگ نزدیک شوند. جوزف وایزنباوم در 1966 برنامهای کامپیوتری با نام الیزا را معرفی کرد که یکی از نخستین نمونههای پردازش زبان طبیعی بود. این برنامه قادر بود تا یک مکالمه را با در اختیار داشتن کمترین اطلاعات ممکن نسبت به موضوع مورد بحث پیش ببرد. یکی از مشهورترین موارد پیادهسازی شده در الیزا، شبیهسازی با عنوان «دکتر» بود که سعی داشت تا نقش یک روانکاو را برای ماشین شبیهسازی کند.
پاسخهاي الیزا عموماً بسیار کلی بودند و برای تولید آنها از تکنیکهای موجود تطابق الگو در آن زمان استفاده میشد. وایزنباوم در 1976 در مقالهای با عنوان «قدرت کامپیوتر و استدلال انسان» اشاره کرد که بسیاری از افرادی که با اسکریپت «دکتر» کار کردهاند به زودی ارتباط عاطفی قوی با آن برقرار کردند، حتی اصرار داشتند که در هنگام کارکردن با برنامه در اتاق تنها گذاشته شوند. خود وایزنباوم اشاره کرده است که در طول سالهای استفاده از الیزا مواردی بوده که کاربران در تشخیص انسان نبودن الیزا با مشکل مواجه شدهاند یا حتی در آن ناکام ماندهاند. به طور کلی این دیدگاه که الیزا توانسته است آزمون تورینگ را پشت سر بگذارد در جامعه علمی هوش مصنوعی چندان طرفدار ندارد اما به طور حتم این قطعه کد نقش زیادی در پیشرفت شبیه ساختن برنامههای کامپیوتری به رفتارهای انسان ایفا کرد.
کنت کولبی در 1972 نمونهای جدیدتر از الیزا را با عنوان «پری» (PARRY) معرفی کرد که در واقع پیادهسازی رفتار یک بیمار شیزوفرنیک پارانویا بود. کمی بعد از معرفی پری، این ماشین در یک آزمایش واقعی قرار داده شد تا قدرت آن در گذراندن آزمون تورینگ مشخص شود. در این آزمایش گروهی از روانکاوان باتجربه ترکیبی از بیماران واقعی و نسخههای برنامه پری را از طریق یک تله پرینتر مورد بررسی قرار دادند. سپس از یک گروه روانکاو دیگر خواسته شد تا با مشاهده ریز مکالمات مشخص کنند که کدام مورد، مکالمه با ماشین و کدام یک مکالمه با انسان بوده است. در نهایت، روانکاوان گروه دوم تنها در 48 درصد موارد توانستند درست حدس بزنند؛ نتيجهاي که تقریباً مشابه سکه انداختن برای تعیین ماشین یا انسان بودن طرف مکالمه است! توسعه برنامههایی مانند الیزا و پری که در دسته کلی چت باتها قرار میگیرند هنوز هم در جای جای دنیا ادامه دارد. چنین برنامههایی که صرفاً قصد شبیهسازی یک مکالمه هوشمند را دارند عموماً از دانش خاصی برخوردار نیستند بلکه سعی میکنند تا با تکنیکهای زبانی و البته الگوریتمهای پیچیده، مکالمه را به شیوهای قابل قبول پیش ببرند؛ مکالمهای که لزوماً خروجی مفیدی برای کاربر ندارد.
چنین برنامههایی هر چند ممکن است در موارد خاصی حتی تا مرز گذراندن آزمون تورینگ نیز پیش روند، اما به دلیل نبود یک دانش ساختاری در درون سیستم، قلمرو بسیار محدودی دارند. تمرکز تحقیقات و نیروی انسانی متخصص حوزه هوش مصنوعی روی ساخت ماشینی که صرفاً بتواند به طریقی آزمون تورینگ را با موفقیت پشت سر گذارد، برای سالهای متمادی منجر به تحقیقاتی این چنینی شد که هر چند کسی در ارزش بسیار زیاد آن شکی ندارد، اما نمیتواند به عنوان بخشی از راهحل یک مسئله دنیای واقعی به کار رود.
آیا این هوشمندی است؟
در بیش از شصت سالی که آزمون تورینگ در حوزه هوش مصنوعی حضور داشته است، انتقادات مختلفی به آن وارد شده که بخش بزرگی از آنها بر این موضوع استوار بودهاند که آیا این آزمون معیار خوبی برای تشخیص هوشمندی یک سیستم است؟
به عنوان مثال، جان سیرل فیلسوف امریکایی در مقالهای با عنوان «ذهنها، مغزها و برنامهها» در سال1980 آزمایشی ذهنی با عنوان «اتاق چینی» را طراحی کرد که به تعریف هوشمندی مورد نظر حوزه هوش مصنوعی حمله میکند.
فرض کنید که شما یک برنامه در اختیار دارید که میتواند طوری رفتار کند که زبان چینی را میفهمد. این برنامه یک ورودی از کاراکترهای چینی را گرفته و براساس آنها خروجی متشکل از کاراکترهای چینی تولید میکند. همین طور فرض کنید که این برنامه آزمون تورینگ را با موفقیت پشت سر بگذارد. حال در اینجا یک پرسش بزرگ به وجود میآید : «آیا این ماشین بهراستي چینی میفهمد یا تنها میتواند فهم زبان چینی را شبیهسازی کند؟» سیرل بیان میکند که اگر وی در اتاقی، مقابل این ماشین قرار بگیرد، میتواند با واردکردن هر ورودی چینی در کامپیوتر و یادداشتکردن خروجی برنامه روی یک تکه کاغذ آزمون تورینگ را با موفقیت پشت سر بگذارد. وی سپس اشاره میکند که فرقی میان نقش ماشین در حالت اول و نقش وی در حالت دوم وجود ندارد و از آنجایی که وی یک کلمه چینی نمیفهمد، در نتیجه ماشین نیز درکی از زبان چینی ندارد. در نهایت وی نتیجه میگیرد که بدون درک شیوه عملکرد کامپیوتر و تنها از روی مشاهده رفتار آن نمیتوان نتیجه گرفت که کاری که ماشین انجام میدهد فکر کردن است.
دیدگاه جان سیرل از طرف دانشمندان علوم شناختی مورد انتقادات فراوانی قرار گرفته است. از جمله این انتقادات میتوان به این نکته اشاره کرد که ممکن است فرد به صورت خاص زبان چینی را نفهمد اما سیستم به صورت یک کل توانایی فهم زبان چینی را دارد و نمیتوان توانایی فهم انسان به عنوان بخشی از این سیستم را از کل جدا کرد. هر چند آزمایش «اتاق چینی» مورد انتقادات فراوانی قرار گرفته و نمیتواند به عنوان یک خطر جدی برای آزمون تورینگ تلقی شود، اما با مشاهده چنین دیدگاههایی کاملاً مشخص میشود که چرا پیادهسازی ایده آزمون تورینگ در دنیای واقعی تا این اندازه مشکل است.
دسته دیگری از انتقادات به این موضوع اشاره دارند که میزان تقلید از رفتارهای انسانی لزوماً معیار خوبی برای هوشمندی نیست. چراکه نه تمام رفتارهای انسانی هوشمندانه است و نه تمام رفتارهای هوشمندانه انسانی است. این که تا چه حد این جمله را قبول دارید، میتواند موضوع خوبی برای یک بحث فلسفی طولانی باشد و البته بعید است به نتیجه مشخصی برسد. به عنوان مثال، ابرکامپیوتر دیپبلو ساخت آیبیام را در نظر بگیرید که در دهه 1990 موفق شد گری کاسپاروف استاد مسلم شطرنج جهان را شکست دهد. دیپ بلو طبیعتاً نمیتواند در مکالمه با انسان همراهی کند اما به خوبی وی (حتی بهتر از او) شطرنج بازی میکند. آیا این ماشین کمتر از الیزا هوشمند است؟ جواب از نظر بسیاری خیر است. اما باز هم باید توجه داشت که تورینگ به هیچ عنوان ادعا نمیکند عدم تقلید از انسان به معنای عدم هوشمندی است.
این که آیا تقلید از رفتار انسان واقعاً نشاندهنده هوشمندی است یا خیر، هنوز مورد بحث و بررسی است. بهعبارتي، هنوز هم تعریف دقیقی برای هوشمندی در اختیار نداریم و همین موضوع باعث میشود تا نتوان در این مورد استدلال چندان قابل قبولی ارائه داد. به هر روی، ما امروز میدانیم که رفتار هوشمندانه و رفتار انسانی ممکن است لزوماً به یک معنی نباشند. همچنین آگاه هستیم که برای گذراندن آزمون تورینگ، آشنایی ماشین به جزئیات و قوانین زبان انسانی به همان اندازه اهمیت دارد که دانش و استدلال گنجانده شده در آن ارزشمند است. خبر نهچندان امیدوار کننده، این است که با وجود پیشرفتهای فراوان حوزه یادگیری زبان و زبانشناسی، فرآیند دقیقی که باعث میشود انسانها در یادگیری یک زبان به چنین درجهای از تبحر دستیابند، به طور دقیق برای دانشمندان مشخص نیست. حتی از تمام این موارد که بگذریم، مسئلهای بسیار مهمتر مطرح میشود و آن این است که آیا اصولاً گذراندن یا نگذراندن آزمون تورینگ تا این حد مسئله مهمی است؟ دنیای نوین هوش مصنوعی اعتقاد دارد که پاسخ این پرسش منفی است. در ادامه مقاله ميكوشيم تا تصویری از وضعیت آزمون تورینگ در دنیای امروز ترسیم کنيم.
وقتی انسان آنقدرها هم جذاب نیست
استیون لوی در سال 2010 در مقالهای با عنوان «انقلاب هوش مصنوعی آغاز شده است» نگاه متفاوتی را نسبت به دنیای هوش مصنوعی در روزگار نوین ارائه میدهد. نگاهی که البته لوی با بسیاری از صاحبنظران دیگر به اشتراک میگذارد. وی در ابتدا به سیستم اداره انبار Diapers.com که به صورت کامل توسط روباتها انجام میشود اشاره مختصری کرده و متذکر میشود که اداره این سیستم با سازماندهی فعلی برای انسانها تقریباً غیرممکن است. سپس ادامه میدهد «روباتهای به کار گرفته شده در این انبار خیلی باهوش نیستند. آنها توانایی حتی نزدیک به هوش انسانی را نیز در اختیار نداشته و بهطور قطعی نمیتوانند آزمون تورینگ را با موفقیت پشت سر بگذارند. اما آنها نمایانگر نگاه جدیدی در حوزه هوش مصنوعی هستند. هوش مصنوعی امروز تلاش نمیکند تا مغز را بازسازی کند. بلکه در مقابل این حوزه، از یادگیری ماشین، دیتاستهای عظیم، حسگرهاي پیشرفته و الگوریتمهای پیچیده استفاده کرده تا کارهای گسسته را به نحو احسن انجام دهد. مثالهای این امر در همه حوزهها مشهود است. ماشینهای گوگل پرسوجوهای پیچیده انسانی را تفسیر میکنند. شرکتهای کارت اعتباری از هوش مصنوعی برای تشخیص کلاهبرداری سود میبرند. نت فلیکس با استفاده از آن، سعی میکند ذائقه مشترکانش را حدس زده و فیلمهای مورد علاقهشان را به آنان پیشنهاد کند و سرانجام، سیستم مالی از هوش مصنوعی برای مدیریت میلیاردها داد و ستد استفاده میکند (که تنها گهگاهی از هم میپاشد!).»
لوی سپس با اشاره به زمستان هوش مصنوعی که باعث متوقف شدن مقطعی پیشرفتها در حوزه هوش مصنوعی و «مرگ هدف اولیه» شد، میگوید: «اما این باعث شد تا یک هدف جدید متولد شود؛ ماشینها ساخته شدهاند تا کارهایی را انجام دهند که انسانها نمیتوانند هیچ گاه از عهده آنها برآیند.» همانطور که لوی بهدرستی اشاره میکند ساخت سیستمهای منطقی که بتوانند شیوه تفکر انسان را بهطور کامل شبیهسازی کرده و با استفاده از اصول منطقی ساده یک ماشین هوشمند را تشکیلدهند، کاری است که محققان در خلال دهههای 1960 و 1970 انجام آن را خیلی سختتر از آن چیزی که تصور میشد، یافتند. در مقابل، تحقیقات جدیدتر حوزه هوش مصنوعی بخش دیگری از حقیقت را نمایان ساخت. منطق کارکرد کامپیوترها ممکن است با آنچه انسانها از تفکر منطقی انتظار دارند کاملاً متفاوت باشد. یکی از حوزههایی که مانور اصلی خود را بر این حقیقت استوار کرده، الگوریتمهای احتمالاتی هستند.
با پیشرفت قدرت محاسباتی کامپیوترها، دانشمندان بیش از هر زمان دیگری، نسبت به الگوریتمهایی که المانهای تصادفی را شامل میشوند، علاقه نشان میدهند. ترکیب این الگوریتمها با قدرت محاسباتی امروز عموماً پاسخهایی «به حد کافی مناسب» را برای مسئلههای پیچیدهای که حل آنها دور از دسترس بود، ارائه میدهد. به عنوان مثال، الگوریتمهای ژنتیک را در نظر بگیرید. در چارچوب این الگوریتمها ماشین با یک ساختار منطقی گامبهگام و استدلالهای پیچیده مواجه نمیشود بلکه صرفاً یک سیستم بازخورد از تعدادی جوابها را در اختیار گرفته و سعی میکند تا رفتار درست را براساس ورودی انسانی پیدا کند. چنین روشهای استدلالی از عهده انسانها خارج است. ما برای خروج از یک وضعیت نامطلوب نمیتوانیم میلیونها راه را آزمون کنیم بلکه عموماً سعی میکنیم تا با استفاده رشتهای از تفکرات پیچیده، راه خروج را به صورت مکاشفهای (Heuristic) پیدا کنیم. در مقابل ماشینها میتوانند منطق دیگری را دنبال کنند و آن انجام آزمون و خطا در مقیاس میلیونی است. شاید تصور بسیاری بر این باشد که راهبرد اول نسبت به راهبرد دوم از ارزش بیشتری برخوردار است. از جهاتي نميتوان به این دیدگاه اعتراضی داشت، اما بهنظر ميرسد تا زمانی که یک راهبرد میتواند پاسخ مناسبی را در مدت زمانی کوتاه در اختیار ما قرار دهد، انتقاد از آن چندان محلی از اعراب ندارد.
راسل و نوریگ نویسندگان مشهورترین کتاب درسی در زمینه هوش مصنوعی نیز دیدگاهی به نسبت نزدیک به دیدگاه لوی را در این زمینه ارائه میکنند. آنها اعتقاد دارند که شبیهسازی واقعي هوش انسان مسئلهای بسیار مشکل است که نیازی نیست به عنوان هدف اولیه تحقیقات هوش مصنوعی در نظر گرفته شود. هرچند در بسیاری از فناوریهای امروز تطبیق فناوری با رفتارها و عادتهای انسانی به عنوان یکی از برگهای برنده فناوری مورد نظر به شمار میرود (نگاهی به آیفون و آیپد بیاندازید) اما لزوماً راه ساخت یک ماشین هوشمند، از شبیهسازی رفتار انسانی نمیگذرد (همانطور که بارها در طول مقاله ذکر شد، تورینگ خود نیز چنین عقیدهای نداشت). راسل و نوریگ برای این موضوع آنالوژی جالبی ارائه میدهند: «هواپیماها با توجه به میزان کیفیت پروازشان آزمایش میشوند و نه شبیه بودنشان به پرندگان. متون هوافضا هدف حوزهشان را “ساخت ماشینهایی که آن قدر شبیه کبوترها پرواز کنند که بتوانند کبوترهای دیگر را فریب دهند” بیان نمیکنند.»
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.