شما قبلا این خبر را لایک کرده‌اید .

کپی شد

کد خبر: ۹۴۳۹۸۴

۰۹:۰۰ - ۰۶ بهمن ۱۴۰۴

ویژگی جدید «چت‌جی‌پی‌تی» به سادگی هک می‌شود!

به گفته دو پژوهشگر، هک کردن چت جی پی تی بسیار ساده است و می‌توان آن را برای رسیدن به مقاصد خطرناک تحت کنترل درآورد.

دو پژوهشگر دریافته‌اند که هک کردن جدیدترین ویژگی «چت‌جی‌پی‌تی» به طور شگفت‌آوری آسان به نظر می‌رسد و می‌توان آن را برای رسیدن به مقاصد خطرناک تحت کنترل درآورد.

به گزارش ایسنا، ویژگی «ترجمه چت‌جی‌پی‌تی»(ChatGPT Translate) که جایگزین شرکت «اوپن‌ای‌آی»(OpenAI) برای «ترجمه گوگل»(Google Translate) به شمار می‌رود، به تازگی توسط پژوهشگران هک شده است.

به نقل از یوسی استراتژیز، دو پژوهشگر اخیرا نشان دادند که چت‌جی‌پی‌تی به راحتی محدودیت‌های خود را هنگام تزریق یک پرس‌وجو فراموش می‌کند. همچنین، آنها دریافتند که چت‌جی‌پی‌تی هیچ مشکلی در ارائه دستور تهیه کوکتل مولوتوف نمی‌بیند.

با کشف این حفره‌های دیجیتال می‌توان تعادل پیچیده‌ای را بین نوآوری‌های فناوری و خطرات سوءاستفاده مشاهده کرد.

به محض این که ویژگی جدید چت‌جی‌پی‌تی به صورت عمومی منتشر شد، «تام بارنیا»(Tom Barnea) و «کرن کاتز»(Keren Katz) پژوهشگران امنیت سایبری شرکت «Tenable» تلاش کردند تا ترجمه با چت‌جی‌پی‌تی را تحت فشار قرار دهند. آنها می‌خواستند بدانند که آیا می‌توان چت‌بات را دستکاری کرد و از مکانیسم‌های امنیتی اوپن‌ای‌آی گذشت. این دو متخصص برای فهمیدن این موضوع، مجموعه‌ای از آزمایش‌ها را انجام دادند.

بارنیا و کاتز به عنوان بخشی از آزمایش‌ها، یک حمله تزریق پرس‌وجو علیه چت‌جی‌پی‌تی انجام دادند. این نوع حمله شامل جاسازی دستورالعمل‌های مخرب در پرس‌وجوی ارسالی به هوش مصنوعی است. سپس هوش مصنوعی دستورالعمل‌ها را مورد پردازش قرار می‌دهد و اگر درخواست‌های مهاجمان به درستی فرمول‌سازی شده باشد، از آنها پیروی می‌کند. چالش کلی برای مهاجمان این است که هوش مصنوعی را به نادیده گرفتن برنامه‌نویسی خود مجبور کنند.

کاتز توضیح داد که چت‌بات به سرعت از مسیر خود منحرف شد. چت‌بات قرار بود متنی را از انگلیسی به کره‌ای ترجمه کند، اما کاتز موفق شد آن را دستکاری کند تا جزئیات کامل دستورالعمل ساخت کوکتل مولوتوف را شرح دهد.

کاتز گفت: ویژگی ترجمه چت‌جی‌پی‌تی فقط یک روز است که عرضه شده و در حال حاضر از دستورالعمل ساخت کوکتل مولوتوف تعریف و تمجید می‌کند. ما از مدل ترجمه خواستیم متن ما را از انگلیسی به کره‌ای تبدیل کند اما در عوض، از دستورالعمل‌های موجود در متن پیروی کرد و دستورالعمل ساخت کوکتل مولوتوف را نشان داد.

تزریق سریع در قلب یک چالش منحصربه‌فرد امنیت سایبری قرار دارد که هوش مصنوعی با آن روبه‌رو شده است. این روش شامل جاسازی دستورالعمل‌های گمراه‌کننده یا مخرب در پرس‌وجوهای مشروع فرستاده‌شده به یک مدل هوش مصنوعی است.

اگرچه بیشتر افراد صرفاً به دنبال ترجمه متن هستند، اما افرادی با نیت‌های بد ممکن است درخواست‌هایی را طراحی کنند که این سیستم‌ها را بسیار فراتر از هدف اصلی خود سوق دهد.

اثرات بی‌ثبات‌کننده اغلب در مدل‌های ترجمه تخصصی برجسته‌تر هستند. این سیستم‌ها به جای این که کاملاً به وظایف ترجمه پایبند باشند، ممکن است از دستورالعمل‌های پنهان پیروی کنند و خروجی‌های غیرمنتظره یا حتی نامناسبی را ارائه دهند.

این سناریو صرفاً یک فرضیه نیست. پژوهشگران امنیتی مواردی را مستند کرده‌اند که در آنها مدل‌های ترجمه اختصاصی سهواً اطلاعات یا توصیه‌هایی را بسیار خارج از کاربرد مورد نظر خود ارائه داده‌اند.

مقابله با تزریق سریع نیازمند راهکارهای تطبیقی است که در کنار روش‌های جدید حمله تکامل یابند. بررسی‌های چندلایه، نظارت مستمر و داده‌های آموزشی به‌روزرسانی‌شده، پایه و اساس این کار را تشکیل می‌دهند، اما توسعه‌دهندگان باید فراتر بروند. تعبیه روال‌های تحلیل پویا که عبارت‌های ناآشنا یا تغییرات ناگهانی در هدف را در اواسط عملیات شناسایی می‌کنند، دفاع را تقویت خواهد کرد.

برخی سازمان‌ها اطلاعات مربوط به حوادث دنیای واقعی را برای ایجاد پلتفرم‌های مقاوم‌تر به اشتراک می‌گذارند. برخی دیگر، مستندسازی شفاف منطق تصمیم‌گیری را در اولویت قرار می‌دهند و به کاربران و حسابرسان امکان می‌دهند که دقیقاً بفهمند یک مدل چگونه نتایج را تولید می‌کند. آموزش مداوم نیز بسیار مهم است و تضمین می‌کند که گروه‌ها تلاش‌های دستکاری ظریف را به موقع شناسایی کنند و به طور مؤثر به آنها پاسخ دهند.

تزریق سریع، درس مهمی را درباره اعتماد کردن به هوش مصنوعی مدرن و تأیید آن ارائه می‌دهد. حتی موتورهای ترجمه‌ای که به شدت کنترل می‌شوند نیز می‌توانند قربانی تله‌های طراحی‌شده‌ تخصصی شوند. ذی‌نفعان با تحلیل تلاش‌های دستکاری موفق و ناموفق، درباره نقاط ضعف سیستم شفاف‌سازی می‌کنند و مسیرهایی را برای محافظت قوی‌تر ارائه می‌دهند.

هر سازمانی که ترجمه هوش مصنوعی را به کار می‌گیرد باید چند مرحله حیاتی را در نظر بگیرد.

۱. بررسی منظم لاگ‌های ورودی برای تشخیص موارد غیر معمول یا عجیب از نظر محتوایی؛

۲. استفاده از محیط‌های سندباکس برای آزمایش سوءاستفاده‌های احتمالی پیش از یکپارچه‌سازی کامل؛

۳. همکاری نزدیک با گروه‌های امنیت سایبری برای آموزش متقابل درباره بردارهای حمله خاص هوش مصنوعی؛

۴. به‌روزرسانی منظم مدل‌های ترجمه برای شامل شدن جدیدترین تحقیقات ضد تزریق سریع؛

۵. ترویج گزارش مسئولانه ناهنجاری‌ها توسط کارکنان و کاربران مورد اعتماد.

هر اقدام احتیاطی، قابلیت اطمینان کلی سیستم را افزایش می‌دهد؛ به ویژه با توجه به این که ترجمه هوش مصنوعی عمیقاً در صنایع گوناگون ریشه دوانده است. دستیابی به مصونیت کامل ممکن است همچنان دور از دسترس باشد؛ اما درک انگیزه‌ها و روش‌های پشت تزریق سریع، سازمان‌ها را قادر می‌سازد تا پیشرو باشند و با آگاهی بیشتر و سازگاری راهبردی به تهدیدات آینده رسیدگی کنند.

بیشتر بدانید:

هوش مصنوعی چت جی پی تی

بازدید از صفحه اول ارسال به دوستان

شما قبلا این خبر را لایک کرده‌اید .

اخبار مرتبط

ارسال نظرات

مجله خواندنی

قیمت روز طلا و دلار (۲ نظر)
قیمت موبایل‌ | جدول کامل قیمت گوشی‌های بازار امروز (۱ نظر)
قیمت روز خودرو | جدول جدید امروز (۱ نظر)

خط داغ

حذف ایرانی‌ها از فهرست اتحادیه جهانی کشتی
اتحادیه جهانی کشتی نام کشتی‌گیران ایران را از لیست نفرات حاضر در مسابقات رنکینگ کرواسی حذف کرد.
وزارت خارجه رسماً پیام عراقچی به ویتکاف را تکذیب کرد/ مطلقا صحت ندارد
سخنگوی وزارت خارجه درباره ادعاهای رسانه رژیم صهیونیستی مبنی بر پیام عراقچی و ویتکاف گفت: مطلقا این ادعای مطرح شده صحت…
هشدار کرملین در خصوص حمله آمریکا به ایران
کرملین با درخواست برای خویشتنداری، در خصوص هرگونه اقدام نظامی علیه ایران هشدار داد.
کاسبی با وی‌پی‌ان‌های قلابی
در روزهای اخیر بعضی کاربران با تعجب دریافتند فیلترشکن‌هایی که برای آن‌ها پول پرداخت کرده بودند، حتی با وجود اتصال به…
قیمت طلا، سکه، دلار و یورو امروز دوشنبه ۶ بهمن ۱۴۰۴
سکه امامی از مرز ۱۷۲ میلیون تومان عبور کرد
قابل توجه مستاجران؛ بهترین بانک برای دریافت وام ودیعه مسکن
کمتر از ۷۰ هزار مستاجر از ابتدای سال موفق به دریافت تسهیلات ودیعه مسکن شده‌اند
سخنگوی وزارت خارجه: قدرتمندتر از همیشه به هر تعرضی پاسخ می‌دهیم
سخنگوی وزارت خارجه با بیان این که «ما با یک جنگ ترکیبی مواجه بوده و هستیم» تاکید کرد: توانمندتر از هر زمانی به هرگونه…
واکنش سخنگوی وزارت خارجه به پیام‌های آمریکا
سخنگوی وزارت امور خارجه گفت: کنشگری سیاسی و دیپلماسی رسمی با تبادل پیامک‌های خصوصی که فاقد هرگونه تضمین امنیتی و…
«ابهام در پاسخ ایران»/ معادلات پرریسک نظامی در منطقه به کجا ختم می‌شود؟
بنابر برخی تحلیل‌های رسانه‌ای، رؤیای «جنگ پاک»، «ضربه بدون هزینه» یا دست‌کم «کم‌هزینه»، بخش جدایی‌ناپذیر از ذهنیت…
تصویر متن تعهدنامه برای استفاده نیم‌ساعته تجار از اینترنت!
اعضای اتاق بازرگانی با در دست داشتن کارت عضویت، کارت ملی و یک برگ تعهدنامه در صف ایستاده اند تا بتوانند نیم ساعت به…
بارش پی‌درپی در بهمن‌ماه/ کسری بارش ادامه می‌یابد؟‌
رئیس مرکز ملی پیش‌بینی و مدیریت بحران مخاطرات وضع هوا با اشاره به نقشه‌های هواشناسی تاکید کرد که اگرچه فعالیت پی در پی…
پیشبینی آب و هوای ایران از دوشنبه ۶ بهمن / خبرها تا چهارشنبه خوش نیست
امروز دوشنبه ۶ بهمن، اکثر نقاط ایران با آسمانی صاف مواجه هستند و ۶ شهر درگیر آلودگی شدیدند؛ تداوم این وضعیت تا پایان…
ماجرای پیامی که عراقچی به ویتکاف فرستاد
ویتکاف برای متقاعد کردن ترامپ در به تعویق انداختن حمله نظامی، پیامی را از عباس عراقچی، وزیر امور خارجه ایران به ترامپ…
قیمت طلا امروز دوشنبه ۶ بهمن ۱۴۰۴
نرخ طلا ۱۸ عیار در بالاترین سطح تاریخی قرار گرفته است
فرمول اوسمار برای قهرمانی پرسپولیس؛ کپی از روی دست یحیی
با جذب دنیل‌ گرا مجارستانی و فرزین معامله‌گری، پرسپولیس در کناره‌های خط دفاعی تقویت شد و این مهم می‌تواند تکه مهمی از…
شاخص آلودگی هوای تهران امروز دوشنبه ۶ بهمن / عموم مردم در خطر!
عبور تهران از روزهای برفی و سکون جوی سبب شد آلاینده‌ها افزایش یافته و پایتخت وارد محدوده قرمز شود از این روست که برخی…
مرحله پیچیده‌ای رو به روی ماست
اجلاس پنجاه‌وششم مجمع جهانی اقتصادی، مخصوصاً نطق‌های سیاسی آن روشن می‌سازد که وارد مرحله پیچیده و پرابهامی در روابط…
یک عضو مؤسسه بیکر تحلیل کرد؛
ترس اعراب از سیاست بی‌پروای ترامپ
مقامات عمان، قطر، عربستان و مصر در تلاش دیپلماتیک برای جلوگیری از تشدید تنش فعال بوده‌اند، که نشان‌دهنده نگرانی‌های…
دولت پزشکیان را به این نام بشناسید
مهم‌ترین چیزی که در دولت پزشکیان خودنمایی می‌کند، تعطیلات است. گویا تنها نسخه شفابخش این دولت فقط و فقط تعطیل کردن…
حقیقت تامل‌برانگیز؛ ناراحت نیستند!
در پی حوادث اخیر، میزبانی مسابقات بین‌المللی از سه نماینده ایران در دو سطح مختلف رقابت‌های آسیایی سلب شده است.
پیش‌بینی جدید رائفی‌پور: حمله نظامی با ترور هدفمند اشخاص و تصرف اماکن حساس!
پر واضح است در آشوب‌های اخیر تنها بخش کوچکی از هسته‌های آشوب زیر ضربه رفتند با قطع اینترنت و ناکام ماندن پلن قبلی؛ این…
پاسخ تند فلاحت پیشه به رحیم‌پور ازغدی درباره سیلی زدن به ترامپ
حشت‌الله فلاحت‌پیشه نماینده پیشین مجلس در واکنش به اظهارات اخیر رحیم‌پور ازغدی مبنی بر اینکه باید ترامپ را همچون…
همه چیز در مورد فیلم برمودا / طناز طباطبایی با سر تراشیده به سرنوشت لیلا حاتمی دچار می‌شود؟
فیلم سینمایی «برمودا» با حضور متفاوت طناز طباطبایی و علی شادمان داستان افرادی را به تصویر می‌کشد که برای رهایی از…
عصیان نقره در ایران؛ حباب ۸۰ درصدی شمش و فروش ساچمه با دلار ۲۶۶ هزار تومانی
در حالی که دلار نهایتا ۱۴۵ هزار تومان است، قیمت ساچمه نقره با دلار ۲۶۶ هزار تومانی محاسبه می‌شود و خرید شمش صرفه…
زلنسکی: فقط ۲ گزینه برای اروپا وجود دارد
«ولودیمیر زلنسکی» رئیس‌جمهور اوکراین عصر یکشنبه در اظهاراتی عنوان کرد: «فقط ۲ گزینه برای اروپا وجود دارد؛ آزادی یا…

گزارش و تحلیل

هم اکنون دیگران میخوانند