نماد سایت خبرگزاری سیناپرس

چت جی پی تی چگونه کار می کند؟

GPT4 improved chatbot illustrations. Artificial intelligence chatbot.Chat GPT 4 illustration for banner, poster, website, landing page, ads, flyer template.

این روزها صحبت از هوش مصنوعی و به ویژه برنامه هوشمند چت جی پی تی در همه جا شنیده می شود و در حقیقت این برنامه می تواند به بیشتر سوالات کاربران پاسخی درست و منطقی دهد. در این گزارش قصد داریم به بررسی نحوه عملکرد این فناوری بپردازیم.

به گزارش سیناپرس، برای بررسی نحوه عملکرد چت جی پی تی علاوه بر جستجوی اینترنتی تصمیم گرفتیم از خود این برنامه نیز سوالمان را پرسیده و پاسخش را بشنویم.

به گفته خود چت جی پی تی، این برنامه یک مدل زبان مبتنی بر معماری GPT-4 است که توسط OpenAI توسعه یافته است. این نرم افزار به طور خاص برای درک و ایجاد پاسخ ‌های انسان ‌مانند در یک زمینه مکالمه طراحی شده است. فناوری زیربنایی، GPT-4، یک تکرار پیشرفته از سری GPT است و از نظر مقیاس و عملکرد نسبت به نسخه های پیشین خود بهبود یافته است. در ادامه یک نمای کلی از نحوه کار چت جی پی تی را بررسی می کنیم:

مرحله پیش ‌آموزش: چت جی پی تی روی حجم وسیعی از داده‌ های متنی از منابع مختلف مانند کتاب ‌ها، مقاله ‌ها و وب‌ سایت‌ها از قبل آموزش داده شده است. در طول این مرحله، مدل ساختار و الگوهای زبان انسانی مانند دستور زبان، نحو، معناشناسی و حتی برخی اطلاعات واقعی را می ‌آموزد. با این حال، ذکر این نکته ضروری است که دانش به دست آمده در طول دوره قبل از آموزش محدود به اطلاعات موجود در داده های آموزشی است که دارای تاریخ قطعی است.

مرحله تنظیم دقیق: پس از مرحله پیش‌آموزشی، چت جی پی تی با استفاده از مجموعه داده‌ های دقیق تری که معمولاً شامل مکالمات یا نمونه‌ های گفتگو است، به‌خوبی تنظیم می‌ شود. این مجموعه داده ممکن است با کمک بازبینان انسانی با پیروی از دستور العمل ‌های خاص تولید شود. فرآیند تنظیم دقیق به این برنامه کمک می ‌کند تا پاسخ ‌های مرتبط ‌تر و منسجم ‌تری را در یک محیط مکالمه ایجاد کند.

مرحله معماری ترانسفورماتور: اساس و پایه چت جی پی تی بر اساس معماری ترانسفورماتور است که به آن اجازه می دهد تا متن را به طور موثر پردازش و تولید کند. به گزارش سیناپرس،  این برنامه از مکانیسم‌ های توجه به خود برای سنجش اهمیت کلمات در یک زمینه خاص و برای درک وابستگی ‌های بلند مدت در زبان استفاده می ‌کند. این نوع خاص معماری مدل را قادر می سازد تا پاسخ های پیچیده و متناوب مناسب را درک و تولید کند.

مرحله توکن سازی یا Tokenization :  هنگامی که کاربر متنی را وارد می کند، چت جی پی تی ابتدا متن را به واحد های کوچکتری به نام توکن تبدیل می کند. این نشانه ها بسته به زبان و استراتژی توکن سازی مورد استفاده می توانند کاراکترها، کلمات یا زیرکلمه ها را نشان دهند. برنامه هوشمند چت جی پی تی این نشانه‌ها را به صورت موازی پردازش کرده و به آن اجازه می‌دهد تا پاسخ ‌های آگاه از زمینه را به سرعت تولید کند.

رمز گشایی: پس از پردازش توکن های ورودی و ایجاد یک بردار زمینه، چت جی پی تی خروجی را با تولید دنباله ای از نشانه ها که پاسخ را تشکیل می دهند رمزگشایی می کند. به گزارش سیناپرس، این عمل معمولاً با استفاده از جستجوی حریصانه، جستجوی پرتو یا سایر استراتژی ‌های رمز گشایی برای انتخاب محتمل ‌ترین نشانه بعدی بر اساس پیش ‌بینی ‌های مدل انجام می ‌شود.

مکالمه تعاملی: چت جی پی تی یک تاریخچه مکالمه را برای پیگیری زمینه در طول یک گفتگو حفظ می کند. این تاریخچه در طول هر تعامل به مدل بازخورد داده می‌ شود و آن را قادر می‌ سازد تا پاسخ‌ های منسجم متنی ایجاد کند.

به گزارش سیناپرس، توجه به این نکته مهم است که برنامه هوش مصنوعی در واقع اعتراف می ‌کند که محدودیت ‌هایی مانند ارائه پاسخ ‌های نادرست یا بی معنی، حساس بودن به عبارت‌ های ورودی، بیش از حد پرمخاطب بودن، یا نپرسیدن سؤال ‌های روشن ‌کننده برای درک سؤالات مبهم دارد. البته شرکت OpenAI اضافه می کند که به طور مستمر روی بهبود این جنبه ها و اصلاح مدل کار می کند تا استفاده از چت جی پی تی برای عموم مؤثرتر و ایمن تر شود.

گزارش: نیروانا محمدحسینی

No tags for this post.
خروج از نسخه موبایل