تولید دادگان عام برای آموزش «مدل زبانی بزرگ»

سرپرست کارگروه هوش مصنوعی مولد ستاد هوش مصنوعی و رباتیک در همایش الزامات توسعه مدل زبانی بزرگ فارسی گفت: مدل های زبانی، مدل های بنیادینی هستند که بر روی داده های بسیار آموزش داده شده‌اند. آنها می‌توانند متن را درک کنند، متن تولید کنند و وظایف مختلفی را انجام دهند. LLMs در حال تحول برنامه های کاربردی در بسیاری از زمینه ها هستند.

به گزارش سیناپرس از مرکز ارتباطات و اطلاع‌رسانی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، محمد باقر سجادی، نائب رئیس کمیسیون هوش مصنوعی نصر و مدیرعامل شرکت دادماتک و از اعضای کارگروه هوش مصنوعی مولد ستاد هوش مصنوعی و رباتیک، طی سخنانی در همایش الزامات توسعه مدل زبانی بزرگ فارسی به ضرورت و اهمیت توسعه فناوری LLM اشاره کرد و افزود: «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده می‌کند. مدل های زبانی، مدل های بنیادینی هستند که بر روی داده های بسیار آموزش داده شده‌اند. آنها می‌توانند متن را درک کنند، متن تولید کنند و وظایف مختلفی را انجام دهند. LLMs در حال تحول برنامه های کاربردی در بسیاری از زمینه ها هستند.

وی در ادامه بر کاربردهای مدل زبانی بزرگ متمرکز شد و گفت: اصلاح املایی، طبقه بندی محتوا، مقایسه کالا، حل مسائل علمی، تشخیص احساسات، موتور جست و جو، ترجمه، کتابشناسی، برنامه نویسی، خلاصه سازی، و آموزش از جمله کاربردهای این مدل زبانی است.

به گفته او، درک مطلب، شناخت حقایق، یادگیری مفاهیم، تولید محتوا، استنتاج، درک موضوع و پاسخ به سوال از قابلیت های مدل زبانی بزرگ است.

برنامه های هوش مصنوعی مولد ستاد هوش مصنوعی و رباتیک

هشام فیلی، عضو هیات علمی دانشگاه تهران هم به برنامه‌های کارگروه هوش مصنوعی مولد ستاد هوش مصنوعی و رباتیک پرداخت و گفت: این کارگروه در بحث تحریک تقاضا، برنامه‌هایی همچون فرهنگ‌سازی و آموزش کاربردهای LLM جهت ورودی بخش خصوصی (و غیرخصوصی)، برگزاری همایش های کاربردهای LLM در حوزه ها و صنایع مختلف، برگزاری اموزش های استفاده از AI و LLM در سطح مدیران و کارشناسان IT سازمان ها و شرکت‌ها، تشکیل کارگروه های تخصصی جهت توسعه استفاده از LLM در آن حوزه اعم از کارگروه سلامت، صنعت، تجارت، مالی، حقوق، فقه، شبکه اجتماعی، آموزش، …، توسعه داده های خاص منظوره برای صنایع و حوزه های خاص و تشویق سازمان ها و شرکت ها به آزادسازی داده های متنی و غیرمتنی با رعایت ملاحظات امنیتی – مشوق آزادسازی دادگان و … را در دستور کار خود دارد.

به گفته او، تولید دادگان عام برای آموزش LLM و دادگان خاص منظوره به دو صورت instruct tuning یا task specific training data ، ایجاد زیرساخت مورد نیاز برای آموزش مدل هوش مصنوعی یا استقرار مدل هوش مصنوعی، کاربردهای مختلف LLM در حوزه ها و صنایع مختلف، ارزیابی LLM های توسعه یافته فارسی Safe Guard بومی برای LLM، آموزش نیروی انسانی و … از دیگر برنامه های این کارگروه در بخش تقویت عرضه است.

سرپرست کارگروه هوش مصنوعی مولد ستاد هوش مصنوعی و رباتیک در پایان خاطرنشان کرد: در حوزه تربیت نیروی انسانی کارآمد، برنامه هایی همچون حمایت از موسسات آموزشی برگزار کننده دوره های تخصصی در حیطه مربوطه، حمایت از دوره های مجازی مربوطه از طریق پرداخت سوبسید به آکادمی ها، برگزاری رشته علوم داده (با تمرکز بر هوش مصنوعی مولد) در وزارت علوم، حمایت ویژه از استارتاپهای مربوط به این حوزه از طرق مختلف توسط معاونت علمی و پارکهای علم و فناوری و برگزاری مسابقات مختلف جهت جذب نیروهای مستعد در این حوزه (مشابه مسابقات ربوکاپ) و …. را در دستور کار داریم.

گفتنی است همایش الزامات توسعه مدل زبانی بزرگ فارسی با شعار «هوش مصنوعی، مولد قدرت حکومت ها» به همت ستاد توسعه فناوری های هوش مصنوعی و رباتیک معاونت علمی ۲۰ اسفندماه در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد.

No tags for this post.

ghafari1402-12-22