رونمایی گوگل از قدرتمندترین مدل هوش مصنوعی
شرکت گوگل به تازگی از قدرتمندترین مدل هوش مصنوعی خود به «جمنای»(Gemini) رونمایی کرده است، اما این هوش مصنوعی چیست و چه کارهایی میتواند انجام دهد؟
گوگل جمنای چیست؟
جمنای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که میتواند نه تنها متن، بلکه تصاویر، ویدئوها و صداها را نیز درک کند. به عنوان یک مدل چندوجهی، جمنای قادر به انجام وظایف پیچیدهای در حوزه ریاضیات، فیزیک و سایر زمینهها و همچنین درک و تولید کد با کیفیت بالا در زبانهای برنامهنویسی مختلف است.
در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل بارد(Google Bard) و تلفن همراه هوشمند گوگل پیکسل(Google Pixel ۸) ادغام شده است اما به تدریج در سایر سرویسهای گوگل نیز قرار خواهد گرفت.
به گفته دنیس حسابیس(Dennis Hassabis)، مدیرعامل و یکی از بنیانگذاران گوگل دیپمایند، جمنای نتیجه تلاشهای مشترک در مقیاس بزرگ توسط تیمهای سراسر گوگل، از جمله همکاران ما در بخش پژوهش گوگل(Google Research) است. این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده و این بدان معناست که میتواند موارد مختلف را به هم تعمیم دهد و به طور یکپارچه درک کند، کار کند و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.
چه کسی جمنای را ساخته است؟
جمنای توسط گوگل و آلفابت که شرکت مادر گوگل است، ایجاد شد و به عنوان پیشرفتهترین مدل هوش مصنوعی این شرکت تا به امروز منتشر شد. گوگل دیپ مایند نیز سهم قابل توجهی در توسعه جمنای داشته است.
آیا چندین نسخه مختلف از جمنای وجود دارد؟
گوگل جمنای را به عنوان یک مدل انعطافپذیر توصیف میکند که میتواند روی همه چیز از مراکز داده گوگل گرفته تا دستگاههای تلفن همراه اجرا شود. برای دستیابی به این انعطافپذیری، جمنای در سه نسخه عرضه میشود: نانوجمنای(Gemini Nano)، پروجمنای(Gemini Pro) و اولترا جمنای(Gemini Ultra).
نانو جمنای
اندازه مدل نانو جمنای برای اجرا بر روی تلفنهای همراه هوشمند، بهویژه گوگل پیکسل ۸(Google Pixel ۸) طراحی شده است. این مدل برای انجام کارها روی دستگاهی که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارد، مانند ارائه پیشنهاد برای پاسخ در برنامههای چت یا خلاصه کردن متن ساخته شده است.
پرو جمنای
پرو جمنای که در مراکز داده گوگل اجرا میشود، برای تامین آخرین نسخه چتبات هوش مصنوعی این شرکت یعنی بارد(Bard)، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است.
اولترا جمنای
اگرچه اولترا جمنای هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف میکند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدلهای زبانی بزرگ(LLM) فراتر رفته است. این هوش مصنوعی برای کارهای بسیار پیچیده طراحی شده است و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود.
چگونه میتوان به جمنای دسترسی پیدا کرد؟
جمنای اکنون در محصولات گوگل در اندازههای نانو و پرو، مانند تلفن پیکسل ۸ و چتبات بارد، در دسترس است. گوگل قصد دارد جمنای را به مرور در موتور جستجوگر، تبلیغات، کروم و سایر سرویسهای خود ادغام کند.
توسعهدهندگان و مشتریان سازمانی از ۱۳ دسامبر میتوانند از طریق Gemini API در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به پرو جمنای دسترسی داشته باشند. توسعهدهندگان اندروید نیز از طریق AICore به نانوجمنای دسترسی خواهند داشت، که به صورت پیش نمایش اولیه در دسترس خواهد بود.
جمنای چه تفاوتی با سایر مدلهای هوش مصنوعی مانند جیپیتی-۴ دارد؟
به نظر میرسد که مدل جدید جمنای گوگل یکی از بزرگترین و پیشرفتهترین مدلهای هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدلهای محبوبی که در حال حاضر چتباتهای هوش مصنوعی را تقویت میکنند، جمنای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدلهای دیگر، مانند جیپیتی-۴، برای چندوجهی بودن واقعا به اتصالات و ادغامها متکی هستند.
در مقایسه با جیپیتی-۴ که یک مدل عمدتا مبتنی بر متن است، جمنای به راحتی وظایف چندوجهی را به صورت بومی انجام میدهد. در حالی که جیپیتی-۴ در کارهای مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات اُپنایآی (OpenAI) متوسل میشود و برای تولید تصاویر و پردازش صدا به DALL-E ۳ و ویسپر (Whisper) متکی است.
همچنین به نظر میرسد جمنای گوگل بیشتر از سایر مدلهای موجود در حال حاضر بر روی محصول متمرکز باشد. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده یا برنامه این کار را دارد، زیرا به هر دو دستگاه بارد و پیکسل ۸ قدرت میبخشد. مدلهای دیگر، مانند جیپیتی-۴ و Meta’s Llama، بیشتر سرویسگرا هستند و برای برنامهها، ابزارها و خدمات توسعهدهندگان مختلف شخص ثالث در دسترس قرار دارند./ ایسنا