تیم تحقیقات اپل گامی بزرگ در جهت مدل زبانی بزرگ چند وجهی MM۱ ( نوعی سیستم هوش مصنوعی) برداشته است. این مدل در پاسخ به سوالات درباره عکس و غیره عملکرد بهتری دارد.

به گزارش گروه علمی-فناوری خبرگزاری سلامت(طبنا)شرح جزییات این مدل زبانی بزرگ(LLM) در یک تحقیق آمده و نشان می دهد مدل مذکور قابلیت های خارق العاده ای در شناسایی تصویر و همچنین زبان طبیعی دارد.

سیستم هوش مصنوعی MM۱ در ۳ اندازه ۳، ۷ و ۳۰ میلیارد پارامتر عرضه می شود. محققان از این مدل ها برای انجام آزمایش ها استفاده کرده اند.

محققان با استفاده از یک ساختار «ترکیبی از کارشناسان» و روش Top-۲Gating ابزارMM۱ را ساخته اند. این روش نه تنها نتایج جالب توجهی در بنچمارک پیش از آموزش سیستم هوش مصنوعی داشت، بلکه به عملکرد بهتر روی بنچمارک های چند وجهی نیز تعبیر شد. مدل هایMM۱ حتی پس از تنظیم دقیق برای فعالیت های خاص، عملکرد رقابتی خود را حفظ کردند.

آزمایش ها نشان داد مدل های MM۱-۳B-Chat و MM۱-۷B-Chat بهتر از رقبای دیگر خود در بازار عمل می کنند. این مدل ها به خصوص در زمینه فعالیت هایی مانند پرسش و پاسخ براساس متن، پاسخ نوشتاری به سوالات درباره یک عکس و پاسخ به سوالات علمی عملکرد خوبی دارند. اما در کل عملکرد MM۱ از جمینی گوگل یا جی پی تی -۴ برتر نیست. هرچند MM۱ را نمی توان یک محصول برتر در بازار به حساب آورد اما همچنان یک گام مهم در حوزه هوش مصنوعی برای اپل است.