متا نیز به رقابت هوش مصنوعی پیوسته و از مدل زبانی LLaMA رونمایی کرده است. این مدل زبانی به عنوان ابزاری برای محققان طراحی شده تا مشکلات و خطرهای احتمالی AI را پیشبینی نمایند. مدل زبانی جدید متا به نسبت کوچک اما قدرتمند است. با ادامه خبر در شهر سخت افزار همراه باشید.
مدلهای زبانی بزرگ به یکی از موضوعات اصلی دنیای فناوری تبدیل شدهاند و بسیاری را به خود سرگرم نمودهاند. ابزار ChatGPT که بر اساس یکی از همین مدلها ساخته شده، قادر است به سوالات شما پاسخ دهد، مسئله ریاضی حل و با شما گفتگو کند. با این وجود مشکلات و جهتگیریها در دادههای مورد استفاده، محتوای تولید شده توسط مدلهای زبانی را غیر قابل اعتماد کرده است.
در همین رابطه بخوانید:
- ربات ChatGPT چیست و چگونه می توانید از آن استفاده کنید؟
- رقیب جدی ChatGPT توسط گوگل معرفی شد؛ با هوش مصنوعی Bard آشنا شوید
معرفی مدل زبانی LLaMA متا
متا برای کمک به محققان در راه حل مشکلات مدلهای زبانی بزرگ، یک مدل زبانی جدید به نام LLaMA را معرفی کرده است. این مدل زبانی که به صورت تجاری عرضه نخواهد شد، به صورت موردی در اختیار کاربران قرار خواهد گرفت.
LLaMA به عنوان یک مدل زبانی بزرگ، به نسبت کوچک است. برای ساخت یک مدل زبانی که به اندازه کافی پیچیده باشد و بتواند در یک زبان یا زمینه مشخص به حل مسئله و گفتگو بپردازد به مقادیر زبادی داده نیاز داریم. با این وجود کوچک بودن یک مدل زبانی بزرگ، منابع و توان پردازشی مورد نیاز برای تست رویکردهای تازه را کاهش میدهد.
برای تمرین دادن LLaMA به جای کلمات کامل، از قسمتهایی از کلمه یا توکن استفاده شده است. این توکنها از 20 زبان با بیشترین تعداد سخنگو با تمرکز بر الفبای لاتین و سیریلیک تولید شدهاند. LLaMA مجموعهای از مدلهاست که بین 7 تا 65 میلیارد پارامتر دارند.
LLaMA 65B و LLaMA 33B با 1.4 تریلیون توکن آموزش دیدهاند و LLaMA 7B با یک تریلیون توکن تمرین داده شده است. LLaMA کوچک است اما قدرت بسیار بالایی دارد؛ متا گفته در بسیاری از بنچمارکها، LLaMA-13B توانسته GPT-3 را شکست دهد.
متا مدلهای زبانی مختلف مجموعه LLaMA را در اختیار محققان خواهد گذاشت. همچنین بنچمارکهایی نیز طراحی شده تا سوگیریهای اشتباه مدل زبانی را در صورت لزوم به محققان گوشزد نمایند.
نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت