مدل Vision Transformer یا ViT تصاویر را به بخشهای کوچک تقسیم کرده و مانند توکنهای متنی پردازش میکند. این روش در تشخیص تصویر و بینایی رایانهای بسیار موفق بوده است.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
راهنمای معماری Transformer و BERT
مقدمه
مدلهای Transformer پایهگذار نسل جدید هوش مصنوعی هستند. از ترجمه ماشینی تا ChatGPT، همه بر اساس همین معماری ساخته شدهاند. در این کتابچه یاد میگیری سازوکار Transformer، مکانیزم Attention و مدل معروف BERT چگونه کار میکنند.