چطور Transformer در بینایی ماشین استفاده می‌شود؟

AUتحریریه

۱۴۰۴/۰۷/۱۲

6 دقیقه مطالعه

مدل Vision Transformer یا ViT تصاویر را به بخش‌های کوچک تقسیم کرده و مانند توکن‌های متنی پردازش می‌کند. این روش در تشخیص تصویر و بینایی رایانه‌ای بسیار موفق بوده است.

برای مشاهدهٔ ادامه، خرید کنید

دسترسی سریع و فوری

راهنمای معماری Transformer و BERT

مقدمه

مدل‌های Transformer پایه‌گذار نسل جدید هوش مصنوعی هستند. از ترجمه ماشینی تا ChatGPT، همه بر اساس همین معماری ساخته شده‌اند. در این کتابچه یاد می‌گیری سازوکار Transformer، مکانیزم Attention و مدل معروف BERT چگونه کار می‌کنند.

فهرست