آموزش LLM و VLM
2.48K subscribers
31 photos
21 videos
11 files
80 links
آموزش تخصصی LLM و Hugging face

گروه مباحثه:

@llm_group
Download Telegram
Media is too big
VIEW IN TELEGRAM
🌟 مدل‌های زبانی-تصویری (VLM)| مدرس: علیرضا اخوان‌پور

مدل‌های زبانی-تصویری (VLM) نسل جدیدی از مدل‌های مولد هستن که علاوه بر متن، تصویر رو هم می‌فهمن. یعنی می‌تونن عکس رو توصیف کنن، به سوال درباره‌ی محتواش جواب بدن و حتی بین متن و تصویر ارتباط برقرار کنن.

📚 در این دوره یاد می‌گیرید:

- ساختار و معماری مدل‌های VLM

- کاربردهای جذاب مثل پرسش‌وپاسخ تصویری و مولتی‌مودال

- نحوه‌ی آموزش و به‌کارگیری این مدل‌ها در پروژه‌های واقعی

🔗 مشاهده دوره:
https://mktb.me/e3gx/


~~~
کانال تلگرامی دوره
@llm_huggingface
👍3
مسیر حرفه‌ای یادگیری مدل‌های زبانی و چند وجهی
از Deep Learning تا LLM و VLM

اگر می‌خواهید به‌صورت اصولی وارد دنیای مدل‌های زبانی بزرگ و مدل‌های چندوجهی شوید، این مسیر آموزشی پیشنهاد می‌شود:

🧠 مرحله اول: دوره جامع Deep Learning


پایه‌ای‌ترین و ضروری‌ترین گام برای ورود حرفه‌ای به هوش مصنوعی.
شامل مفاهیم کلیدی یادگیری عمیق

🔗 لینک دوره: https://mktb.me/2klm/

🤖 مرحله دوم: دوره جامع LLM


اینجا قلب ماجرا است، در این دوره به‌صورت مفهومی و پروژه‌محور یاد می‌گیرید:

طراحی و آموزش مدل‌های زبانی بزرگ

مفاهیم کلیدی مثل Transformer، Attention، Instruction Tuning

روش‌های پیشرفته مثل RLHF، DPO، GRPO و RAG

ساخت اپلیکیشن‌های مبتنی بر LLM


🔗 لینک دوره: https://mktb.me/04dr/

🖼 مرحله سوم: دوره VLM (مدل‌های چندوجهی متن-تصویر)

اگر می‌خواهید فراتر از متن بروید و وارد دنیای مدل‌های بینایی-زبانی شوید، این مرحله مخصوص شماست.
در این دوره با معماری‌ها و کاربردهای VLM آشنا می‌شوید؛ مثل:

درک و تحلیل تصویر با مدل‌های چندوجهی

Visual QA

OCR و سیستم‌های ترکیبی متن-تصویر

فاین تیون VLM ها


🔗 لینک دوره: https://mktb.me/e3gx/
6
🎁🎊🎉به بهانه بلک فرایدی
برای همراهان کانال 👇

🎓 دوره جامع LLM
با تخفیف ۷۰٪ واقعی
🎟 بلیط ورود به دنیای مدل‌های زبانی بزرگ 🚀

کد تخفیف: COUPON-fa527
فقط برای مدت محدود - تا 10 آذرماه
https://mktb.me/04dr/
++++++++++++++++++
🎓 دوره جامع VLM – مدل‌های زبانی-تصویری

با تخفیف ۷۰٪ واقعی
🎟 ورود به دنیای مولتی‌مودال و AI ترکیبی 🚀

کد تخفیف: COUPON-0db40
فقط برای مدت محدود – تا 10 آذرماه
https://mktb.me/e3gx/
++++++++++++++++++

🎓 دوره جامع دیپ‌لرنینگ با TensorFlow
با تخفیف ۷۰٪ واقعی
🎟 یادگیری عملی شبکه‌های عصبی و پروژه‌های AI 🚀
کد تخفیف: COUPON-dc646
فقط برای مدت محدود – تا 10 آذرماه
https://mktb.me/2klm/
4👍4🤔2
🚀 Qwen3-VL Tech report is now out on arXiv!

From pretraining to post-training, architecture to infra, data to evaluation — we’ve packed in the details for anyone building on vision-language models.

🔥 3 models >1M downloads in just over a month
🏆 Qwen3-VL-8B leads with 2M+ downloads
📚 Built on the shoulders of Qwen2.5-VL (2800+ citations in <10 months!)

Check out the paper for insights, baselines, and future directions.
Let’s keep pushing VLMs forward — together.

arxiv.org/pdf/2511.21631
6
https://jsai.ir/

فایل زیپ اشاره شده در ویدیوهای کورس prompt api مرورگر؛ ابتدای این سایت اضافه شد

https://jsai.ir/
🙏3
آموزش LLM و VLM
https://jsai.ir/ فایل زیپ اشاره شده در ویدیوهای کورس prompt api مرورگر؛ ابتدای این سایت اضافه شد https://jsai.ir/
مینی دوره ساخت هوش مصنوعی شخصی در مرورگر؛ برای معرفی قابلیت جدید مرورگرهاست، چیزی که بدون ابزار اضافی شما را قادر میکنه از LLM داخلی مرورگر سوال بپرسید؛ مثلا فقط با این چند خط کد js تو مرورگر کروم یا اج
البته به شرط داشتن سخت افزار و به روز بودن مرورگر


  //  Create Session: 
const session = await LanguageModel.create();

// Define the Question (Prompt)
const question = "پایتخت ایران کجاست؟ فقط نام شهر را بگو.";

console.log(`سؤال شما: ${question}`);

// Prompt the model:
const result = await session.prompt(question);

// Display the result
console.log("پاسخ هوش مصنوعی:", result);

ما اصلا فریم ورکی نیاز نیست نصب کنیم، خود مرورگرها اضافه کردند و بیشتر برای کلاینت ساید کارها جذابه...

مثالهاشم اینجاست:

https://jsai.ir/
5🙏3👍1
📢 اطلاعیه دوره Agentic AI

پس از برگزاری دوره‌های «LLM» و «VLM»، اکنون دوره جدید «Agentic AI» در آستانه انتشار قرار دارد.

این دوره که پیش‌تر به دلیل شرایط جنگی با تأخیر مواجه شده بود، اکنون در مراحل نهایی آماده‌سازی قرار دارد و آخرین جلسه آن روز شنبه ضبط خواهد شد.

🗓 زمان تقریبی انتشار: اواسط تیرماه

سرفصل‌های دوره:

🔹 Reflection
🔹 Tool Use
🔹 Planning
🔹 Multi-Agent Collaboration
🔹 Model Context Protocol (MCP)
🔹 Evaluation of Agentic Systems
🔹 CrewAI Framework
🔹 LangChain & LangGraph

در این دوره با مفاهیم، معماری‌ها، چارچوب‌ها و روش‌های عملی طراحی و توسعه Agentهای هوشمند آشنا خواهید شد و نحوه ساخت سیستم‌های Agentic مدرن را به‌صورت گام‌به‌گام فرا خواهید گرفت.

منتظر انتشار این دوره باشید.
67👍4🙏2
This media is not supported in your browser
VIEW IN TELEGRAM
آیا gzip می‌تواند یک مدل زبانی باشد؟

یک محقق کشف کرد که gzip — همان الگوریتم فشرده‌سازی قدیمی و ساده لینوکس — می‌تواند متن تولید کند؛ بدون هیچ شبکه عصبی، بدون وزن، بدون آموزش.
چطور؟
هر الگوریتم فشرده‌سازی در دلش یک مدل احتمالاتی پنهان دارد:
داده‌ای که «انتظارش را دارد» با بایت کمتری کُد می‌شود
داده غیرمنتظره بایت بیشتری می‌خواهد

پس می‌شود از این معیار به عنوان امتیازدهی استفاده کرد:
هر ادامه متنی که بهتر فشرده شود، «محتمل‌تر» است!
روش کار (gzipt):
۱. یک corpus (مثلاً متون شکسپیر) به gzip داده می‌شود
۲. یک prompt ورودی می‌گیرد
۳. با beam search روی توالی بایت‌ها جستجو می‌کند
۴. ادامه‌ای را انتخاب می‌کند که بهترین فشرده‌سازی را داشته باشد
نتیجه؟
خروجی کاملاً منسجم نیست، ولی به‌طور شگفت‌انگیزی ساختار زبان را درک کرده!
این ایده از مقاله‌ای با نام "Language Modeling is Compression" الهام گرفته که می‌گوید:
هر مدل پیش‌بینی، یک compressor است و هر compressor یک مدل پیش‌بینی.


بلاگ پست:
🔗 https://nathan.rs/posts/gzip-lm/

کد پروژه:
🔗 nathan.rs/posts/
21🔥5👍1🤔1