هوش مصنوعی و علم داده به فارسی
6.08K subscribers
982 photos
266 videos
318 files
1.06K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
03. Reasoning Model.pdf
8.2 MB
📚 Build a Reasoning Model From Scratch راهنمای ساخت مدل استدلال

‏این کتاب، فهرستی جامع از فصول و تمرین‌های عملی برای توسعه و ارزیابی مدل‌های استدلال ارائه می‌دهد. ابتدا مفاهیم پایه‌ای درک مدل‌های استدلال بررسی می‌شود و سپس با استفاده از یک LLM پیش‌آموزش‌داده‌شده، روش‌های تولید متن معرفی می‌گردد. در فصول بعدی، ارزیابی مدل‌های استدلال، بهبود آن‌ها با تکنیک‌های مقیاس‌گذاری در زمان استنتاج (Inference-Time Scaling) و خودبهبود (Self-Refinement) شرح داده می‌شود. همچنین بخش‌های ویژه‌ای برای آموزش با روش تقویت یادگیری (Reinforcement Learning) و بهبود الگوریتم GRPO، تقطیر مدل برای کارایی بالا، استفاده از LLMهای بزرگتر، بهینه‌سازی پردازش دسته‌ای و ارزیابی‌های متنوع ارائه شده است. در پیوست‌ها، کد منبع Qwen3، راهنمای ساخت رابط چت، و منابع مطالعاتی بیشتر گنجانده شده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #RLHF
1