یادگیری ماشین
3.38K subscribers
21 photos
2 videos
26 files
142 links
Download Telegram
یادگیری ماشین
دیروز شرکت OpenAI جدیدترین مدل خود را که پیش‌نمایشی از مدل o1 است معرفی کرد. این مدل که قبلا با نام‌های *Q و توت‌فرنگی در رسانه‌ها مطرح شده بود، قدرت استنتاج و استدلال پیشرفته‌تری از مدل‌های قبلی ارائه می‌دهد. البته این فرآیند استدلال باعث کندتر بودن تولید…
مدل o1 که ۴۰ روز پیش از حالت پیش‌نمایش خارج و نسخه‌ی کامل آن ارائه شد، یک ویژگی مهم دارد: مقیاس کردن در زمان استنتاج (inference-time scaling). منظور از این ویژگی چیست؟
همان‌طور که می‌دانیم روند پیشرفت مدل‌های زبانی به سمت مقیاس کردن در فاز آموزش بوده است: استفاده از داده‌های بیشتر و آموزش مدل‌های بزرگ‌تر برای به‌دست آوردن نتایج بهتر. مدل o1 مسیر دیگری را پیموده است: برای بهبود نتایج، به مدل اجازه داده می‌شود که در هنگام تولید خروجی (فاز استنتاج)، فرصت تولید خروجی بیشتر یا حتی تولید خروجی‌های مختلف و انتخاب از بین آنها داشته باشد.
به‌دلیل این ویژگی، مدل o1 برای مسائلی که بین تولید پاسخ و بررسی صحت پاسخ، فاصله وجود دارد (generation-verification gap) مناسب است. منظور، مسائلی است که تولید پاسخ، مشکل‌تر از بررسی صحت پاسخ است. به‌عنوان مثال، برای اثبات یک قضیه، تولید اثبات، مشکل‌تر از بررسی صحت یک اثبات است. ویژگی مقیاس کردن در زمان استنتاج این امکان را برای o1 فراهم می‌کند که با تولید اثبات‌های مختلف و بررسی صحت آنها به سمت اثبات درست حرکت کند.
👍24
Batch-Issue300.wav
25.3 MB
یکی از منابع خوب برای پیگیری اخبار مربوط به هوش مصنوعی، هفته‌نامه‌ی Batch شرکت DeepLearning.AI آقای Andrew Ng است. تصمیم گرفتم با کمک NotebookLM هر هفته یک پادکست فارسی کوتاه از این منبع در کانال قرار دهم. پادکست مربوط به لینک زیر را در این فایل بشنوید.
https://www.deeplearning.ai/the-batch/issue-300/
👍51
Batch-Issue301.wav
16.8 MB
پادکست اخبار هوش مصنوعی (۱۴ می ۲۰۲۵)، تولید شده از طریق NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-301/
👍22
Batch-Issue302.wav
22.7 MB
پادکست اخبار هوش مصنوعی (۲۱ می ۲۰۲۵)، تولید شده با NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-302/
👍11
Batch-Issue303.wav
21 MB
پادکست اخبار هوش مصنوعی (۲۸ می ۲۰۲۵)، تولید شده با NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-303/
👍10
آیا با ادامه دادن پادکست اخبار هوش مصنوعی موافق هستید؟
anonymous poll

بله، مفید است و گوش می‌دهم. – 117
👍👍👍👍👍👍👍 85%

خیر، صرف‌نظر می‌کنم. – 20
👍 15%

👥 137 people voted so far.
👍10
Batch-Issue304.wav
20.9 MB
پادکست اخبار هوش مصنوعی (۴ ژوئن ۲۰۲۵)، تولید شده با NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-304
👍12
مطالعه‌ای جدید از MIT نشان داده که افرادی که برای نوشتن انشا از ChatGPT استفاده کرده‌اند، فعالیت مغزی بسیار کمتری نسبت به افرادی داشته‌اند که خودشان متن را نوشته‌ یا از گوگل برای جستجو استفاده کرده‌اند.
یافته‌ی دیگر این بود که متن‌های تولیدشده توسط این کاربران تمایل به استفاده از واژگان و ایده‌های مشترک داشتند؛ استفاده از هوش مصنوعی نوعی اثر همگن‌سازی ایجاد کرده بود.

http://newyorkermag.visitlink.me/hWuRQz
👍17
Batch-Issue305.wav
26.1 MB
پادکست اخبار هوش مصنوعی (١١ ژوئن ۲۰۲۵)، تولید شده با NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-305
👍10
Batch-Issue306.wav
20.5 MB
پادکست اخبار هوش مصنوعی (۱۸ ژوئن ۲۰۲۵)، تولید شده با NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-306
👍7
Batch-Issue307.wav
18.8 MB
پادکست اخبار هوش مصنوعی (۲۵ ژوئن ۲۰۲۵)، تولید شده با NotebookLM مربوط به لینک زیر:
https://www.deeplearning.ai/the-batch/issue-307
👍5
نسخه‌ی سوم کتاب یادگیری عمیق با پایتون آقای فرانسوا شوله که به زودی منتشر می‌شود، در وب‌سایت کتاب به آدرس زیر بطور رایگان در دسترس قرار گرفته است. این کتاب یکی از بهترین منابع این حوزه است و در این نسخه به مباحث جدیدتر مانند ترنسفورمرها و مدل‌های بزرگ زبانی هم پرداخته شده است.

https://deeplearningwithpython.io/chapters/
👍38
درس یادگیری عمیق استنفورد مربوط به ترم جاری که ویدئوها در طول ترم بارگذاری می‌شوند:

https://youtube.com/playlist?list=PLoROMvodv4rNRRGdS0rBbXOUGA0wjdh1X&si=rxVW_A-bb9FB7IN7
👍25
متاسفانه با شرایط فعلی در ایران عزیز، انتشار مطلب در این کانال می‌تواند نامناسب تلقی شود، ولی به هرحال ما باید سعی کنیم با وجود شرایط سخت موجود، راهمان را ادامه دهیم. به همین دلیل تصمیم گرفتم بعد از مدت‌ها پستی منتشر کنم.

مهم‌ترین مهارتی که در زمان فعلی توصیه می‌شود، یادگیری نحوه‌ی کار حرفه‌ای با ابزارهایی مانند Claude Code است. در آینده‌ی نزدیک، مهارت بکارگیری مناسب این ابزارها (فراتر از Vibe Coding معمولی)، جزء مهارت‌های ضروری برای افرادی که در حوزه‌ی برنامه‌نویسی مشغول هستند خواهد بود. البته بهترین روش‌های این حوزه (best practice) هنوز به کمال نرسیده‌اند. منبع زیر که کتابی آنلاین (و در حال توسعه) از سیمون ویلسون (از توسعه‌دهندگان چارچوب جنگو) است تلاشی است برای تدوین این روش‌ها که مطالعه‌ی آن را توصیه می‌کنم:
https://simonwillison.net/guides/agentic-engineering-patterns/
👍33
در راستای پست قبل، این راهنما هم بسیار مفید است:
https://every.to/guides/compound-engineering

علاوه بر معرفی پلاگین کاربردی Compound Engineering، تلاشی ساختارمند برای تدوین اصول برنامه‌نویسی در عصر جدید هم انجام داده‌اند که ارزش مطالعه دارد.
👍11