🐋✍️I went through every detail of the DeepSeek paper and hand-drew this diagram.
It felt like building Legos from Supervised Fine-Tuning (SFT), Group Relative Policy Optimization (GRPO) in RL, long Chain-of-Thought (CoT), and more.
𝗟𝗲𝘁 𝗺𝗲 𝘁𝗲𝗹𝗹 𝘆𝗼𝘂 𝘄𝗵𝗮𝘁 𝗜 𝗹𝗲𝗮𝗿𝗻𝗲𝗱:
》 𝗠𝗮𝗶𝗻 𝗞𝗲𝘆 𝗧𝗮𝗸𝗲𝗮𝘄𝗮𝘆𝘀:
✸ DeepSeek-R1-Zero showed that reasoning could emerge without supervised data using RL.
✸ DeepSeek-R1 refined those abilities with structured data, making it human-aligned and user-friendly.
✸ DeepSeek-Distilled Models proved that reasoning power can be transferred to smaller models, ensuring efficiency without compromising performance.
﹌﹌﹌﹌﹌﹌﹌﹌
》𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸-𝗥𝟭-𝗭𝗲𝗿𝗼: 𝗧𝗵𝗲 𝗙𝗼𝘂𝗻𝗱𝗮𝘁𝗶𝗼𝗻 𝗼𝗳 𝗣𝘂𝗿𝗲 𝗥𝗟
✸ What makes DeepSeek-R1-Zero special?
It’s trained purely through Group Relative Policy Optimization (GRPO), a cost-efficient RL framework.
The model learns advanced reasoning without any prior fine-tuning, achieving capabilities like:
https://x.com/MaryamMiradi/status/1900924998207848536?s=19
Paper: arxiv.org/pdf/2501.12948
It felt like building Legos from Supervised Fine-Tuning (SFT), Group Relative Policy Optimization (GRPO) in RL, long Chain-of-Thought (CoT), and more.
𝗟𝗲𝘁 𝗺𝗲 𝘁𝗲𝗹𝗹 𝘆𝗼𝘂 𝘄𝗵𝗮𝘁 𝗜 𝗹𝗲𝗮𝗿𝗻𝗲𝗱:
》 𝗠𝗮𝗶𝗻 𝗞𝗲𝘆 𝗧𝗮𝗸𝗲𝗮𝘄𝗮𝘆𝘀:
✸ DeepSeek-R1-Zero showed that reasoning could emerge without supervised data using RL.
✸ DeepSeek-R1 refined those abilities with structured data, making it human-aligned and user-friendly.
✸ DeepSeek-Distilled Models proved that reasoning power can be transferred to smaller models, ensuring efficiency without compromising performance.
﹌﹌﹌﹌﹌﹌﹌﹌
》𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸-𝗥𝟭-𝗭𝗲𝗿𝗼: 𝗧𝗵𝗲 𝗙𝗼𝘂𝗻𝗱𝗮𝘁𝗶𝗼𝗻 𝗼𝗳 𝗣𝘂𝗿𝗲 𝗥𝗟
✸ What makes DeepSeek-R1-Zero special?
It’s trained purely through Group Relative Policy Optimization (GRPO), a cost-efficient RL framework.
The model learns advanced reasoning without any prior fine-tuning, achieving capabilities like:
https://x.com/MaryamMiradi/status/1900924998207848536?s=19
Paper: arxiv.org/pdf/2501.12948
👍8❤1
آیا ما در آستانه کشف حقیقتی تکاندهنده دربارهی واقعیت هستیم؟
دانشمندی از دانشگاه پرینستون، هونگ کین، دست به کاری زده که مرزهای علم را میشکند: هوش مصنوعیای که بدون استفاده از قوانین فیزیکی سنتی، مسیر حرکت سیارات را پیشبینی میکند!
این الگوریتم، که با یادگیری ماشینی کار میکند، تنها با تحلیل دادههای مداری توانست الگوهای حرکت را کشف کند بیآنکه حتی یک خط از قوانین نیوتن در #برنامه_نویسی آن گنجانده شده باشد!
اما این تازه شروع ماجراست. کین اکنون این فناوری را برای مطالعه رفتار پلاسما در تحقیقات انرژی همجوشی به کار گرفته و حتی در حال بررسی کاربردهای آن در #فیزیک_کوانتومی است. آیا ممکن است که روشهای سنتی علمی دیگر کارایی نداشته باشند؟ کار کین این سؤال را مطرح میکند که آیا میتوان بدون نیاز به قوانین نظری، مستقیماً از دادهها به حقیقت دست یافت؟
و اینجاست که ماجرا رنگی فلسفی و حتی شبیه به یک داستان علمیتخیلی به خود میگیرد. رویکرد کین به طرز شگفتانگیزی با فرضیهی شبیهسازی که توسط فیلسوف نیک باستروم مطرح شده، همخوانی دارد ایدهای که میگوید شاید جهان ما چیزی جز یک شبیهسازی عظیم محاسباتی نباشد!
اگر طبیعت را بتوان تنها از طریق الگوریتمهای گسسته، و نه قوانین فیزیکی پیوسته، توصیف کرد، آیا این نشان نمیدهد که خود جهان نیز مانند یک سیستم محاسباتی عمل میکند؟
ممکن است نسلها با پاسخ به این پرسش فاصله داشته باشیم، اما تحقیقات کین میتواند اولین گام در جهت درک جهان به عنوان یک ساختار کدگذاریشده باشد.
▪️ Machine learning and serving of discrete field theories
▪️ Physicist creates AI algorithm that may prove reality is a simulation
#الگوریتمها #هوش_مصنوعی #فیزیک #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
دانشمندی از دانشگاه پرینستون، هونگ کین، دست به کاری زده که مرزهای علم را میشکند: هوش مصنوعیای که بدون استفاده از قوانین فیزیکی سنتی، مسیر حرکت سیارات را پیشبینی میکند!
این الگوریتم، که با یادگیری ماشینی کار میکند، تنها با تحلیل دادههای مداری توانست الگوهای حرکت را کشف کند بیآنکه حتی یک خط از قوانین نیوتن در #برنامه_نویسی آن گنجانده شده باشد!
اما این تازه شروع ماجراست. کین اکنون این فناوری را برای مطالعه رفتار پلاسما در تحقیقات انرژی همجوشی به کار گرفته و حتی در حال بررسی کاربردهای آن در #فیزیک_کوانتومی است. آیا ممکن است که روشهای سنتی علمی دیگر کارایی نداشته باشند؟ کار کین این سؤال را مطرح میکند که آیا میتوان بدون نیاز به قوانین نظری، مستقیماً از دادهها به حقیقت دست یافت؟
و اینجاست که ماجرا رنگی فلسفی و حتی شبیه به یک داستان علمیتخیلی به خود میگیرد. رویکرد کین به طرز شگفتانگیزی با فرضیهی شبیهسازی که توسط فیلسوف نیک باستروم مطرح شده، همخوانی دارد ایدهای که میگوید شاید جهان ما چیزی جز یک شبیهسازی عظیم محاسباتی نباشد!
اگر طبیعت را بتوان تنها از طریق الگوریتمهای گسسته، و نه قوانین فیزیکی پیوسته، توصیف کرد، آیا این نشان نمیدهد که خود جهان نیز مانند یک سیستم محاسباتی عمل میکند؟
ممکن است نسلها با پاسخ به این پرسش فاصله داشته باشیم، اما تحقیقات کین میتواند اولین گام در جهت درک جهان به عنوان یک ساختار کدگذاریشده باشد.
▪️ Machine learning and serving of discrete field theories
▪️ Physicist creates AI algorithm that may prove reality is a simulation
#الگوریتمها #هوش_مصنوعی #فیزیک #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍34❤4👎4🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
ی مجری #هوش_مصنوعی ساختن مثلا بعد اومدن پزشو میدن 😂 بابا اینو هم میشع ی ضبط صوت گرفت صدایی ضبط کرد بهش داد بیاد بگه دیگه اینکه ربات هوش مصنوعی ساختیم چیه ی چی باشه بشه حداقل دفاع کرد مشارکتش کجاست این الان
👍21👎2❤1👌1
MCP is going crazy viral right now🤯
AI apps can now instantly connect to any tool or live data.
USB-C moment for AI.
https://x.com/minchoi/status/1900931746448756879?t=VyT6wIziArRzfGiE7YHTKA&s=19
AI apps can now instantly connect to any tool or live data.
USB-C moment for AI.
https://x.com/minchoi/status/1900931746448756879?t=VyT6wIziArRzfGiE7YHTKA&s=19
👍9
Introducing: ShieldGemma 2 - a 4B model for image safety classification
Use as input filter for VLMs
or for blocking dangerous image generation outputs
https://developers.googleblog.com/en/safer-and-multimodal-responsible-ai-with-gemma/
https://huggingface.co/google/shieldgemma-2-4b-it
Use as input filter for VLMs
or for blocking dangerous image generation outputs
https://developers.googleblog.com/en/safer-and-multimodal-responsible-ai-with-gemma/
https://huggingface.co/google/shieldgemma-2-4b-it
👍2
DeepMind AI Expert
اینم بهترین مدل برای کسایی که با OCR کار میکنن Mistral OCR https://mistral.ai/news/mistral-ocr #مقاله #ایده_جذاب 🔸 مطالب بیشتر 👇👇 ✅ @AI_DeepMind 🔸 @AI_Person
این ی مدل بزرگتر و قوی تر از مدل mistral برای کار با OCR منتشر کردند
▪️ SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion
▪️ Huggingface
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion
▪️ Huggingface
#علوم_پزشکی #مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4
مقاله زیر به معرفی مدل YOLOE میپردازد که یک مدل یکپارچه و کارآمد برای تشخیص و بخشبندی اشیاء است. این مدل قابلیت پردازش پرامپتهای متنی، پرامپتهای بصری و حالت بدون پرامپت را داراست و در سناریوهای باز عملکرد بالایی ارائه میدهد.مدلهای سنتی مانند سری YOLO با وجود کارایی و دقت بالا، به دستهبندیهای از پیش تعریفشده محدود هستند که انعطافپذیری آنها را در سناریوهای باز کاهش میدهد. روشهای اخیر برای غلبه بر این محدودیتها از پرامپتهای متنی، نشانههای بصری یا پارادایمهای بدون پرامپت استفاده میکنند، اما معمولاً بین عملکرد و کارایی به دلیل نیازهای محاسباتی بالا یا پیچیدگی در پیادهسازی مصالحه میکنند. YOLOE با ادغام مکانیزمهای مختلف پرامپت در یک مدل کارآمد، امکان مشاهدهٔ هر چیزی در زمان واقعی را فراهم میکند. برای پرامپتهای متنی، استراتژی همترازی مجدد منطقه-متن قابل بازپارامتریسازی (RepRTA) معرفی شده است که با استفاده از یک شبکهٔ کمکی سبک، جاسازیهای متنی پیشآموزشدیده را بهبود میبخشد و همترازی بصری-متنی را بدون افزایش هزینهٔ استنتاج و انتقال تقویت میکند. برای پرامپتهای بصری، رمزگذار پرامپت بصری فعالشده توسط معناشناسی (SAVPE) ارائه شده است که با استفاده از شاخههای جداگانهٔ معناشناسی و فعالسازی، جاسازیهای بصری بهبود یافته و دقت را با حداقل پیچیدگی بهبود میبخشد. در سناریوی بدون پرامپت، استراتژی مقایسهٔ تنبل منطقه-پرامپت (LRPC) معرفی شده است که با استفاده از یک واژگان بزرگ داخلی و جاسازیهای تخصصی، تمام اشیاء را شناسایی میکند و از وابستگی به مدلهای زبانی پرهزینه جلوگیری میکند.
▪️ YOLOE: Real-Time Seeing Anything
▪️ GitHub
#مقاله #ایده_جذاب #پایتون
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ YOLOE: Real-Time Seeing Anything
▪️ GitHub
#مقاله #ایده_جذاب #پایتون
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
تبلیغ Perplexity با بازیگر اصلی اسکویید گیم
گوگل رو هم مسخره کرده
میگن خودش یکی از سهامدارن این استارت آپ هستش
تو این تبلیغ گوگل رو حسابی دیس کرده و اسمش رو گذاشته poogle که وقتی لی ازش سوال میپرسه خیلی بی خاصیت عمل میکنه ولی درمقابل پرپلکسیتی سوالات رو سریع جواب میده و به خصوص توی سوال نحوه پخت پیتزا میگه توش چسب نریز که اینم یه دیس سنگین دیگه واسه فاجعه ai overview گوگل هست.
گوگل رو هم مسخره کرده
میگن خودش یکی از سهامدارن این استارت آپ هستش
تو این تبلیغ گوگل رو حسابی دیس کرده و اسمش رو گذاشته poogle که وقتی لی ازش سوال میپرسه خیلی بی خاصیت عمل میکنه ولی درمقابل پرپلکسیتی سوالات رو سریع جواب میده و به خصوص توی سوال نحوه پخت پیتزا میگه توش چسب نریز که اینم یه دیس سنگین دیگه واسه فاجعه ai overview گوگل هست.
👍10❤7👎2🔥1
زردی من از تو
سرخی تو از من
غم برو شادی بیا
محنت برو روزی بیا
چهارشنبه سوری بر همگان خجسته باد
سرخی تو از من
غم برو شادی بیا
محنت برو روزی بیا
چهارشنبه سوری بر همگان خجسته باد
❤38👎7👍1
Media is too big
VIEW IN TELEGRAM
قطعه《نوروز》
بیا بیا دلبروک مو قربون تو شم دنیا دو روزه
بیا مکن شو روز مو خورشید مو صبح نوروزه
دیدی چطو مانند او یک سال برفت، سال نو اومد؟
یکسال چنو تندِ برفت که پندری همی دیروزه
آی بیا که نوروزه دنیا دو روزه
تا عالمی ، جون دلم، چشمم خو ورسوزه
بینه که قد تو کمون و پشت مو قوزه
بیا بیا دلبروک مو قربون تو شم دنیا دو روزه
بیا مکن شو روز مو خورشید مو صبح نوروزه
دیدی چطو مانند او یک سال برفت، سال نو اومد؟
یکسال چنو تندِ برفت که پندری همی دیروزه
آی بیا که نوروزه دنیا دو روزه
تا عالمی ، جون دلم، چشمم خو ورسوزه
بینه که قد تو کمون و پشت مو قوزه
❤18
سلام.. اگر در حوزه object detection کار میکنید آخرین مقاله literature review ما که شامل بررسی 260 مقاله در زمینه کاربرد context در تشخیص اشیا در هفت شاخه Object detection هست میتونه کمکتون کنه.
https://link.springer.com/article/10.1007/s10462-025-11186-x
https://link.springer.com/article/10.1007/s10462-025-11186-x
SpringerLink
Context in object detection: a systematic literature review
Artificial Intelligence Review - Context is an important factor in computer vision as it offers valuable information to clarify and analyze visual data. Utilizing the contextual information...
❤14👍5🔥1
Forwarded from Recommender system (MehriMah Amiri)
What is overfitting in machine learning?
Anonymous Quiz
16%
When a model memorizes the training data but still achieves low error on unseen test data.
13%
When a model is trained for too many epochs, making it sensitive to minor variations in the training
52%
When a model is too complex and fits the training data perfectly but struggles to adapt to new patte
19%
When a model captures noise in the training data, leading to poor generalization on new data.
👎59👍10🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
نوروزتون مبارک عزیزان
با ارزوی موفقیت و تندرستی برای شما و خانواده های بزرگوارتون سال ۴۰۴ براتون سالی برای هرانچه ک میخواید رقم بخوره باشه
با ارزوی موفقیت و تندرستی برای شما و خانواده های بزرگوارتون سال ۴۰۴ براتون سالی برای هرانچه ک میخواید رقم بخوره باشه
❤20👎3
DeepMind AI Expert
نوروزتون مبارک عزیزان با ارزوی موفقیت و تندرستی برای شما و خانواده های بزرگوارتون سال ۴۰۴ براتون سالی برای هرانچه ک میخواید رقم بخوره باشه
Media is too big
VIEW IN TELEGRAM
نوروزتون مبارک ❤️ در این مدت که همراه کانال بودین سپاسگزارم. امیدوارم که سالی درخشان در زندگیتون تجربه کنید همان باشد که در خاطر دارید❤️
❤26🆒1