حلقه ژیگز
یکی از ماجراهای ترند این هفته دانشکده کامپیوتر شریف، به امتحان هفته پیش یکی از درسها برمیگرده. ماجرا اینجوریه که امتحان میانترم یکی از پرجمعیتترین درسها داشته بعد از ظهر برگزار میشه، بعد یهو برق میره و سالن غرق تاریکی میشه. در همین حال که دیگه چشمها پوشیده میشه برخی از مردم هم شروع میکنن به تقلب کردن. یکی موبایل درمیاره از gpt میپرسه یکی از کناریهاش میپرسه، یکی برگه اش رو با یکی دیگه تعویض میکنه و .... خلاصه نهایتا مسئولین اون درس بعد امتحان تصمیم میگیرند با توجه به حجم و کیفیت تقلبهای رخ داده امتحان رو ملغی و دوباره بعداً برگزارش کنند.
حالا کاری به کیفیت و چرایی این اتفاق رخداده نداریم. ماجرا اما اینه که طرف در شریف هم باشه وقتی ترس از افشاشدن و جریمهشدن برداشته بشه، دست به تقلب میزنه. بله. حالا این آدمها که امروز نهایتا بتونم در حد یکی دو نمره خارج از اخلاق بازی کنند فردا روزی وقتی در موقعیتهای بالاتر قرار بگیرند چه میکنند. چرا اصلا آدم دست به اختلاس نزنه؟ تصور کنید اگر این میزان ترس از تهدیدشدن کاهش پیدا کنه آدم تبدیل به چه موجودی میشه. اخلاق وجود نداره. یا یک ترس از تهدید شدنه یا یک ریاکاری. فاصله ما با اپستین خیلی کمتر از حدیه که بهش فکر کرده باشیم. تا حالا فکر کردید شما اگر ترسی و تهدیدی (هیچ تهدیدی) بالاسرتون نباشه دست به چه کارهایی میزدید؟
مرتبط با این، افلاطون در کتاب جمهور خودش یک آزمایش-داستان طراحی میکنه. داستان از این قراره که چوپانی یک حلقه پیدا میکنه که با چرخوندنش نامرئی میشه. بحث افلاطون اینه: اگر انسان مطمئن باشه که دیده نمیشه (مجازاتی در کار نیست)، آیا باز هم اخلاقی رفتار میکنه؟ یا اینکه اخلاق فقط یک قرارداد اجتماعیه برای جلوگیری از هرجومرج؟
یکی از ماجراهای ترند این هفته دانشکده کامپیوتر شریف، به امتحان هفته پیش یکی از درسها برمیگرده. ماجرا اینجوریه که امتحان میانترم یکی از پرجمعیتترین درسها داشته بعد از ظهر برگزار میشه، بعد یهو برق میره و سالن غرق تاریکی میشه. در همین حال که دیگه چشمها پوشیده میشه برخی از مردم هم شروع میکنن به تقلب کردن. یکی موبایل درمیاره از gpt میپرسه یکی از کناریهاش میپرسه، یکی برگه اش رو با یکی دیگه تعویض میکنه و .... خلاصه نهایتا مسئولین اون درس بعد امتحان تصمیم میگیرند با توجه به حجم و کیفیت تقلبهای رخ داده امتحان رو ملغی و دوباره بعداً برگزارش کنند.
حالا کاری به کیفیت و چرایی این اتفاق رخداده نداریم. ماجرا اما اینه که طرف در شریف هم باشه وقتی ترس از افشاشدن و جریمهشدن برداشته بشه، دست به تقلب میزنه. بله. حالا این آدمها که امروز نهایتا بتونم در حد یکی دو نمره خارج از اخلاق بازی کنند فردا روزی وقتی در موقعیتهای بالاتر قرار بگیرند چه میکنند. چرا اصلا آدم دست به اختلاس نزنه؟ تصور کنید اگر این میزان ترس از تهدیدشدن کاهش پیدا کنه آدم تبدیل به چه موجودی میشه. اخلاق وجود نداره. یا یک ترس از تهدید شدنه یا یک ریاکاری. فاصله ما با اپستین خیلی کمتر از حدیه که بهش فکر کرده باشیم. تا حالا فکر کردید شما اگر ترسی و تهدیدی (هیچ تهدیدی) بالاسرتون نباشه دست به چه کارهایی میزدید؟
مرتبط با این، افلاطون در کتاب جمهور خودش یک آزمایش-داستان طراحی میکنه. داستان از این قراره که چوپانی یک حلقه پیدا میکنه که با چرخوندنش نامرئی میشه. بحث افلاطون اینه: اگر انسان مطمئن باشه که دیده نمیشه (مجازاتی در کار نیست)، آیا باز هم اخلاقی رفتار میکنه؟ یا اینکه اخلاق فقط یک قرارداد اجتماعیه برای جلوگیری از هرجومرج؟
Out of Distribution
بلعیده و هضمشدن آدمها در میدانها این اواخر با یک فرد فرهیختهای آشنا شدم که از فرصتهای همصحبتی که با ایشون گهگاه رخ میداد، لذت میبردم و یاد میگرفتم. این بزرگ، البته بر خلاف من، ساکت و فروتن هستند. یکبار ازش پرسیدم چرا مثلا جایی اثری از شما نیست و…
نتانیاهو اخیرا در مورد درخواست ترکیه برای تحویل گرفتن F-35 ها چنین چیزی گفته:
کسی هم نیست بهش بگه آقا اینها اصلا مال آمریکاست به تو چه اصلا. یک سیاست واقعگرایی و تهاجمی رو داره اتخاذ میکنه که البته از ساید خودشون هم درست هست و دلیل بخشی از موفقیتش هم همینه. بعد اینجا اون وقت شاهد یک عدهای هستیم که هنوز در دوران خوش پیش از ۲۰۰۸ زیست میکنند شعار همزیستی مسالمتآمیز میدن و فکر میکنند همه چیز با گفتگوی صرف حل میشه، گویی دنیا در چشمشون کارتون خرس های مهربونه. البته که اینها به معنی طرفداری من از میدان مقابل نیست. من ممکنه طرفدار تسلیم شدن باشم ولی به این معنا نیست که فکر کنم که مشکلات دنیا با گفتگو حل میشه.
لینک:
https://www.timesofisrael.com/liveblog_entry/netanyahu-israel-investing-more-than-100-billion-in-arms-production-in-bid-for-independence/
And in a thinly veiled reference to Turkey’s quest to receive the F-35 fighter jet from the US, Netanyahu promises that Israel will “prevent whoever must be prevented from receiving these instruments.”
کسی هم نیست بهش بگه آقا اینها اصلا مال آمریکاست به تو چه اصلا. یک سیاست واقعگرایی و تهاجمی رو داره اتخاذ میکنه که البته از ساید خودشون هم درست هست و دلیل بخشی از موفقیتش هم همینه. بعد اینجا اون وقت شاهد یک عدهای هستیم که هنوز در دوران خوش پیش از ۲۰۰۸ زیست میکنند شعار همزیستی مسالمتآمیز میدن و فکر میکنند همه چیز با گفتگوی صرف حل میشه، گویی دنیا در چشمشون کارتون خرس های مهربونه. البته که اینها به معنی طرفداری من از میدان مقابل نیست. من ممکنه طرفدار تسلیم شدن باشم ولی به این معنا نیست که فکر کنم که مشکلات دنیا با گفتگو حل میشه.
لینک:
https://www.timesofisrael.com/liveblog_entry/netanyahu-israel-investing-more-than-100-billion-in-arms-production-in-bid-for-independence/
The Times of Israel
Netanyahu: Israel investing more than $100 billion in bid for independent arms industry
* * *
گاها پیش میاد سناروهایی که من با یک اشخاصی باید جلسه برم. بعد خود اون بزرگ هم اوکی میده میگه آره به منشیم تماس بگیر برای زمانبندی. بعد من با منشی طرف که وارد صحبت میشم اون قابل نمیدونه جلسه بذاره میگه اصلا جلسه نمیخواد. حالا اشکال کار هم از اون منشی نیست. بروکراسی کلا این شکلیه. شما فکر کنید دسترسی به مقامات سیاسی یک کشور دیگه چه طوری خواهد بود. نقش مدیران دفتر و منشیها فراتر از تصورهاست. آدم گاهی چیزی فراتر از شخص خودش میشه و تعریف اون آدم میشه مجموعهای از خودش و متصلات به خودش.
#تجارب
#تجارب
Out of Distribution
بلعیده و هضمشدن آدمها در میدانها این اواخر با یک فرد فرهیختهای آشنا شدم که از فرصتهای همصحبتی که با ایشون گهگاه رخ میداد، لذت میبردم و یاد میگرفتم. این بزرگ، البته بر خلاف من، ساکت و فروتن هستند. یکبار ازش پرسیدم چرا مثلا جایی اثری از شما نیست و…
وفاق را با ذکر مثال تعریف کنید.
روزنامه شرق به تازگی گزارشی منتشر کرده که در اون نوشته که گویا از طرف دانشگاه شریف به خانوادههای دانشجو های دختری که حجاب رو رعایت نمیکردند زنگ زده شده و اونها رو تهدید میکردند. جزییاتی که شرق بهشون اشاره کرده تکان دهنده است، نوع لفظهای مورد استفاده (دختر شما داره در دانشگاه بیعفتی میکنه یا دختر شما داره عریان میگرده) و حتی زنگ زدن به پدربزرگ و مادربزرگ افراد گویا رخ داده! از اون طرف معاون فرهنگی دانشگاه امروز گویا بروز این اتفاق رو تایید کرده و گفته که متوقف میشه. در همین حین بعد از این پیام، دقایقی بعد شروع کردند به فرستادن پیامک نقض الگوی رفتاری (همون عدم رعایت حجاب) برای دانشجوها :)))
حالا بحث اصلی سر خوبی یا بدی ماجرا نیست. شریف تودی درباره اش مطلب بهتری نوشته. چیزی که برای من جالبه اینه که یک دانشگاهه اما درش به طرز قشنگی یکپارچگی موج میزنه. یک عده یک اقدامی میکنند، بعد یک جای دیگه دانشگاه متوقفش میکنه، بعد دوباره همون عده یک کار دیگه ای میکنند و الی انتها.
پینوشت: آدم باید منصف باشه. چیزی که برای خودش نمیخواد رو برای دیگران هم نخواد. اگر روزی کسی زنگ بزنه به مادربزرگ مسن من و بد من رو بهش با زبان تهدید بگه قطعا من ناراحت میشم که هیچ، آمپر جوش میارم. آیا اگر بسیجی-ارزشی هستید، فارغ از این که مطمئنید هیچ وقت نقض الگوی رفتاری نمیکنید، این را برای خودتان میپسندید؟
روزنامه شرق به تازگی گزارشی منتشر کرده که در اون نوشته که گویا از طرف دانشگاه شریف به خانوادههای دانشجو های دختری که حجاب رو رعایت نمیکردند زنگ زده شده و اونها رو تهدید میکردند. جزییاتی که شرق بهشون اشاره کرده تکان دهنده است، نوع لفظهای مورد استفاده (دختر شما داره در دانشگاه بیعفتی میکنه یا دختر شما داره عریان میگرده) و حتی زنگ زدن به پدربزرگ و مادربزرگ افراد گویا رخ داده! از اون طرف معاون فرهنگی دانشگاه امروز گویا بروز این اتفاق رو تایید کرده و گفته که متوقف میشه. در همین حین بعد از این پیام، دقایقی بعد شروع کردند به فرستادن پیامک نقض الگوی رفتاری (همون عدم رعایت حجاب) برای دانشجوها :)))
حالا بحث اصلی سر خوبی یا بدی ماجرا نیست. شریف تودی درباره اش مطلب بهتری نوشته. چیزی که برای من جالبه اینه که یک دانشگاهه اما درش به طرز قشنگی یکپارچگی موج میزنه. یک عده یک اقدامی میکنند، بعد یک جای دیگه دانشگاه متوقفش میکنه، بعد دوباره همون عده یک کار دیگه ای میکنند و الی انتها.
پینوشت: آدم باید منصف باشه. چیزی که برای خودش نمیخواد رو برای دیگران هم نخواد. اگر روزی کسی زنگ بزنه به مادربزرگ مسن من و بد من رو بهش با زبان تهدید بگه قطعا من ناراحت میشم که هیچ، آمپر جوش میارم. آیا اگر بسیجی-ارزشی هستید، فارغ از این که مطمئنید هیچ وقت نقض الگوی رفتاری نمیکنید، این را برای خودتان میپسندید؟
شرق
تهدید به جای آموزش
«در روزهای اخیر انجمن اسلامی دانشجویان گزارشاتی مبنی بر تماس بخشهایی از دانشگاه با والدین دانشجویان به منظور تهدید و تذکر درخصوص پوشش دانشجویان دریافت کرده است. چنین روندی که هیچ هدف و حاصلی جز سلب آسایش دانشجویان ندارد، تعدی آشکار به حریم شخصی و حقوق دانشجو…
Out of Distribution
ژئوپلتیک لایهای هوش مصنوعی ۱/.. دو روز پیش خبر اومد که انتروپیک (سازنده مدلهای کلاد) با گوگل کلود قرارداد بسته. در نگاه اول مخصوصا اگر پیشزمینهای از بحث در ذهن آدم نباشه، براش این سوال پیش میاد که این چه معنی داره که خود گوگلی که Gemini رو داره و روش…
اینجا تا لایه تراشه صحبت کرده بودیم. شرکتهایی مثل Nvidia تراشهها رو طراحی میکنند ولی برای ساختش مجبورند به شرکت TSMC تایوان سفارش بدن و اون هست که گلوگاه اصلی تولید تراشههای دنیا هست. سوال، خود TSMC چطور تراشه میسازه و آیا لایه زیرتر از اون هم وجود داره؟ بله. در واقع خود TSMC برای ساختن تراشه از دستگاههایی به نام لیتوگرافی استفاده میکنه که یک جورهایی به طرز سادهشده میشه اون رو پرینتری در نظر گرفت که با نور روی ویفرهای سیلیکونی نقش مدارها رو چاپ میکنه. سوال: چه کسانی دستگاه لیتوگرافی تولید میکنند؟ پاسخ: تنها یک شرکت در دنیا هست که به صورت پیشرفته و درست و درمون دستگاه لیتوگرافی تولید میکنه و اون هم شرکت ASML هست که در هلنده.
حالا رویترز ادعا کرده که چینیها تونستند با مهندسی معکوس و سرمایهگذاری و هانتکردن مهندسین ASML نمونههای اولیهای از دستگاه لیتوگرافی رو بسازند:
https://www.reuters.com/world/china/how-china-built-its-manhattan-project-rival-west-ai-chips-2025-12-17/
حالا رویترز ادعا کرده که چینیها تونستند با مهندسی معکوس و سرمایهگذاری و هانتکردن مهندسین ASML نمونههای اولیهای از دستگاه لیتوگرافی رو بسازند:
https://www.reuters.com/world/china/how-china-built-its-manhattan-project-rival-west-ai-chips-2025-12-17/
Reuters
Exclusive: How China built its ‘Manhattan Project’ to rival the West in AI chips
In a high-security Shenzhen laboratory, Chinese scientists have built a prototype of a machine capable of producing cutting-edge semiconductor chips that power artificial intelligence, smartphones and weapons central to Western military dominance.
دیگه حوصله بحث کردن با آدمها، مخصوصاً اونهایی که دائم میخوان ثابت کنن دانا و فاضل مطلقاند، رو ندارم؛ همونها که به هر پدیدهای مثل یک مسئلهی علمی یا یک قانون نگاه میکنن و مدام دنبال اثبات یا ردش هستن. آدمهایی که تجربههای انسانی و احساسات رو نمیفهمن و برای تجربههای انسانی هم دنبال فرمولهکردن میگردن. بعضیها خییییلی جدی گرفتند. شب به فنا
#افکار_پریشان
#افکار_پریشان
ترک Industry کنفرانس ACL
امروز داشتم کنفرانس ACL رو چک میکردم که به صورت تصادفی دیدم که یک track به نام Industry Track هم داره که توش بیشتر از این که بخوان به مسائل آزمایشگاهی بپردازن، هدفشون بیشتر پرداختن به مسائل صنعتی و محصولی هست. چیزهایی از جنس چالشهای عملی مثل استقرار محصول، نسبت کارایی به هزینه، انواع انتخابهای طراحی و ارزیابی و مانیتورینگ محصول در دنیای واقعی هستش. مثلا این که شما چطوری latency محصولتون رو کاهش بدید، یا این که چطوری بتونید سیستمتون رو نگهداری کنید یا بهبودش بدید، چه شکلی از آدم به عنوان Human in the loop استفاده کنید، توسعه جدیدتون رو محصول رو سریعتر و کمهزینهتر انجام بدید و ...
لینک توضیحات برای ACL 2026:
https://2026.aclweb.org/calls/industry_track/
جدید هم نیست و پارسال هم داشتند و لیست پیپرهای پارسال ACL تو این ترک رو میشه اینجا دید:
https://2025.aclweb.org/program/ind_papers/
امروز داشتم کنفرانس ACL رو چک میکردم که به صورت تصادفی دیدم که یک track به نام Industry Track هم داره که توش بیشتر از این که بخوان به مسائل آزمایشگاهی بپردازن، هدفشون بیشتر پرداختن به مسائل صنعتی و محصولی هست. چیزهایی از جنس چالشهای عملی مثل استقرار محصول، نسبت کارایی به هزینه، انواع انتخابهای طراحی و ارزیابی و مانیتورینگ محصول در دنیای واقعی هستش. مثلا این که شما چطوری latency محصولتون رو کاهش بدید، یا این که چطوری بتونید سیستمتون رو نگهداری کنید یا بهبودش بدید، چه شکلی از آدم به عنوان Human in the loop استفاده کنید، توسعه جدیدتون رو محصول رو سریعتر و کمهزینهتر انجام بدید و ...
لینک توضیحات برای ACL 2026:
https://2026.aclweb.org/calls/industry_track/
جدید هم نیست و پارسال هم داشتند و لیست پیپرهای پارسال ACL تو این ترک رو میشه اینجا دید:
https://2025.aclweb.org/program/ind_papers/
ACL 2026
Industry Track
ACL 2026 Industry Track.
کوشش بیهوده به از خفتگی؟
بس دراز است این، حدیث خواجه گو
تا چه شد احوال آن مرد نکو
خواجه اندر آتش و درد و حنین
صد پراکنده همیگفت این چنین
گه تناقض گاه ناز و گه نیاز
گاه سودای حقیقت گه مجاز
مرد غرقه گشته جانی میکند
دست را در هر گیاهی میزند
تا کدامش دست گیرد در خطر
دست و پایی میزند از بیم سر
دوست دارد یار این آشفتگی
کوشش بیهوده به از خفتگی
آنک او شاهست او بی کار نیست
ناله از وی طرفه کو بیمار نیست
بهر این فرمود رحمان ای پسر
کل یوم هو فی شان ای پسر
اندرین ره میتراش و میخراش
تا دم آخر دمی فارغ مباش
تا دم آخر دمی آخر بود
که عنایت با تو صاحب سِر بود
هر چه میکوشند اگر مرد و زنست
گوش و چشم شاه جان بر روزنست
مولوی
بس دراز است این، حدیث خواجه گو
تا چه شد احوال آن مرد نکو
خواجه اندر آتش و درد و حنین
صد پراکنده همیگفت این چنین
گه تناقض گاه ناز و گه نیاز
گاه سودای حقیقت گه مجاز
مرد غرقه گشته جانی میکند
دست را در هر گیاهی میزند
تا کدامش دست گیرد در خطر
دست و پایی میزند از بیم سر
دوست دارد یار این آشفتگی
کوشش بیهوده به از خفتگی
آنک او شاهست او بی کار نیست
ناله از وی طرفه کو بیمار نیست
بهر این فرمود رحمان ای پسر
کل یوم هو فی شان ای پسر
اندرین ره میتراش و میخراش
تا دم آخر دمی فارغ مباش
تا دم آخر دمی آخر بود
که عنایت با تو صاحب سِر بود
هر چه میکوشند اگر مرد و زنست
گوش و چشم شاه جان بر روزنست
مولوی
نوابغ در ایران دیوانه میشوند
داشتم تبهای خیلی قدیمیام رو نگاه میکردم و میبستمشون این تب رو دیدم. یادم نیست چطور سر چی بهش رسیده بودم ولی الان که دیدم یک حس عمیقی بهم دست داد. حرفهای جالبی ابراهیم فیاض زده بوده:
داشتم تبهای خیلی قدیمیام رو نگاه میکردم و میبستمشون این تب رو دیدم. یادم نیست چطور سر چی بهش رسیده بودم ولی الان که دیدم یک حس عمیقی بهم دست داد. حرفهای جالبی ابراهیم فیاض زده بوده:
اینها موارد انعطاف در دانشگاههای پیشرفته هستند. نابغه را نباید اذیت کرد. نوابغ در ایران دیوانه میشوند. من سالها در دوره راهنمایی، قبل و بعد از انقلاب شاهد این موضوع بودهام که نابغهها چون در کشور ما فهمیده نمیشوند، دیوانه میشوند. دانشگاههای ما نابغه کشند. من خبر موثق دارم که تمامی دانشجویان صنعتی شریف دچار مشکلات روحی و روانیاند. در دانشگاه تهران هم روانی هست ولی تعدادشان کمتر است. دلیلش هم این است که بچههای نابغه در دانشگاههای ما تکلیف خود را نمیدانند.
دانشگاههای مهم کشور پر از افرادی با مشکلات روانی است. یکی از دلایل این مشکلات این است که ریاست دانشگاههای فنی با مهندسان است و یک مهندس با نحوه ریاست دانشگاه آشنایی ندارد. یعنی یکی از مشکلاتی که ما در آموزش عالی داریم، این است که به جای اینکه مدیران دانشگاه تخصص مدیریت دانشگاهی داشته باشند، تخصصات فنی دارند.
چون دانشگاهها برای ارتقای رتبه خود، از نهاد آموزشی به یک نهاد پژوهشی تبدیل شدهاند. از طرفی پژوهش را تنها مقاله isi میدانند. یعنی دانشگاهها را از آموزش نیز ساقط کردهاند. در گذشته کلاس و آموزش تمام عشق اساتید بود؛ اما الان که بحث مقاله isi در میان است، دیگر آموزش به کار اساتید نمیآید. از طرفی isi را نیز وتویی کردند. یعنی پژوهش کانالیزه شده برای مقاله isi که آن هم وتویی است
Iran Student Correspondent Association
دانشگاههای ایران نابغه کشند/ تمام دانشجوهای شریف دچار مشکلات روحی و روانیاند
استاد دانشگاه تهران گفت: نوابغ در ایران دیوانه میشوند. من سالها در دوره راهنمایی، قبل و بعد از انقلاب شاهد این موضوع بودهام که نوابغ چون در کشور ما فهمیده نمیشوند، دیوانه میشوند. دانشگاههای ما نابغه کشند.
جمعبندی کارپثی از داستان LLMها در ۲۰۲۵
اینفلوئنسر محبوبم آقای آندرهآ کارپثی، در یک بلاگ کوتاهی برداشتهای خودش از LLMها در سال ۲۰۲۵ رو به اشتراک گذاشته. بخشهای مهمش اینها هستند:
1. Reinforcement Learning from Verifiable Rewards (RLVR)
2. Ghosts vs. Animals / Jagged Intelligence
3. Cursor / new layer of LLM apps
4. Claude Code / AI that lives on your computer
5. Vibe coding
6. Nano banana / LLM GUI
۱- کارپثی معتقده که RLVR یکی از مهمترین اتفاقات هوش مصنوعی در سال گذشته بوده و میشه گفتش که یک استیج جدید روی استیجهای قبلی که PT و SFT و RLHF بودند اضافه شده و اعتقاد داره که RLVR بوده که به خاطر خواصش باعث شده که مدلها به توانایی استدلال دست پیدا کنند.
۲- یک اعتقاداتی درباره ماهیت و ذات هوش و هوش مصنوعی داره که در این بخش دربارهاش صحبت کرده. میگه که فضای هوش چیزی گستردهتر از تصور اولیه ماست و سنجیدن هوش LLM با حیوانات کار ممکنی نیست. معتقده که LLM بیشتر شبیه به یک روحی هست که عصاره هوش انسانی درش بروز پیدا کرده و پشت فضای واقعی دنیا در حال تعامل هست (استعاره بسیار عمیق). از یک طرف دیگه هم میگه که هوش LLMها هنوز دندانهدار هست یعنی در یک دامینی خوبه ولی اندکی که از اون دامین خارج میشیم ابله هست و برای همین هنوز تا AGI فاصله داریم. در کنار اینها هم میگه که بنچمارکها چون همیشه قابل سنجش هستند (یعنی جواب درست/غلط دارند) پس همیشه در معرض این هستیم که با تولید داده و انجام RLVR روی بنچمارکها مدلهامون روی اونها پیروز کنیم در حالی که هنوز جنبه واقعی هوش نرسیده باشیم (این تکهاش کراس اوری هست با اون نگاهی که راجع به RLVR داشت، در واقع میگه که با این که RLVR به ما اجازه داد که هر چیز قابل سنجشی رو روش آموزش بدیم مدلهامون رو ولی نشون داد که یک چیزهایی فراتر از قلمرو راستیآزماییپذیری انگار وجود دارند) یک صحبت جالب دیگه هم داشت که میگفت هر شغلی که قابلیت راستیآزماییپذیری بیشتری داشته باشه سریعتر هم توسط هوش مصنوعی جایگزین میشه (مثل مهندسی نرم افزار مثلا).
۳- در مورد Cursor صحبتی که میکنه میگه که Cursor یک لایه جدید ابسترکشن از LLM appها رو معرفی کرد. شما میتونید به جای کرسر برید با GPT صحبت کنید و ازش کد بگیرید ولی کرسر روی اون نیازمندی خاص شما اومده یک جور context engineering انجام داده و تعامل شما با llm رو جوری مهندسی کرده که کار شما رو راحت کرده. بر همین اساس احتمالا در آینده شاهد اپهای مختلف تری روی همین ابسترکشن شبیه cursor منتها برای دامینها و نیازمندیهای دیگه خواهیم بود. مثلا فرض کنید cursor برای آموزش یا رواندرمانی چه شکلی میتونن باشند.
۴- یک صحبتی هم راجع به Cursor Code کرده که به نظرش از این حیث که روی کامپیوتر شما اجرا میشه و قابلیت Agency داره جالبه. به نظرش شبیه یک روحی هست که در محیط کامپیوتر شما زندگی میکنه.
۵- راجع به vibe coding حرف میزنه و میگه که خودش ازش خیلی استفاده کرده. خودش مثلا Rust بلد نبوده ولی با vibe coding تونسته توکنایزرهای بر پایه rust بزنه و کلا معتقده که وایب کدینگ مفهوم برنامهنویسی و شرح وظایف رو تغییر میده.
۵- و در نهایت هم Nano Banana. حضرت کارپثی میگه که این که ما چطور و از طریق چه رابطی با انسان رابطه برقرار کنیم یک مساله مهمیه. همین الان بخش مهمی از تعاملات llm با انسان از طریق markdown صورت میگیره و اگر markdownای وجود نداشت تجربه کار با llmها سخت میشد. بر همین جنبه معتقده که ارائه تصویر (مثل ارائه اسلاید، نمودار، اینفوگرافی) به انسان بسیار موثرتر هست تا ارائه متن خالی و برای همین نانوبنانا رو یک جهش بزرگ در عرصه رابطه کاربری بین انسان و هوش مصنوعی میدونه.
در نهایت همین TLDR از صحبتهاش:
لینک:
https://karpathy.bearblog.dev/year-in-review-2025/
پینوشت: از این که پستهای کانال رو به اشتراک میگذارید از شما ممنونیم.
اینفلوئنسر محبوبم آقای آندرهآ کارپثی، در یک بلاگ کوتاهی برداشتهای خودش از LLMها در سال ۲۰۲۵ رو به اشتراک گذاشته. بخشهای مهمش اینها هستند:
1. Reinforcement Learning from Verifiable Rewards (RLVR)
2. Ghosts vs. Animals / Jagged Intelligence
3. Cursor / new layer of LLM apps
4. Claude Code / AI that lives on your computer
5. Vibe coding
6. Nano banana / LLM GUI
۱- کارپثی معتقده که RLVR یکی از مهمترین اتفاقات هوش مصنوعی در سال گذشته بوده و میشه گفتش که یک استیج جدید روی استیجهای قبلی که PT و SFT و RLHF بودند اضافه شده و اعتقاد داره که RLVR بوده که به خاطر خواصش باعث شده که مدلها به توانایی استدلال دست پیدا کنند.
۲- یک اعتقاداتی درباره ماهیت و ذات هوش و هوش مصنوعی داره که در این بخش دربارهاش صحبت کرده. میگه که فضای هوش چیزی گستردهتر از تصور اولیه ماست و سنجیدن هوش LLM با حیوانات کار ممکنی نیست. معتقده که LLM بیشتر شبیه به یک روحی هست که عصاره هوش انسانی درش بروز پیدا کرده و پشت فضای واقعی دنیا در حال تعامل هست (استعاره بسیار عمیق). از یک طرف دیگه هم میگه که هوش LLMها هنوز دندانهدار هست یعنی در یک دامینی خوبه ولی اندکی که از اون دامین خارج میشیم ابله هست و برای همین هنوز تا AGI فاصله داریم. در کنار اینها هم میگه که بنچمارکها چون همیشه قابل سنجش هستند (یعنی جواب درست/غلط دارند) پس همیشه در معرض این هستیم که با تولید داده و انجام RLVR روی بنچمارکها مدلهامون روی اونها پیروز کنیم در حالی که هنوز جنبه واقعی هوش نرسیده باشیم (این تکهاش کراس اوری هست با اون نگاهی که راجع به RLVR داشت، در واقع میگه که با این که RLVR به ما اجازه داد که هر چیز قابل سنجشی رو روش آموزش بدیم مدلهامون رو ولی نشون داد که یک چیزهایی فراتر از قلمرو راستیآزماییپذیری انگار وجود دارند) یک صحبت جالب دیگه هم داشت که میگفت هر شغلی که قابلیت راستیآزماییپذیری بیشتری داشته باشه سریعتر هم توسط هوش مصنوعی جایگزین میشه (مثل مهندسی نرم افزار مثلا).
۳- در مورد Cursor صحبتی که میکنه میگه که Cursor یک لایه جدید ابسترکشن از LLM appها رو معرفی کرد. شما میتونید به جای کرسر برید با GPT صحبت کنید و ازش کد بگیرید ولی کرسر روی اون نیازمندی خاص شما اومده یک جور context engineering انجام داده و تعامل شما با llm رو جوری مهندسی کرده که کار شما رو راحت کرده. بر همین اساس احتمالا در آینده شاهد اپهای مختلف تری روی همین ابسترکشن شبیه cursor منتها برای دامینها و نیازمندیهای دیگه خواهیم بود. مثلا فرض کنید cursor برای آموزش یا رواندرمانی چه شکلی میتونن باشند.
۴- یک صحبتی هم راجع به Cursor Code کرده که به نظرش از این حیث که روی کامپیوتر شما اجرا میشه و قابلیت Agency داره جالبه. به نظرش شبیه یک روحی هست که در محیط کامپیوتر شما زندگی میکنه.
۵- راجع به vibe coding حرف میزنه و میگه که خودش ازش خیلی استفاده کرده. خودش مثلا Rust بلد نبوده ولی با vibe coding تونسته توکنایزرهای بر پایه rust بزنه و کلا معتقده که وایب کدینگ مفهوم برنامهنویسی و شرح وظایف رو تغییر میده.
۵- و در نهایت هم Nano Banana. حضرت کارپثی میگه که این که ما چطور و از طریق چه رابطی با انسان رابطه برقرار کنیم یک مساله مهمیه. همین الان بخش مهمی از تعاملات llm با انسان از طریق markdown صورت میگیره و اگر markdownای وجود نداشت تجربه کار با llmها سخت میشد. بر همین جنبه معتقده که ارائه تصویر (مثل ارائه اسلاید، نمودار، اینفوگرافی) به انسان بسیار موثرتر هست تا ارائه متن خالی و برای همین نانوبنانا رو یک جهش بزرگ در عرصه رابطه کاربری بین انسان و هوش مصنوعی میدونه.
در نهایت همین TLDR از صحبتهاش:
TLDR. 2025 was an exciting and mildly surprising year of LLMs. LLMs are emerging as a new kind of intelligence, simultaneously a lot smarter than I expected and a lot dumber than I expected. In any case they are extremely useful and I don't think the industry has realized anywhere near 10% of their potential even at present capability. Meanwhile, there are so many ideas to try and conceptually the field feels wide open. And as I mentioned on my Dwarkesh pod earlier this year, I simultaneously (and on the surface paradoxically) believe that we will both see rapid and continued progress and that yet there is a lot of work to be done. Strap in.
لینک:
https://karpathy.bearblog.dev/year-in-review-2025/
پینوشت: از این که پستهای کانال رو به اشتراک میگذارید از شما ممنونیم.
karpathy
2025 LLM Year in Review
2025 Year in Review of LLM paradigm changes
هوش مصنوعی، با این که خیلی جذاب و داغ بوده در سالهای اخیر ولی از جهاتی به عنوان یک فیلد ریسرچی به نظر در حال fail کردنه. تعداد مقالات ارسالی به کنفرانسها و ژورنالها بسیار بسیار زیاد شده. بعد به این تعداد مقاله ارسالشده داور وجود نداره. بعد مثلا بعضی کنفرانسها مثل ACL برای جبران این وضع قاعده وضع میکنند که هر کسی که پیپر مینویسه ارسال میکنه باید حتما به عنوان reviewer هم ثبت نام کنه و بقیه کارها رو داوری کنه وگرنه از فرستادن پیپر تو دورههای بعدی محروم میشه. بعد به همین خاطر داوری اجباری، یک تعداد داوری بیکیفیت به وجود میان. تازه همه اینها به کنار، نرخ اکسپتی پیپرها در کنفرانسهای تاپ حدود ۲۵-۳۰ درصده. یعنی یک درصد زیادی پیپر هستند که اینا از کنفرانسهای قبلی آماده هستند و تو هر کنفرانس بعدی سابمیت میشن. در چنین حالتی افراد آکادمیک جهت رقابت با همدیگه مجبورند عوض کار کردن روی یک تعداد کم پیپر روی تعداد زیادی پیپر کار کنند تا شانس پذیرششون بیشتر بشه و همین انباشت رو بیشتر و بیشتر میکنه. در بلندمدت نهایتا تعداد زیادی پیپر روی هم انباشت میشن و دیگه رسما فیلد رو باید در حالت بنبست تعطیل کرد. خیر داغشدن این فیلد به ما نرسید که بدتر نقرهداغمون کرد.
ارزش روی خروجی سریع است؟
چند وقتی هست که تیملیدرم عوض شده و توفیق شمشیرزدن در رکاب آقای پویا پاینده رو داریم. بعد از گذشت چند وقت یک سری رفتارهای پاینده برام معنادار شدند و دیگه نه به عنوان یک رخداد یهویی که به عنوان یک ویژگی شخصیتی ازش میشناسم. روال کلی شخصیتش این شکلیه که وقتی میخوام یک تسکی رو شروع کنم با من اول خیلی جدی بحث میکنه چرا میخوای اصلا این تسک رو بزنی؟ در حالی که به نظرم خیلی همه چیز بدیهی است ولی باز سوال پیچم میکنه و نهایتا بعد از کلی صحبت ازم میخوام یک داک برای مساله و راه حل بنویسم. بعد هم که "کد" رو میزنم و کار میکنه و مرج رکش رو میفرستم، کوهی از کامنتها بر سر مرج رکم میریزه. جمله پرتکرارش هم این شکلیه که این دیزاین، به نظر دیزاین خوبی نیست برو بهترش کن.
حالا مرتبط با همین این مساله امروز در راه بازگشت به خانه این بلاگ رو دیدم. حرف کلیش اینه که طراحی یک چیز جدای از ابزار (که کد باشه) هست و ما خیلی وقتا اصل ماجرا رو گم کردیم و درگیر کد شدیم. و بحثی هم که مطرح میکنه اینه که با ورود AI و ایجاد قابلیت به خروجی رسیدن سریع، نقشهایی که از مهندسین انتظار میره انگار دارند به صورت مخربی تغییر میکنند. میگه حالا که Cursor داریم، این آفت رو در کنارش داریم که بدون طراحی اولیه سراغ پیادهسازی سریع هل داده بشیم و از قبلش آسیب ببینیم. آسیبی که میتونه شامل از دست دادن تفکر مفهومی و عدم جستجوی راهحلهای مختلف بین اعضای تیم باشه و همین باعث میشه که محصولات کمتر منحصر به فرد باشند.
مطلب پررنگی دیگهای هم که در بلاگ بود این بود که طراحی دو بخشه. بخش اول طراحی مساله است. و بخش دوم هم طراحی مفهوم راه حل و اجرای اونه. در بخش طراحی مساله باید مشخص بشه اصلا دنبال چه هستیم و ذینفع کیه و چی میخواد. خیلی وقتا تیمها در مسیر یک پروژهای شکست میخورند، شاید به نظر برسه روی راه حل دارند دعوا میکنند ولی ۹۰٪ اوقات ماجرا اینه که چون روی مساله هم صفحه نیستند راه حلهای مختلفی به ذهنشون میرسه. حالا از وقتی که.Cursor اومده این شکلی شده که یک فیچری به ذهنمون میرسه و چون هزینه زمانی رسیدن بهش خیلی کمه همینجوری میریم یهو سریع به خروجی میرسیم و اتفاقا درگیری سر راه حل رو هم نداریم چون در لحظه بهش رسیدیم، فارغ از این که قبلش اصلا روی خود مساله و راه حلش فکر کرده باشیم. خیلیها میگن مهندسی نرم افزار اتومات میشه توسط هوش مصنوعی به زودی، بله، شما شاید بتونی ابزار و کدزدن رو با AI جایگزین کنید ولی هنوز اون نقش طراحی مهندسی نرم افزار، مثل این گیرهایی که پاینده میده، قابل جایگزینی کامل نیست. ممکنه حتی مثلا در لایه معماری نرم افزار و اینها اتومات بشه یک روزی ولی باز یک لایه ابسترکشنی بالاتر از اون شکل میگیره که در اون لایه باز دعوای دیزاین وجود خواهد داشت. آدمایی که از قضیه دور باشن یک چیزی از کد زدن تو ذهنشون هست در حالی که در واقعیت قضیه متفاوتتره.
لینک بلاگ:
https://linear.app/now/design-is-more-than-code
چند وقتی هست که تیملیدرم عوض شده و توفیق شمشیرزدن در رکاب آقای پویا پاینده رو داریم. بعد از گذشت چند وقت یک سری رفتارهای پاینده برام معنادار شدند و دیگه نه به عنوان یک رخداد یهویی که به عنوان یک ویژگی شخصیتی ازش میشناسم. روال کلی شخصیتش این شکلیه که وقتی میخوام یک تسکی رو شروع کنم با من اول خیلی جدی بحث میکنه چرا میخوای اصلا این تسک رو بزنی؟ در حالی که به نظرم خیلی همه چیز بدیهی است ولی باز سوال پیچم میکنه و نهایتا بعد از کلی صحبت ازم میخوام یک داک برای مساله و راه حل بنویسم. بعد هم که "کد" رو میزنم و کار میکنه و مرج رکش رو میفرستم، کوهی از کامنتها بر سر مرج رکم میریزه. جمله پرتکرارش هم این شکلیه که این دیزاین، به نظر دیزاین خوبی نیست برو بهترش کن.
حالا مرتبط با همین این مساله امروز در راه بازگشت به خانه این بلاگ رو دیدم. حرف کلیش اینه که طراحی یک چیز جدای از ابزار (که کد باشه) هست و ما خیلی وقتا اصل ماجرا رو گم کردیم و درگیر کد شدیم. و بحثی هم که مطرح میکنه اینه که با ورود AI و ایجاد قابلیت به خروجی رسیدن سریع، نقشهایی که از مهندسین انتظار میره انگار دارند به صورت مخربی تغییر میکنند. میگه حالا که Cursor داریم، این آفت رو در کنارش داریم که بدون طراحی اولیه سراغ پیادهسازی سریع هل داده بشیم و از قبلش آسیب ببینیم. آسیبی که میتونه شامل از دست دادن تفکر مفهومی و عدم جستجوی راهحلهای مختلف بین اعضای تیم باشه و همین باعث میشه که محصولات کمتر منحصر به فرد باشند.
مطلب پررنگی دیگهای هم که در بلاگ بود این بود که طراحی دو بخشه. بخش اول طراحی مساله است. و بخش دوم هم طراحی مفهوم راه حل و اجرای اونه. در بخش طراحی مساله باید مشخص بشه اصلا دنبال چه هستیم و ذینفع کیه و چی میخواد. خیلی وقتا تیمها در مسیر یک پروژهای شکست میخورند، شاید به نظر برسه روی راه حل دارند دعوا میکنند ولی ۹۰٪ اوقات ماجرا اینه که چون روی مساله هم صفحه نیستند راه حلهای مختلفی به ذهنشون میرسه. حالا از وقتی که.Cursor اومده این شکلی شده که یک فیچری به ذهنمون میرسه و چون هزینه زمانی رسیدن بهش خیلی کمه همینجوری میریم یهو سریع به خروجی میرسیم و اتفاقا درگیری سر راه حل رو هم نداریم چون در لحظه بهش رسیدیم، فارغ از این که قبلش اصلا روی خود مساله و راه حلش فکر کرده باشیم. خیلیها میگن مهندسی نرم افزار اتومات میشه توسط هوش مصنوعی به زودی، بله، شما شاید بتونی ابزار و کدزدن رو با AI جایگزین کنید ولی هنوز اون نقش طراحی مهندسی نرم افزار، مثل این گیرهایی که پاینده میده، قابل جایگزینی کامل نیست. ممکنه حتی مثلا در لایه معماری نرم افزار و اینها اتومات بشه یک روزی ولی باز یک لایه ابسترکشنی بالاتر از اون شکل میگیره که در اون لایه باز دعوای دیزاین وجود خواهد داشت. آدمایی که از قضیه دور باشن یک چیزی از کد زدن تو ذهنشون هست در حالی که در واقعیت قضیه متفاوتتره.
لینک بلاگ:
https://linear.app/now/design-is-more-than-code
linear.app
Design is more than code - Linear
تراستی حیا کن
این طور که به نظر میاد مبلغی، بیشتر از حداقل ۶ میلیارد دلار، از فروش نفت که باید توسط تراستیها به کشور باز میگشته و از اون ور صرف واردات نهادههای دامی میشده، هنوز به کشور برنگشته و این بلبشوی فعلی در بازار مواد خوراکی و بعدش هم دلار رو سبب شده.
پینوشت: تراستی یعنی چی؟ با توجه به این که ایران تحریم هست، مبادلات و انتقالهای مالی نمیتونه با دنیا انجام بده. به فرض مثال اگر به پالایشگاهی در چین نفت فروخته میشه، اون پالایشگاه قاعدتاً نمیتونه مستقیما دلار به حساب بانک مرکزی ایران بریزه. در این جا یک سری شرکت صوری (که اغلب در امارات قرار دارند) هستند که کار اونها انجام دادند کارهای صرافیطور برای صادرات و واردات ایران هست. به این شکل که مثلا از یک ور پول صادرات نفت ایران رو دریافت میکنند و از اونور هم پول واردات نهادههای دامی رو میپردازند. حالا قضیه اینه که فروش نفت ایران بعد از اسنپ بک هم همچنان وجود داره اما این دوستان تراستی پولها رو بر نمیگردونن.
حالا این که این دوستان شریف و خدوم و زحمتکش، چرا پول رو بر نمیگردونن، نیتشون چیه و از سهو میکنند یا از قصد، چیزی هست که احتمالا در قسمتهای بعدی این سریال متوجه میشیم.
لینکهای مرتبط:
https://www.ilna.ir/fa/tiny/news-1732213
https://www.ilna.ir/fa/tiny/news-1733417
این طور که به نظر میاد مبلغی، بیشتر از حداقل ۶ میلیارد دلار، از فروش نفت که باید توسط تراستیها به کشور باز میگشته و از اون ور صرف واردات نهادههای دامی میشده، هنوز به کشور برنگشته و این بلبشوی فعلی در بازار مواد خوراکی و بعدش هم دلار رو سبب شده.
پینوشت: تراستی یعنی چی؟ با توجه به این که ایران تحریم هست، مبادلات و انتقالهای مالی نمیتونه با دنیا انجام بده. به فرض مثال اگر به پالایشگاهی در چین نفت فروخته میشه، اون پالایشگاه قاعدتاً نمیتونه مستقیما دلار به حساب بانک مرکزی ایران بریزه. در این جا یک سری شرکت صوری (که اغلب در امارات قرار دارند) هستند که کار اونها انجام دادند کارهای صرافیطور برای صادرات و واردات ایران هست. به این شکل که مثلا از یک ور پول صادرات نفت ایران رو دریافت میکنند و از اونور هم پول واردات نهادههای دامی رو میپردازند. حالا قضیه اینه که فروش نفت ایران بعد از اسنپ بک هم همچنان وجود داره اما این دوستان تراستی پولها رو بر نمیگردونن.
حالا این که این دوستان شریف و خدوم و زحمتکش، چرا پول رو بر نمیگردونن، نیتشون چیه و از سهو میکنند یا از قصد، چیزی هست که احتمالا در قسمتهای بعدی این سریال متوجه میشیم.
لینکهای مرتبط:
https://www.ilna.ir/fa/tiny/news-1732213
https://www.ilna.ir/fa/tiny/news-1733417
خبرگزاری ایلنا
«ب.ز» و «ح.آ» نفت فروختند و پولش را پس نمیدهند/ پایان مهلت دو ماهه «زنجانی» برای تسویه بدهی۲ میلیارد دلاری
عضو کمیسیون اقتصادی مجلس گفت: شنیدهایم که فردی با نام «ح. آ» در چند ماه گذشته نفت کشور را فروخته اما ارز آن را به کشور تحویل نداده و در حال حاضر هم در امارات سکونت دارد. همچنین فردی دیگر که نفت فروخته اما پول آن را تحویل نداده «ب. ز» است که نمیدانیم بر…
زاهد بودم ترانهگویم کردی
سرفتنهٔ بزم و بادهخویم کردی
سجادهنشین باوقاری بودم
بازیچهٔ کودکان کویم کردی
مولوی
سرفتنهٔ بزم و بادهخویم کردی
سجادهنشین باوقاری بودم
بازیچهٔ کودکان کویم کردی
مولوی
Out of Distribution
Photo
نسبتا پیشدستانه؟
این توییت از یکی از نمایندگان کمیسیون امنیت ملی امروز در توییتر زیاد دست به دست میشد. دو نکته رو میشه راجع بهش بحث کرد. اولا که حمله پیشدستانه وقتی معنا داره که شما بتونی در سایه غافلگیری به طرف مقابل یک ضربه تاکتیکی وارد کنی طوری که طرف نتونه خودش رو جمع کنه. مثلا زدن سایتها یا تجهیزات نظامی یا حذف فرماندهان سطح بالا از مصادق حمله پیشدستانه میتونن باشند (کاری که اسراییل سری پیش با ایران کرد). اما ایران با توجه به دقت موشکهایی که داره نمیتونه ضربه تاکتیکی بزنه و اصلا بخواد بزنه هم با توجه به اشراف اطلاعاتی اسراییل-آمریکا نمیتونه عنصر غافلگیری رو ایجاد کنه. در این صورت پس ضربه پیشدستانه آیا منطق دیگهای میتونه داشته باشه؟ بله. در شرایطی که شما مطمئن باشی طرف مقابل به صورت حتمی ظرف چند وقت آینده به شما حمله میکنه و شما مورد غافگیری واقع میشی حمله پیشدستانه این کارکرد رو داره که حداقل ابتکار زمان شروع جنگ رو از طرف مقابل میگیری و اجازه نمیدی شوک و غافلگیری زمانبندیشده بهت تحمیل بشه.
از طرف دیگر اما بحثی که در سوشال مدیا و مخصوصا کاربران ارزشی شکل گرفته بود این بود که به این نماینده مجلس گیر داده بودند چرا اسرار رو فاش میکنی. اما برعکس به نظر میرسه این حرکت عمدی و برنامهریزی شده از سطح بالاتری باشه و به نظر حتی کلماتی که در پیام هست رو خود این بابا انتخاب نکرده. مخصوصا وقتی مورد قبل رو در نظر میگیریم که ایران توان ضربهزدن تاکتیکی رو در حمله پیشدستانه نداره، در این صورت پس اصلا گفتن علنی این که من میخوام پیشدستانه حمله کنم اصلا چه معنی داره؟ اینجا محتملترین توضیح اینه که خود گفتن، بخشی از بازی محاسباتی است نه افشای یک عملیات مشخص.
دو سناریو قابل حدسه. اول این علنی گفتن میتونه خودش بخشی از زمان خریدن باشه. شما وقتی طرف مقابل (که خواهان حمله هست) رو تهدید به حمله پیشدستانه میکنی، طرف مقابل رو در محاسباتش به یک سمت هل میدی. طرف مقابل ممکنه مقداری احتیاط درش به وجود بیاد که مبادا در لحظهای که آماده نیست ضربه بخوره، پس مدتی صبر میکنه تا مطمئن بشه از جایی که نباید ضربه نمیخوره و یا این که سریعتر نقشهاش رو اجرا میکنه در حالی که ممکنه آمادگی صددرصدی بابتش نداشته باشه. یک سناریو دیگه هم ممکنه این وسط باشه و اون اینه که اسراییل قصد داره یک عملیات محدود (مثلا علیه سایت نطنز/اصفهان یا سایتهای تولید موشک یا زدن چند مقام نظامی-سیاسی) هست و بعدش اعلام پایان حمله کنه که بعدش بتونه کنترل تشدید رو حفظ کنه و ایران هم پاسخ سنگینی نده (نظیر همه سناریوهایی که از ترور سلیمانی تا ترورهای آخر سوریه رخ داد). در چنین حالتی معنی "نسبتا پیشدستانه" میتونه این باشه که در شرایطی که ایران حس کنه که موعد حمله اسراییل نزدیکه زودتر دست به حمله بزنه (فراموش نکنیم که ایران در جنگ سری قبل هم طبق قرائن شب واقعه میدونست که حمله قراره رخ بده ولی تصوری از شدت اون نداشت).
در کل ولی با اوضاع خیط و اسفبار اقتصادی-سیاسی داخلی و خارجی، احتمال وقوع این امر به صفر میل میکنه. الله اعلم.
این توییت از یکی از نمایندگان کمیسیون امنیت ملی امروز در توییتر زیاد دست به دست میشد. دو نکته رو میشه راجع بهش بحث کرد. اولا که حمله پیشدستانه وقتی معنا داره که شما بتونی در سایه غافلگیری به طرف مقابل یک ضربه تاکتیکی وارد کنی طوری که طرف نتونه خودش رو جمع کنه. مثلا زدن سایتها یا تجهیزات نظامی یا حذف فرماندهان سطح بالا از مصادق حمله پیشدستانه میتونن باشند (کاری که اسراییل سری پیش با ایران کرد). اما ایران با توجه به دقت موشکهایی که داره نمیتونه ضربه تاکتیکی بزنه و اصلا بخواد بزنه هم با توجه به اشراف اطلاعاتی اسراییل-آمریکا نمیتونه عنصر غافلگیری رو ایجاد کنه. در این صورت پس ضربه پیشدستانه آیا منطق دیگهای میتونه داشته باشه؟ بله. در شرایطی که شما مطمئن باشی طرف مقابل به صورت حتمی ظرف چند وقت آینده به شما حمله میکنه و شما مورد غافگیری واقع میشی حمله پیشدستانه این کارکرد رو داره که حداقل ابتکار زمان شروع جنگ رو از طرف مقابل میگیری و اجازه نمیدی شوک و غافلگیری زمانبندیشده بهت تحمیل بشه.
از طرف دیگر اما بحثی که در سوشال مدیا و مخصوصا کاربران ارزشی شکل گرفته بود این بود که به این نماینده مجلس گیر داده بودند چرا اسرار رو فاش میکنی. اما برعکس به نظر میرسه این حرکت عمدی و برنامهریزی شده از سطح بالاتری باشه و به نظر حتی کلماتی که در پیام هست رو خود این بابا انتخاب نکرده. مخصوصا وقتی مورد قبل رو در نظر میگیریم که ایران توان ضربهزدن تاکتیکی رو در حمله پیشدستانه نداره، در این صورت پس اصلا گفتن علنی این که من میخوام پیشدستانه حمله کنم اصلا چه معنی داره؟ اینجا محتملترین توضیح اینه که خود گفتن، بخشی از بازی محاسباتی است نه افشای یک عملیات مشخص.
دو سناریو قابل حدسه. اول این علنی گفتن میتونه خودش بخشی از زمان خریدن باشه. شما وقتی طرف مقابل (که خواهان حمله هست) رو تهدید به حمله پیشدستانه میکنی، طرف مقابل رو در محاسباتش به یک سمت هل میدی. طرف مقابل ممکنه مقداری احتیاط درش به وجود بیاد که مبادا در لحظهای که آماده نیست ضربه بخوره، پس مدتی صبر میکنه تا مطمئن بشه از جایی که نباید ضربه نمیخوره و یا این که سریعتر نقشهاش رو اجرا میکنه در حالی که ممکنه آمادگی صددرصدی بابتش نداشته باشه. یک سناریو دیگه هم ممکنه این وسط باشه و اون اینه که اسراییل قصد داره یک عملیات محدود (مثلا علیه سایت نطنز/اصفهان یا سایتهای تولید موشک یا زدن چند مقام نظامی-سیاسی) هست و بعدش اعلام پایان حمله کنه که بعدش بتونه کنترل تشدید رو حفظ کنه و ایران هم پاسخ سنگینی نده (نظیر همه سناریوهایی که از ترور سلیمانی تا ترورهای آخر سوریه رخ داد). در چنین حالتی معنی "نسبتا پیشدستانه" میتونه این باشه که در شرایطی که ایران حس کنه که موعد حمله اسراییل نزدیکه زودتر دست به حمله بزنه (فراموش نکنیم که ایران در جنگ سری قبل هم طبق قرائن شب واقعه میدونست که حمله قراره رخ بده ولی تصوری از شدت اون نداشت).
در کل ولی با اوضاع خیط و اسفبار اقتصادی-سیاسی داخلی و خارجی، احتمال وقوع این امر به صفر میل میکنه. الله اعلم.
زمانی که من جوانی ۲۲-۲۳ ساله بودم، یادمه این اساتید قدیمی دانشگاه همیشه گلایه میکردند چرا هوش مصنوعی همش شده دیپ لرنینگ و دیگه به مدلهای آماری یا اصلا قبلتر، مدلهای سیمبلیک توجهی نمیشه. امروز حالا وقتی داشتم ردیت رو بالا پایین میکردم و گزارشهای تحت عنوان Folan of LLMs in 2025 ملت رو میدیدم این حس بهم دست داد که دیگه کلا هوش از دیپ لرنینگ هم محدودتر شده و تقریبا شده LLMها. باری به هر جهت این دو تا بلاگی که ریویوی بر اتفاقات افتاده در حوزه LLMها افتاده بودند رو مفید یافتم.چیزی که بین هر دو مشترک و قابل حدس بود، اشاره به RLVR و Tool Call و رشد محصولاتی نظیر Claude Code و Cursor بود. در کنار اینها، هر دو هم به این مطلب اشاره داشتند که نقش چینیها در سال گذشته در قلمرو AI به طور قابل مشهودی پررنگ شده.
نکات جالبی که از بلاگ راشکا دیدم یکی این بود که اعتقاد داشت ما وارد پدیدهای به نام Benchmaxxing شدیم. یعنی توسعهدهندههای مدلها به طرز وسواسی دارن سعی میکنن خودشون رو صرفا روی بنچمارکها بهتر نشون بدن، در حالی که وقتی که خارج از بنچمارکها سنجیده میشن، به طرز واضحی تفاوت دارند. در واقع امسال بود که معنی contamination رو به خوبی درک کردیم یعنی چی. یک نکته دیگه هم راجع به Burnout شدن راجع به LLMها نوشته بود که به نظرم جالب بود. میگه که کار مهندسین نرم افزار الان بیشتر از این که کدزدن باشه، تبدیل به ریویوکردن کدهای llm generated شده. و همونطور که کدریویوکردن کار حوصلهسربرتریه تا کد زدن، این خطر وجود داره که افراد با حضور llm در حوزه کاریشون دچار burnout و افسردگی کاری بشن. یک مقدار هم راجع به ارزش private data نوشته بود و اعتقاد داشت که با رشد llmها به زودی ارزش private data بیشتر و بیشتر میشه. شرکتها با فهمیدن خطر llmها از دادن دادههای خصوصیشون امتناع میکنن و از اون طرف هم داشتن یک llm با اطلاعات عمومی ارزونتر میشه و دیگه رقابت بر سر دادههای خصوصی میمونه.
تیکه اخر بلاگش هم راجع به کارهایی که در پارسال کرده بوده صحبت کرده. خیلی جالبه که خودش رو از کارمندی تمام وقت آزاد کرده تا بتونه به کارهای دیگه نظیر تولید محتوا و کتاب نوشتن بپردازه. و اصلا شخصا نوشته که برای تامین هزینههای مالیم (مثل هزینههای روزمره زندگی یا هزینههای کلاد) بیشتر دست به قراردادهای مشاورهای زده. خودش میگه پیشنهادهای کار تمام وقت بسیاری داره اما از اون جایی که براش مهمه که مستقل بمونه ترجیح میده کارمند تمام وقت نشه. (این آقا سباستین نویسنده کتاب Build A Large Language Model (From Scratch) هست که کتاب معروفیه).
لینک بلاگ آقای Sebastian Raschka
https://magazine.sebastianraschka.com/p/state-of-llms-2025
نکات جالبی که از بلاگ راشکا دیدم یکی این بود که اعتقاد داشت ما وارد پدیدهای به نام Benchmaxxing شدیم. یعنی توسعهدهندههای مدلها به طرز وسواسی دارن سعی میکنن خودشون رو صرفا روی بنچمارکها بهتر نشون بدن، در حالی که وقتی که خارج از بنچمارکها سنجیده میشن، به طرز واضحی تفاوت دارند. در واقع امسال بود که معنی contamination رو به خوبی درک کردیم یعنی چی. یک نکته دیگه هم راجع به Burnout شدن راجع به LLMها نوشته بود که به نظرم جالب بود. میگه که کار مهندسین نرم افزار الان بیشتر از این که کدزدن باشه، تبدیل به ریویوکردن کدهای llm generated شده. و همونطور که کدریویوکردن کار حوصلهسربرتریه تا کد زدن، این خطر وجود داره که افراد با حضور llm در حوزه کاریشون دچار burnout و افسردگی کاری بشن. یک مقدار هم راجع به ارزش private data نوشته بود و اعتقاد داشت که با رشد llmها به زودی ارزش private data بیشتر و بیشتر میشه. شرکتها با فهمیدن خطر llmها از دادن دادههای خصوصیشون امتناع میکنن و از اون طرف هم داشتن یک llm با اطلاعات عمومی ارزونتر میشه و دیگه رقابت بر سر دادههای خصوصی میمونه.
تیکه اخر بلاگش هم راجع به کارهایی که در پارسال کرده بوده صحبت کرده. خیلی جالبه که خودش رو از کارمندی تمام وقت آزاد کرده تا بتونه به کارهای دیگه نظیر تولید محتوا و کتاب نوشتن بپردازه. و اصلا شخصا نوشته که برای تامین هزینههای مالیم (مثل هزینههای روزمره زندگی یا هزینههای کلاد) بیشتر دست به قراردادهای مشاورهای زده. خودش میگه پیشنهادهای کار تمام وقت بسیاری داره اما از اون جایی که براش مهمه که مستقل بمونه ترجیح میده کارمند تمام وقت نشه. (این آقا سباستین نویسنده کتاب Build A Large Language Model (From Scratch) هست که کتاب معروفیه).
لینک بلاگ آقای Sebastian Raschka
https://magazine.sebastianraschka.com/p/state-of-llms-2025
Sebastian Raschka, PhD
The State Of LLMs 2025: Progress, Problems, and Predictions
A 2025 review of large language models, from DeepSeek R1 and RLVR to inference-time scaling, benchmarks, architectures, and predictions for 2026.
بلاگ دوم اما از آقای Simon Willson هست که گسترده تر نوشته و چون آندرهآآقا جان کارپثی ریتوییتش کرده بود خوندمش. این هم تقریبا ۷۰ درصد مطالبش شبیه به بلاگ Raschka بود: RLVR و Tool Call و رشد چینیها و از این قبیل چیزها. با این وجود اما سه مطلب درش بود که نتونستم بازنشرشون نکنم:
۱- میگه که در سالی که گذشت این YOLO کردن ایجنتها (یعنی این که بهشون این دسترسی رو بدی که برای هر کاری کردن نیازی به گرفتن اجازه ازت نباشه)، رایج شد. و پدیدهای که داره رخ میده اینه که مردم دارن به این دسترسی دادن به ایجنتها عادت میکنند و یک روزی گند این درمیاد. یک مفهوم جامعهشناختی مرتبط با این هم هست به نام Normalization of Deviance که این جوریه:
where repeated exposure to risky behaviour without negative consequences leads people and organizations to accept that risky behaviour as normal
۲- این برادر سیمون پارسال یک بنچمارک فان برای خودش تعریف کرده: مدل بتونه با خروجی متنی، یک فایل SVG از پلیکان دوچرخهسوار بسازه. این کار خیلی سخته چون که هم دوچرخه از نظر هندسی سخته و هم پلیکان بد شکل و چغره و از اون طرف هم قطعا داده آموزشی از پلیکان در حال دوچرخهسواری اون هم با SVG وجود نداره. حالا نکتهای که هست دیده که این بنچمارک مسخرهای که تعریف کرده با عملکرد مدلها در تسکهای دیگه کوریلیشن داره و هر چه یک مدلی بهتر باشه بهتر میتونه این تصویر رو تولید کنه. از اونور هم بنچمارکش تبدیل به میم شده و حتی شرکتهایی مثل گوگل و انتروپیک گاها عملکرد مدلهاشون رو روی این بنچمارک پلیکان دوچرخهسوار نمایش دادند.
۳- یک حدسی زده که MCP امسال با این که درخشید اما آخرین سالی هم بوده که درخشیده. چون که ایجنتهایی که قادرند از ابزارهایی مثل bash به خوبی استفاده کنند دیگه نیازی به MCP شاید نداشته باشند.
۴- این نکتهاش رو خیلی خوشم اومد: میگه که prompt injection و jailbreaking بسیار در سال گذشته خطرناک شدند و مردم به خوبی جدی نمیگیرند ابعاد مختلف این خطر رو. چون که در عین این که فکر میکنند معنی jailbreaking رو میدونند با ابعاد و زوایای پنهان این پدیده آشکار نیستند. خودش کاری که کرده اومده یک واژه به نام lethal trifecta ساخته که تعریف کامل تری از ابعاد خطرات گول زدن هوش مصنوعیه. نکتهاش اینه که میگه وقتی یک واژه جدید و سخت تعریف کنید مردم دیگه فکر نمیکنند معنی واژه رو میدونن بلکه مجبور میشن برن بخونن تا بفهمن دقیقا چیه.
۵- در سالی که گذشت مفهوم داشتن تست برای ما پررنگ ترشد. در واقع مدلها بدون تستها صرفا یک پیادهسازی نصفه نیمه انجام میدن که ممکنه حالتهای مرزی رو پوشش نده. چیزی که مهمه اینه که مجموعه تستی داشته باشیم تا مدل بتونه به خوبی از درستی کاری که کرده مطمئن بشه.
۶- و در نهایت راجع به پدیده ای به نام slop صحبت میکنه. میگه که اینترنت همینجوری همیشه پر از مطالب الکی و بیخود و مزخرف بود حالا اما با اومدن AI این مطالب خیلی خیلی بیشتر شدند. مثالش این ویدیوهای فیکی که از نجات حیوانات در اینستا ترند شده.
لینک بلاگ:
https://simonwillison.net/2025/Dec/31/the-year-in-llms
۱- میگه که در سالی که گذشت این YOLO کردن ایجنتها (یعنی این که بهشون این دسترسی رو بدی که برای هر کاری کردن نیازی به گرفتن اجازه ازت نباشه)، رایج شد. و پدیدهای که داره رخ میده اینه که مردم دارن به این دسترسی دادن به ایجنتها عادت میکنند و یک روزی گند این درمیاد. یک مفهوم جامعهشناختی مرتبط با این هم هست به نام Normalization of Deviance که این جوریه:
where repeated exposure to risky behaviour without negative consequences leads people and organizations to accept that risky behaviour as normal
۲- این برادر سیمون پارسال یک بنچمارک فان برای خودش تعریف کرده: مدل بتونه با خروجی متنی، یک فایل SVG از پلیکان دوچرخهسوار بسازه. این کار خیلی سخته چون که هم دوچرخه از نظر هندسی سخته و هم پلیکان بد شکل و چغره و از اون طرف هم قطعا داده آموزشی از پلیکان در حال دوچرخهسواری اون هم با SVG وجود نداره. حالا نکتهای که هست دیده که این بنچمارک مسخرهای که تعریف کرده با عملکرد مدلها در تسکهای دیگه کوریلیشن داره و هر چه یک مدلی بهتر باشه بهتر میتونه این تصویر رو تولید کنه. از اونور هم بنچمارکش تبدیل به میم شده و حتی شرکتهایی مثل گوگل و انتروپیک گاها عملکرد مدلهاشون رو روی این بنچمارک پلیکان دوچرخهسوار نمایش دادند.
۳- یک حدسی زده که MCP امسال با این که درخشید اما آخرین سالی هم بوده که درخشیده. چون که ایجنتهایی که قادرند از ابزارهایی مثل bash به خوبی استفاده کنند دیگه نیازی به MCP شاید نداشته باشند.
۴- این نکتهاش رو خیلی خوشم اومد: میگه که prompt injection و jailbreaking بسیار در سال گذشته خطرناک شدند و مردم به خوبی جدی نمیگیرند ابعاد مختلف این خطر رو. چون که در عین این که فکر میکنند معنی jailbreaking رو میدونند با ابعاد و زوایای پنهان این پدیده آشکار نیستند. خودش کاری که کرده اومده یک واژه به نام lethal trifecta ساخته که تعریف کامل تری از ابعاد خطرات گول زدن هوش مصنوعیه. نکتهاش اینه که میگه وقتی یک واژه جدید و سخت تعریف کنید مردم دیگه فکر نمیکنند معنی واژه رو میدونن بلکه مجبور میشن برن بخونن تا بفهمن دقیقا چیه.
۵- در سالی که گذشت مفهوم داشتن تست برای ما پررنگ ترشد. در واقع مدلها بدون تستها صرفا یک پیادهسازی نصفه نیمه انجام میدن که ممکنه حالتهای مرزی رو پوشش نده. چیزی که مهمه اینه که مجموعه تستی داشته باشیم تا مدل بتونه به خوبی از درستی کاری که کرده مطمئن بشه.
۶- و در نهایت راجع به پدیده ای به نام slop صحبت میکنه. میگه که اینترنت همینجوری همیشه پر از مطالب الکی و بیخود و مزخرف بود حالا اما با اومدن AI این مطالب خیلی خیلی بیشتر شدند. مثالش این ویدیوهای فیکی که از نجات حیوانات در اینستا ترند شده.
لینک بلاگ:
https://simonwillison.net/2025/Dec/31/the-year-in-llms
Simon Willison’s Weblog
2025: The year in LLMs
This is the third in my annual series reviewing everything that happened in the LLM space over the past 12 months. For previous years see Stuff we figured out about …
مو مونده بیکس
خداوندا به فریاد دلم رس
کس بی کس تویی مو مانده بیکس
همه گویند طاهر کس نداره
خدا یار موئه چه حاجت کس
باباطاهر
خداوندا به فریاد دلم رس
کس بی کس تویی مو مانده بیکس
همه گویند طاهر کس نداره
خدا یار موئه چه حاجت کس
باباطاهر