Out of Distribution
2.37K subscribers
472 photos
9 videos
9 files
276 links
Download Telegram
حلقه ژیگز

یکی از ماجراهای ترند این هفته دانشکده کامپیوتر شریف، به امتحان هفته پیش یکی از درسها برمیگرده. ماجرا اینجوریه که امتحان میانترم یکی از پرجمعیت‌ترین درسها داشته بعد از ظهر برگزار میشه، بعد یهو برق می‌ره و سالن غرق تاریکی میشه. در همین حال که دیگه چشمها پوشیده میشه برخی از مردم هم شروع میکنن به تقلب کردن. یکی موبایل درمیاره از gpt می‌پرسه یکی از کناری‌هاش می‌پرسه، یکی برگه اش رو با یکی دیگه تعویض می‌کنه و .... خلاصه نهایتا مسئولین اون درس بعد امتحان تصمیم میگیرند با توجه به حجم و کیفیت تقلب‌های رخ داده امتحان رو ملغی و دوباره بعداً برگزارش کنند.

حالا کاری به کیفیت و چرایی این اتفاق رخداده نداریم. ماجرا اما اینه که طرف در شریف هم باشه وقتی ترس از افشاشدن و جریمه‌شدن برداشته بشه، دست به تقلب میزنه. بله. حالا این آدمها که امروز نهایتا بتونم در حد یکی دو نمره خارج از اخلاق بازی کنند فردا روزی وقتی در موقعیت‌های بالاتر قرار بگیرند چه می‌کنند. چرا اصلا آدم دست به اختلاس نزنه؟ تصور کنید اگر این میزان ترس از تهدیدشدن کاهش پیدا کنه آدم تبدیل به چه موجودی میشه. اخلاق وجود نداره. یا یک ترس از تهدید شدنه یا یک ریاکاری. فاصله ما با اپستین خیلی کمتر از حدیه که بهش فکر کرده باشیم. تا حالا فکر کردید شما اگر ترسی و تهدیدی (هیچ تهدیدی) بالاسرتون نباشه دست به چه کارهایی میزدید؟

مرتبط با این، افلاطون در کتاب جمهور خودش یک آزمایش-داستان طراحی می‌کنه. داستان از این قراره که چوپانی یک حلقه پیدا می‌کنه که با چرخوندنش نامرئی میشه. بحث افلاطون اینه: اگر انسان مطمئن باشه که دیده نمیشه (مجازاتی در کار نیست)، آیا باز هم اخلاقی رفتار می‌کنه؟ یا اینکه اخلاق فقط یک قرارداد اجتماعیه برای جلوگیری از هرج‌ومرج؟
کوت قشنگیه ولی مشکلش اینه که یک man of success اون رو گفته. اگر اون زیر به جای انیشتین نوشته بود اصغرآقا اکبرنژاد دیگه اصلا کوت نمی‌شد. یا شاید اصلا اصغرآقا اکبرنژاد کوت‌های بهتری نسبت به انیشتین گفته ولی کسی در نظرش نگرفته. بله خلاصه
Out of Distribution
بلعیده و هضم‌شدن آدم‌ها در میدان‌ها این اواخر با یک فرد فرهیخته‌ای آشنا شدم که از فرصت‌های هم‌صحبتی که با ایشون گهگاه رخ می‌داد، لذت می‌بردم و یاد می‌گرفتم. این بزرگ، البته بر خلاف من، ساکت‌ و فروتن هستند. یکبار ازش پرسیدم چرا مثلا جایی اثری از شما نیست و…
نتانیاهو اخیرا در مورد درخواست ترکیه برای تحویل گرفتن F-35 ها چنین چیزی گفته:

And in a thinly veiled reference to Turkey’s quest to receive the F-35 fighter jet from the US, Netanyahu promises that Israel will “prevent whoever must be prevented from receiving these instruments.”


کسی هم نیست بهش بگه آقا اینها اصلا مال آمریکاست به تو چه اصلا. یک سیاست واقع‌گرایی و تهاجمی رو داره اتخاذ می‌کنه که البته از ساید خودشون هم درست هست و دلیل بخشی از موفقیتش هم همینه. بعد اینجا اون وقت شاهد یک عده‌ای هستیم که هنوز در دوران خوش پیش از ۲۰۰۸ زیست می‌کنند شعار همزیستی مسالمت‌آمیز میدن و فکر میکنند همه چیز با گفتگوی صرف حل میشه، گویی دنیا در چشمشون کارتون خرس های مهربونه. البته که اینها به معنی طرفداری من از میدان مقابل نیست. من ممکنه طرفدار تسلیم شدن باشم ولی به این معنا نیست که فکر کنم که مشکلات دنیا با گفتگو حل میشه.

لینک:
https://www.timesofisrael.com/liveblog_entry/netanyahu-israel-investing-more-than-100-billion-in-arms-production-in-bid-for-independence/
گاها پیش میاد سناروهایی که من با یک اشخاصی باید جلسه برم. بعد خود اون بزرگ هم اوکی میده میگه آره به منشیم تماس بگیر برای زمانبندی. بعد من با منشی طرف که وارد صحبت می‌شم اون قابل نمی‌دونه جلسه بذاره میگه اصلا جلسه نمیخواد. حالا اشکال کار هم از اون منشی نیست. بروکراسی کلا این شکلیه. شما فکر کنید دسترسی به مقامات سیاسی یک کشور دیگه چه طوری خواهد بود. نقش مدیران دفتر و منشی‌ها فراتر از تصورهاست. آدم گاهی چیزی فراتر از شخص خودش میشه و تعریف اون آدم میشه مجموعه‌ای از خودش و متصلات به خودش.

#تجارب
Out of Distribution
بلعیده و هضم‌شدن آدم‌ها در میدان‌ها این اواخر با یک فرد فرهیخته‌ای آشنا شدم که از فرصت‌های هم‌صحبتی که با ایشون گهگاه رخ می‌داد، لذت می‌بردم و یاد می‌گرفتم. این بزرگ، البته بر خلاف من، ساکت‌ و فروتن هستند. یکبار ازش پرسیدم چرا مثلا جایی اثری از شما نیست و…
وفاق را با ذکر مثال تعریف کنید.

روزنامه شرق به تازگی گزارشی منتشر کرده که در اون نوشته که گویا از طرف دانشگاه شریف به خانواده‌های دانشجو های دختری که حجاب رو رعایت نمی‌کردند زنگ زده شده و اونها رو تهدید میکردند. جزییاتی که شرق بهشون اشاره کرده تکان دهنده است، نوع لفظ‌های مورد استفاده (دختر شما داره در دانشگاه بی‌عفتی می‌کنه یا دختر شما داره عریان می‌گرده) و حتی زنگ زدن به پدربزرگ و مادربزرگ افراد گویا رخ داده! از اون طرف معاون فرهنگی دانشگاه امروز گویا بروز این اتفاق رو تایید کرده و گفته که متوقف می‌شه. در همین حین بعد از این پیام، دقایقی بعد شروع کردند به فرستادن پیامک نقض الگوی رفتاری (همون عدم رعایت حجاب) برای دانشجوها :)))

حالا بحث اصلی سر خوبی یا بدی ماجرا نیست. شریف تودی درباره اش مطلب بهتری نوشته. چیزی که برای من جالبه اینه که یک دانشگاهه اما درش به طرز قشنگی یکپارچگی موج میزنه. یک عده یک اقدامی میکنند، بعد یک جای دیگه دانشگاه متوقفش می‌کنه، بعد دوباره همون عده یک کار دیگه ای میکنند و الی انتها.

پی‌نوشت: آدم باید منصف باشه. چیزی که برای خودش نمی‌خواد رو برای دیگران هم نخواد. اگر روزی کسی زنگ بزنه به مادربزرگ مسن من و بد من رو بهش با زبان تهدید بگه قطعا من ناراحت میشم که هیچ، آمپر جوش میارم. آیا اگر بسیجی-ارزشی هستید، فارغ از این که مطمئنید هیچ وقت نقض الگوی رفتاری نمی‌کنید، این را برای خودتان می‌پسندید؟
Out of Distribution
ژئوپلتیک لایه‌ای هوش مصنوعی ۱/.. دو روز پیش خبر اومد که انتروپیک (سازنده مدل‌های کلاد) با گوگل کلود قرارداد بسته. در نگاه اول مخصوصا اگر پیش‌زمینه‌ای از بحث در ذهن آدم نباشه، براش این سوال پیش میاد که این چه معنی داره که خود گوگلی که Gemini رو داره و روش…
اینجا تا لایه تراشه صحبت کرده بودیم. شرکت‌هایی مثل Nvidia تراشه‌ها رو طراحی می‌کنند ولی برای ساختش مجبورند به شرکت TSMC تایوان سفارش بدن و اون هست که گلوگاه اصلی تولید تراشه‌های دنیا هست. سوال، خود TSMC چطور تراشه می‌سازه و آیا لایه زیرتر از اون هم وجود داره؟ بله. در واقع خود TSMC برای ساختن تراشه از دستگاه‌هایی به نام لیتوگرافی استفاده می‌کنه که یک جورهایی به طرز ساده‌شده میشه اون رو پرینتری در نظر گرفت که با نور روی ویفرهای سیلیکونی نقش مدارها رو چاپ می‌کنه. سوال: چه کسانی دستگاه لیتوگرافی تولید می‌کنند؟ پاسخ: تنها یک شرکت در دنیا هست که به صورت پیشرفته و درست و درمون دستگاه لیتوگرافی تولید می‌کنه و اون هم شرکت ASML هست که در هلنده.

حالا رویترز ادعا کرده که چینی‌ها تونستند با مهندسی معکوس و سرمایه‌گذاری و هانت‌کردن مهندسین ASML نمونه‌های اولیه‌ای از دستگاه لیتوگرافی رو بسازند:

https://www.reuters.com/world/china/how-china-built-its-manhattan-project-rival-west-ai-chips-2025-12-17/
دیگه حوصله بحث کردن با آدم‌ها، مخصوصاً اون‌هایی که دائم می‌خوان ثابت کنن دانا و فاضل مطلق‌اند، رو ندارم؛ همون‌ها که به هر پدیده‌ای مثل یک مسئله‌ی علمی یا یک قانون نگاه می‌کنن و مدام دنبال اثبات یا ردش هستن. آدم‌هایی که تجربه‌های انسانی و احساسات رو نمی‌فهمن و برای تجربه‌های انسانی هم دنبال فرموله‌کردن می‌گردن. بعضی‌ها خییییلی جدی گرفتند. شب به فنا

#افکار_پریشان
ترک Industry کنفرانس ACL

امروز داشتم کنفرانس ACL رو چک می‌کردم که به صورت تصادفی دیدم که یک track به نام Industry Track هم داره که توش بیشتر از این که بخوان به مسائل آزمایشگاهی بپردازن، هدفشون بیشتر پرداختن به مسائل صنعتی و محصولی هست. چیزهایی از جنس چالش‌های عملی مثل استقرار محصول، نسبت کارایی به هزینه، انواع انتخاب‌های طراحی و ارزیابی و مانیتورینگ محصول در دنیای واقعی هستش. مثلا این که شما چطوری latency محصولتون رو کاهش بدید، یا این که چطوری بتونید سیستم‌تون رو نگه‌داری کنید یا بهبودش بدید، چه شکلی از آدم به عنوان Human in the loop استفاده کنید، توسعه جدیدتون رو محصول رو سریعتر و کم‌هزینه‌تر انجام بدید و ...

لینک توضیحات برای ACL 2026:
https://2026.aclweb.org/calls/industry_track/

جدید هم نیست و پارسال هم داشتند و لیست پیپرهای پارسال ACL تو این ترک رو می‌شه اینجا دید:
https://2025.aclweb.org/program/ind_papers/
کوشش بیهوده به از خفتگی؟

بس دراز است این‌، حدیث خواجه گو
تا چه شد احوال آن مرد نکو

خواجه اندر آتش و درد و حنین
صد پراکنده همی‌گفت این چنین

گه تناقض گاه ناز و گه نیاز
گاه سودای حقیقت گه مجاز

مرد غرقه گشته جانی می‌کند
دست را در هر گیاهی می‌زند

تا کدامش دست گیرد در خطر
دست و پایی می‌زند از بیم سر

دوست دارد یار این آشفتگی
کوشش بیهوده به از خفتگی

آنک او شاهست او بی کار نیست
ناله از وی طرفه کو بیمار نیست

بهر این فرمود رحمان ای پسر
کل یوم هو فی شان ای پسر

اندرین ره می‌تراش و می‌خراش
تا دم آخر دمی فارغ مباش

تا دم آخر دمی آخر بود
که عنایت با تو صاحب‌ سِر بود

هر چه می‌کوشند اگر مرد و زنست
گوش و چشم شاه جان بر روزنست

مولوی
نوابغ در ایران دیوانه می‌شوند

داشتم تب‌های خیلی قدیمی‌ام رو نگاه می‌کردم و می‌بستمشون این تب رو دیدم. یادم نیست چطور سر چی بهش رسیده بودم ولی الان که دیدم یک حس عمیقی بهم دست داد. حرف‌های جالبی ابراهیم فیاض زده بوده:

این‌ها موارد انعطاف در دانشگاه‌های پیشرفته هستند. نابغه را نباید اذیت کرد. نوابغ در ایران دیوانه می‌شوند. من سال‌ها در دوره راهنمایی، قبل و بعد از انقلاب شاهد این موضوع بوده‌ام که نابغه‌ها چون در کشور ما فهمیده نمی‌شوند، دیوانه می‌شوند. دانشگاه‌های ما نابغه کشند. من خبر موثق دارم که تمامی دانشجویان صنعتی شریف دچار مشکلات روحی و روانی‌اند. در دانشگاه تهران هم روانی هست ولی تعدادشان کمتر است. دلیلش هم این است که بچه‌های نابغه در دانشگاه‌های ما تکلیف خود را نمی‌دانند.


دانشگاه‌های مهم کشور پر از افرادی با مشکلات روانی است. یکی از دلایل این مشکلات این است که ریاست دانشگاه‌های فنی با مهندسان است و یک مهندس با نحوه ریاست دانشگاه آشنایی ندارد. یعنی یکی از مشکلاتی که ما در آموزش عالی داریم، این است که به جای اینکه مدیران دانشگاه تخصص مدیریت دانشگاهی داشته باشند، تخصصات فنی دارند.


چون دانشگاه‌ها برای ارتقای رتبه خود، از نهاد آموزشی به یک نهاد پژوهشی تبدیل شده‌اند. از طرفی پژوهش را تنها مقاله isi می‌دانند. یعنی دانشگاه‌ها را از آموزش نیز ساقط کرده‌اند. در گذشته کلاس و آموزش تمام عشق اساتید بود؛ اما الان که بحث مقاله isi در میان است، دیگر آموزش به کار اساتید نمی‌آید. از طرفی isi را نیز وتویی کردند. یعنی پژوهش کانالیزه شده برای مقاله isi که آن هم وتویی است
جمع‌بندی کارپثی از داستان‌ LLMها در ۲۰۲۵

اینفلوئنسر محبوبم آقای آندره‌آ کارپثی، در یک بلاگ کوتاهی برداشت‌های خودش از LLMها در سال ۲۰۲۵ رو به اشتراک گذاشته. بخش‌های مهمش این‌ها هستند:

1. Reinforcement Learning from Verifiable Rewards (RLVR)
2. Ghosts vs. Animals / Jagged Intelligence
3. Cursor / new layer of LLM apps
4. Claude Code / AI that lives on your computer
5. Vibe coding
6. Nano banana / LLM GUI

۱- کارپثی معتقده که RLVR یکی از مهم‌ترین اتفاقات هوش مصنوعی در سال گذشته بوده و میشه گفتش که یک استیج جدید روی استیج‌های قبلی که PT و SFT و RLHF بودند اضافه شده و اعتقاد داره که RLVR بوده که به خاطر خواصش باعث شده که مدل‌ها به توانایی استدلال دست پیدا کنند.

۲- یک اعتقاداتی درباره ماهیت و ذات هوش و هوش مصنوعی داره که در این بخش درباره‌اش صحبت کرده. می‌گه که فضای هوش چیزی گسترده‌تر از تصور اولیه ماست و سنجیدن هوش LLM با حیوانات کار ممکنی نیست. معتقده که LLM بیشتر شبیه به یک روحی هست که عصاره هوش انسانی درش بروز پیدا کرده و پشت فضای واقعی دنیا در حال تعامل هست (استعاره بسیار عمیق). از یک طرف دیگه هم می‌گه که هوش LLMها هنوز دندانه‌دار هست یعنی در یک دامینی خوبه ولی اندکی که از اون دامین خارج می‌شیم ابله هست و برای همین هنوز تا AGI فاصله داریم. در کنار اینها هم می‌گه که بنچمارک‌ها چون همیشه قابل سنجش هستند (یعنی جواب درست/غلط دارند) پس همیشه در معرض این هستیم که با تولید داده و انجام RLVR روی بنچمارک‌ها مدل‌هامون روی اونها پیروز کنیم در حالی که هنوز جنبه واقعی هوش نرسیده باشیم (این تکه‌اش کراس اوری هست با اون نگاهی که راجع به RLVR داشت، در واقع می‌گه که با این که RLVR به ما اجازه داد که هر چیز قابل سنجشی رو روش آموزش بدیم مدلهامون رو ولی نشون داد که یک چیزهایی فراتر از قلمرو راستی‌آزمایی‌پذیری انگار وجود دارند) یک صحبت جالب دیگه هم داشت که می‌گفت هر شغلی که قابلیت راستی‌آزمایی‌پذیری بیشتری داشته باشه سریعتر هم توسط هوش مصنوعی جایگزین می‌شه (مثل مهندسی نرم افزار مثلا).

۳- در مورد Cursor صحبتی که می‌کنه می‌گه که Cursor یک لایه جدید ابسترکشن از LLM appها رو معرفی کرد. شما می‌تونید به جای کرسر برید با GPT صحبت کنید و ازش کد بگیرید ولی کرسر روی اون نیازمندی خاص شما اومده یک جور context engineering انجام داده و تعامل شما با llm رو جوری مهندسی کرده که کار شما رو راحت کرده. بر همین اساس احتمالا در آینده شاهد اپ‌های مختلف تری روی همین ابسترکشن شبیه cursor منتها برای دامین‌ها و نیازمندی‌های دیگه خواهیم بود. مثلا فرض کنید cursor برای آموزش یا روان‌درمانی چه شکلی می‌تونن باشند.

۴- یک صحبتی هم راجع به Cursor Code کرده که به نظرش از این حیث که روی کامپیوتر شما اجرا می‌شه و قابلیت Agency داره جالبه. به نظرش شبیه یک روحی هست که در محیط کامپیوتر شما زندگی می‌کنه.

۵- راجع به vibe coding حرف می‌زنه و میگه که خودش ازش خیلی استفاده کرده. خودش مثلا Rust بلد نبوده ولی با vibe coding تونسته توکنایزرهای بر پایه rust بزنه و کلا معتقده که وایب کدینگ مفهوم برنامه‌نویسی و شرح وظایف رو تغییر می‌ده.

۵- و در نهایت هم Nano Banana. حضرت کارپثی می‌گه که این که ما چطور و از طریق چه رابطی با انسان رابطه برقرار کنیم یک مساله مهمیه. همین الان بخش مهمی از تعاملات llm با انسان از طریق markdown صورت می‌گیره و اگر markdownای وجود نداشت تجربه کار با llmها سخت می‌شد. بر همین جنبه معتقده که ارائه تصویر (مثل ارائه اسلاید، نمودار،‌ اینفوگرافی) به انسان بسیار موثرتر هست تا ارائه متن خالی و برای همین نانوبنانا رو یک جهش بزرگ در عرصه رابطه کاربری بین انسان و هوش مصنوعی می‌دونه.

در نهایت همین TLDR از صحبت‌هاش:

TLDR. 2025 was an exciting and mildly surprising year of LLMs. LLMs are emerging as a new kind of intelligence, simultaneously a lot smarter than I expected and a lot dumber than I expected. In any case they are extremely useful and I don't think the industry has realized anywhere near 10% of their potential even at present capability. Meanwhile, there are so many ideas to try and conceptually the field feels wide open. And as I mentioned on my Dwarkesh pod earlier this year, I simultaneously (and on the surface paradoxically) believe that we will both see rapid and continued progress and that yet there is a lot of work to be done. Strap in.


لینک:
https://karpathy.bearblog.dev/year-in-review-2025/

پی‌نوشت: از این که پست‌های کانال رو به اشتراک می‌گذارید از شما ممنونیم.
هوش مصنوعی، با این که خیلی جذاب و داغ بوده در سال‌های اخیر ولی از جهاتی به عنوان یک فیلد ریسرچی به نظر در حال fail کردنه. تعداد مقالات ارسالی به کنفرانس‌ها و ژورنال‌ها بسیار بسیار زیاد شده. بعد به این تعداد مقاله‌ ارسال‌شده داور وجود نداره. بعد مثلا بعضی کنفرانس‌ها مثل ACL برای جبران این وضع قاعده وضع می‌کنند که هر کسی که پیپر می‌نویسه ارسال می‌کنه باید حتما به عنوان reviewer هم ثبت نام کنه و بقیه کارها رو داوری کنه وگرنه از فرستادن پیپر تو دوره‌های بعدی محروم می‌شه. بعد به همین خاطر داوری اجباری، یک تعداد داوری بی‌کیفیت به وجود میان. تازه همه اینها به کنار، نرخ اکسپتی پیپرها در کنفرانس‌های تاپ حدود ۲۵-۳۰ درصده. یعنی یک درصد زیادی پیپر هستند که اینا از کنفرانس‌های قبلی آماده هستند و تو هر کنفرانس بعدی سابمیت می‌شن. در چنین حالتی افراد آکادمیک جهت رقابت با همدیگه مجبورند عوض کار کردن روی یک تعداد کم پیپر روی تعداد زیادی پیپر کار کنند تا شانس پذیرششون بیشتر بشه و همین انباشت رو بیشتر و بیشتر می‌کنه. در بلندمدت نهایتا تعداد زیادی پیپر روی هم انباشت می‌شن و دیگه رسما فیلد رو باید در حالت بن‌بست تعطیل کرد. خیر داغ‌شدن این فیلد به ما نرسید که بدتر نقره‌داغمون کرد.
ارزش روی خروجی سریع است؟

چند وقتی هست که تیم‌لیدرم عوض شده و توفیق شمشیر‌زدن در رکاب آقای پویا پاینده رو داریم. بعد از گذشت چند وقت یک سری رفتارهای پاینده برام معنادار شدند و دیگه نه به عنوان یک رخداد یهویی که به عنوان یک ویژگی شخصیتی ازش می‌شناسم. روال کلی شخصیتش این شکلیه که وقتی می‌خوام یک تسکی رو شروع کنم با من اول خیلی جدی بحث می‌کنه چرا می‌خوای اصلا این تسک رو بزنی؟ در حالی که به نظرم خیلی همه چیز بدیهی است ولی باز سوال پیچم می‌کنه و نهایتا بعد از کلی صحبت ازم می‌خوام یک داک برای مساله و راه حل بنویسم. بعد هم که "کد" رو می‌زنم و کار می‌کنه و مرج رکش رو می‌فرستم، کوهی از کامنت‌ها بر سر مرج رکم می‌ریزه. جمله پرتکرارش هم این شکلیه که این دیزاین، به نظر دیزاین خوبی نیست برو بهترش کن.

حالا مرتبط با همین این مساله امروز در راه بازگشت به خانه این بلاگ رو دیدم. حرف کلیش اینه که طراحی یک چیز جدای از ابزار (که کد باشه) هست و ما خیلی وقتا اصل ماجرا رو گم کردیم و درگیر کد شدیم. و بحثی هم که مطرح می‌کنه اینه که با ورود AI و ایجاد قابلیت به خروجی رسیدن سریع، نقش‌هایی که از مهندسین انتظار می‌ره انگار دارند به صورت مخربی تغییر می‌کنند. می‌گه حالا که Cursor داریم، این آفت رو در کنارش داریم که بدون طراحی اولیه سراغ پیاده‌سازی سریع هل داده بشیم و از قبلش آسیب ببینیم. آسیبی که می‌تونه شامل از دست دادن تفکر مفهومی و عدم جستجوی راه‌حل‌های مختلف بین اعضای تیم باشه و همین باعث می‌شه که محصولات کمتر منحصر به فرد باشند.

مطلب پررنگی دیگه‌ای هم که در بلاگ بود این بود که طراحی دو بخشه. بخش اول طراحی مساله است. و بخش دوم هم طراحی مفهوم راه حل و اجرای اونه. در بخش طراحی مساله باید مشخص بشه اصلا دنبال چه هستیم و ذی‌نفع کیه و چی می‌خواد. خیلی وقتا تیم‌ها در مسیر یک پروژه‌ای شکست می‌خورند، شاید به نظر برسه روی راه حل دارند دعوا می‌کنند ولی ۹۰٪ اوقات ماجرا اینه که چون روی مساله هم صفحه نیستند راه حل‌های مختلفی به ذهنشون می‌رسه. حالا از وقتی که.Cursor اومده این شکلی شده که یک فیچری به ذهنمون می‌رسه و چون هزینه زمانی رسیدن بهش خیلی کمه همینجوری می‌ریم یهو سریع به خروجی می‌رسیم و اتفاقا درگیری سر راه حل رو هم نداریم چون در لحظه بهش رسیدیم، فارغ از این که قبلش اصلا روی خود مساله و راه حلش فکر کرده باشیم. خیلی‌ها می‌گن مهندسی نرم افزار اتومات می‌شه توسط هوش مصنوعی به زودی، بله، شما شاید بتونی ابزار و کد‌زدن رو با AI جایگزین کنید ولی هنوز اون نقش طراحی مهندسی نرم افزار، مثل این گیرهایی که پاینده می‌ده، قابل جایگزینی کامل نیست. ممکنه حتی مثلا در لایه معماری نرم افزار و اینها اتومات بشه یک روزی ولی باز یک لایه ابسترکشنی بالاتر از اون شکل می‌گیره که در اون لایه باز دعوای دیزاین وجود خواهد داشت. آدمایی که از قضیه دور باشن یک چیزی از کد زدن تو ذهنشون هست در حالی که در واقعیت قضیه متفاوت‌تره.

لینک بلاگ:
https://linear.app/now/design-is-more-than-code
تراستی حیا کن

این طور که به نظر میاد مبلغی، بیشتر از حداقل ۶ میلیارد دلار، از فروش نفت که باید توسط تراستی‌ها به کشور باز می‌گشته و از اون ور صرف واردات نهاده‌های دامی میشده، هنوز به کشور برنگشته و این بلبشوی فعلی در بازار مواد خوراکی و بعدش هم دلار رو سبب شده.

پی‌نوشت: تراستی یعنی چی؟ با توجه به این که ایران تحریم هست، مبادلات و انتقال‌های مالی نمی‌تونه با دنیا انجام بده. به فرض مثال اگر به پالایشگاهی در چین نفت فروخته میشه، اون پالایشگاه قاعدتاً نمیتونه مستقیما دلار به حساب بانک مرکزی ایران بریزه. در این جا یک سری شرکت صوری (که اغلب در امارات قرار دارند) هستند که کار اونها انجام دادند کارهای صرافی‌طور برای صادرات و واردات ایران هست. به این شکل که مثلا از یک ور پول صادرات نفت ایران رو دریافت می‌کنند و از اونور هم پول واردات نهاده‌های دامی رو می‌پردازند. حالا قضیه اینه که فروش نفت ایران بعد از اسنپ بک هم همچنان وجود داره اما این دوستان تراستی پول‌ها رو بر نمی‌گردونن.

حالا این که این دوستان شریف و خدوم و زحمت‌کش، چرا پول رو بر نمی‌گردونن، نیتشون چیه و از سهو میکنند یا از قصد، چیزی هست که احتمالا در قسمت‌های بعدی این سریال متوجه می‌شیم.

لینک‌های مرتبط:

https://www.ilna.ir/fa/tiny/news-1732213

https://www.ilna.ir/fa/tiny/news-1733417
زاهد بودم ترانه‌گویم کردی
سرفتنهٔ بزم و باده‌خویم کردی

سجاده‌نشین باوقاری بودم
بازیچهٔ کودکان کویم کردی

مولوی
Out of Distribution
Photo
نسبتا پیش‌دستانه؟

این توییت از یکی از نمایندگان کمیسیون امنیت ملی امروز در توییتر زیاد دست به دست می‌شد. دو نکته رو می‌شه راجع بهش بحث کرد. اولا که حمله پیش‌دستانه وقتی معنا داره که شما بتونی در سایه غافلگیری به طرف مقابل یک ضربه تاکتیکی وارد کنی طوری که طرف نتونه خودش رو جمع کنه. مثلا زدن سایت‌ها یا تجهیزات نظامی یا حذف فرماندهان سطح بالا از مصادق حمله پیش‌دستانه می‌تونن باشند (کاری که اسراییل سری پیش با ایران کرد). اما ایران با توجه به دقت موشک‌هایی که داره نمی‌تونه ضربه تاکتیکی بزنه و اصلا بخواد بزنه هم با توجه به اشراف اطلاعاتی اسراییل-آمریکا نمی‌تونه عنصر غافلگیری رو ایجاد کنه. در این صورت پس ضربه پیش‌دستانه آیا منطق دیگه‌ای می‌تونه داشته باشه؟ بله. در شرایطی که شما مطمئن باشی طرف مقابل به صورت حتمی ظرف چند وقت آینده به شما حمله می‌کنه و شما مورد غافگیری واقع می‌شی حمله پیش‌دستانه این کارکرد رو داره که حداقل ابتکار زمان شروع جنگ رو از طرف مقابل می‌گیری و اجازه نمی‌دی شوک و غافلگیری زمان‌بندی‌شده بهت تحمیل بشه.

از طرف دیگر اما بحثی که در سوشال مدیا و مخصوصا کاربران ارزشی شکل گرفته بود این بود که به این نماینده مجلس گیر داده بودند چرا اسرار رو فاش می‌کنی. اما برعکس به نظر می‌رسه این حرکت عمدی و برنامه‌ریزی شده از سطح بالاتری باشه و به نظر حتی کلماتی که در پیام هست رو خود این بابا انتخاب نکرده. مخصوصا وقتی مورد قبل رو در نظر می‌گیریم که ایران توان ضربه‌زدن تاکتیکی رو در حمله پیش‌دستانه نداره، در این صورت پس اصلا گفتن علنی این که من می‌خوام پیش‌دستانه حمله کنم اصلا چه معنی داره؟ اینجا محتمل‌ترین توضیح اینه که خود گفتن، بخشی از بازی محاسباتی است نه افشای یک عملیات مشخص.

دو سناریو قابل حدسه. اول این علنی گفتن می‌تونه خودش بخشی از زمان خریدن باشه. شما وقتی طرف مقابل (که خواهان حمله هست) رو تهدید به حمله پیش‌دستانه می‌کنی، طرف مقابل رو در محاسباتش به یک سمت هل می‌دی. طرف مقابل ممکنه مقداری احتیاط درش به وجود بیاد که مبادا در لحظه‌ای که آماده نیست ضربه بخوره، پس مدتی صبر می‌کنه تا مطمئن بشه از جایی که نباید ضربه نمی‌خوره و یا این که سریعتر نقشه‌اش رو اجرا می‌کنه در حالی که ممکنه آمادگی صددرصدی بابتش نداشته باشه. یک سناریو دیگه هم ممکنه این وسط باشه و اون اینه که اسراییل قصد داره یک عملیات محدود (مثلا علیه سایت نطنز/اصفهان یا سایت‌های تولید موشک یا زدن چند مقام نظامی-سیاسی) هست و بعدش اعلام پایان حمله کنه که بعدش بتونه کنترل تشدید رو حفظ کنه و ایران هم پاسخ سنگینی نده (نظیر همه سناریوهایی که از ترور سلیمانی تا ترورهای آخر سوریه رخ داد). در چنین حالتی معنی "نسبتا پیش‌دستانه" می‌تونه این باشه که در شرایطی که ایران حس کنه که موعد حمله اسراییل نزدیکه زودتر دست به حمله بزنه (فراموش نکنیم که ایران در جنگ سری قبل هم طبق قرائن شب واقعه می‌دونست که حمله قراره رخ بده ولی تصوری از شدت اون نداشت).

در کل ولی با اوضاع خیط و اسف‌بار اقتصادی-سیاسی داخلی و خارجی، احتمال وقوع این امر به صفر میل می‌کنه. الله اعلم.
Paridokht
Salar Aghili
زخمی از زمانه و خسته از خیال‌ها ...
زمانی که من جوانی ۲۲-۲۳ ساله بودم، یادمه این اساتید قدیمی دانشگاه همیشه گلایه می‌کردند چرا هوش مصنوعی همش شده دیپ لرنینگ و دیگه به مدل‌های آماری یا اصلا قبل‌تر، مدل‌های سیمبلیک توجهی نمی‌شه. امروز حالا وقتی داشتم ردیت رو بالا پایین می‌کردم و گزارش‌های تحت عنوان Folan of LLMs in 2025 ملت رو می‌دیدم این حس بهم دست داد که دیگه کلا هوش از دیپ لرنینگ هم محدود‌تر شده و تقریبا شده LLMها. باری به هر جهت این دو تا بلاگی که ریویوی بر اتفاقات افتاده در حوزه LLMها افتاده بودند رو مفید یافتم.چیزی که بین هر دو مشترک و قابل حدس بود، اشاره به RLVR و Tool Call و رشد محصولاتی نظیر Claude Code و Cursor بود. در کنار اینها، هر دو هم به این مطلب اشاره داشتند که نقش چینی‌ها در سال گذشته در قلمرو AI به طور قابل مشهودی پررنگ شده.

نکات جالبی که از بلاگ راشکا دیدم یکی این بود که اعتقاد داشت ما وارد پدیده‌ای به نام Benchmaxxing شدیم. یعنی توسعه‌دهنده‌های مدل‌ها به طرز وسواسی دارن سعی می‌کنن خودشون رو صرفا روی بنچمارک‌ها بهتر نشون بدن، در حالی که وقتی که خارج از بنچمارک‌ها سنجیده می‌شن، به طرز واضحی تفاوت دارند. در واقع امسال بود که معنی contamination رو به خوبی درک کردیم یعنی چی. یک نکته دیگه هم راجع به Burnout شدن راجع به LLMها نوشته بود که به نظرم جالب بود. میگه که کار مهندسین نرم افزار الان بیشتر از این که کدزدن باشه، تبدیل به ریویوکردن کدهای llm generated شده. و همونطور که کدریویو‌کردن کار حوصله‌سربرتریه تا کد زدن، این خطر وجود داره که افراد با حضور llm در حوزه کاریشون دچار burnout و افسردگی کاری بشن. یک مقدار هم راجع به ارزش private data نوشته بود و اعتقاد داشت که با رشد llmها به زودی ارزش private data بیشتر و بیشتر می‌شه. شرکت‌ها با فهمیدن خطر llmها از دادن داده‌های خصوصی‌شون امتناع می‌کنن و از اون طرف هم داشتن یک llm با اطلاعات عمومی ارزون‌تر می‌شه و دیگه رقابت بر سر داده‌های خصوصی می‌مونه.

تیکه اخر بلاگش هم راجع به کارهایی که در پارسال کرده بوده صحبت کرده. خیلی جالبه که خودش رو از کارمندی تمام وقت آزاد کرده تا بتونه به کارهای دیگه نظیر تولید محتوا و کتاب نوشتن بپردازه. و اصلا شخصا نوشته که برای تامین هزینه‌های مالیم (مثل هزینه‌های روزمره زندگی یا هزینه‌های کلاد) بیشتر دست به قراردادهای مشاوره‌ای زده. خودش می‌گه پیشنهادهای کار تمام وقت بسیاری داره اما از اون جایی که براش مهمه که مستقل بمونه ترجیح می‌ده کارمند تمام وقت نشه. (این آقا سباستین نویسنده کتاب Build A Large Language Model (From Scratch) هست که کتاب معروفیه).


لینک بلاگ‌ آقای Sebastian Raschka
https://magazine.sebastianraschka.com/p/state-of-llms-2025
بلاگ دوم اما از آقای Simon Willson هست که گسترده تر نوشته و چون آندره‌‌آآقا جان کارپثی ریتوییتش کرده بود خوندمش. این هم تقریبا ۷۰ درصد مطالبش شبیه به بلاگ Raschka بود: RLVR و Tool Call و رشد چینی‌ها و از این قبیل چیزها. با این وجود اما سه مطلب درش بود که نتونستم بازنشرشون نکنم:

۱- میگه که در سالی که گذشت این YOLO کردن ایجنت‌ها (یعنی این که بهشون این دسترسی رو بدی که برای هر کاری کردن نیازی به گرفتن اجازه ازت نباشه)، رایج شد. و پدیده‌ای که داره رخ می‌ده اینه که مردم دارن به این دسترسی دادن به ایجنت‌ها عادت می‌کنند و یک روزی گند این درمیاد. یک مفهوم جامعه‌شناختی مرتبط با این هم هست به نام Normalization of Deviance که این جوریه:
where repeated exposure to risky behaviour without negative consequences leads people and organizations to accept that risky behaviour as normal

۲- این برادر سیمون پارسال یک بنچمارک فان برای خودش تعریف کرده: مدل بتونه با خروجی متنی، یک فایل SVG از پلیکان دوچرخه‌سوار بسازه. این کار خیلی سخته چون که هم دوچرخه از نظر هندسی سخته و هم پلیکان بد شکل و چغره و از اون طرف هم قطعا داده آموزشی از پلیکان در حال دوچرخه‌سواری اون هم با SVG وجود نداره. حالا نکته‌ای که هست دیده که این بنچمارک مسخره‌ای که تعریف کرده با عملکرد مدل‌ها در تسک‌های دیگه کوریلیشن داره و هر چه یک مدلی بهتر باشه بهتر می‌تونه این تصویر رو تولید کنه. از اونور هم بنچمارکش تبدیل به میم شده و حتی شرکت‌هایی مثل گوگل و انتروپیک گاها عملکرد مدل‌هاشون رو روی این بنچمارک پلیکان دوچرخه‌سوار نمایش دادند.

۳- یک حدسی زده که MCP امسال با این که درخشید اما آخرین سالی هم بوده که درخشیده. چون که ایجنت‌هایی که قادرند از ابزارهایی مثل bash به خوبی استفاده کنند دیگه نیازی به MCP شاید نداشته باشند.

۴- این نکته‌اش رو خیلی خوشم اومد: می‌گه که prompt injection و jailbreaking بسیار در سال گذشته خطرناک شدند و مردم به خوبی جدی نمی‌گیرند ابعاد مختلف این خطر رو. چون که در عین این که فکر می‌کنند معنی jailbreaking رو می‌دونند با ابعاد و زوایای پنهان این پدیده آشکار نیستند. خودش کاری که کرده اومده یک واژه به نام lethal trifecta ساخته که تعریف کامل تری از ابعاد خطرات گول زدن هوش مصنوعیه. نکته‌اش اینه که می‌گه وقتی یک واژه جدید و سخت تعریف کنید مردم دیگه فکر نمی‌کنند معنی واژه رو می‌دونن بلکه مجبور می‌شن برن بخونن تا بفهمن دقیقا چیه.

۵- در سالی که گذشت مفهوم داشتن تست برای ما پررنگ تر‌شد. در واقع مدل‌ها بدون تست‌ها صرفا یک پیاده‌سازی نصفه نیمه انجام می‌دن که ممکنه حالت‌های مرزی رو پوشش نده. چیزی که مهمه اینه که مجموعه تستی داشته باشیم تا مدل بتونه به خوبی از درستی کاری که کرده مطمئن بشه.

۶- و در نهایت راجع به پدیده ای به نام slop صحبت می‌کنه. می‌گه که اینترنت همینجوری همیشه پر از مطالب الکی و بیخود و مزخرف بود حالا اما با اومدن AI این مطالب خیلی خیلی بیشتر شدند. مثالش این ویدیوهای فیکی که از نجات حیوانات در اینستا ترند شده.


لینک بلاگ:
https://simonwillison.net/2025/Dec/31/the-year-in-llms
مو مونده بی‌کس

خداوندا به فریاد دلم رس
کس بی کس تویی مو مانده بی‌کس

همه گویند طاهر کس نداره
خدا یار موئه چه حاجت کس

باباطاهر