آفریدن مردمی را بهر گور اندر عذاب
این شعر تند از میرزاده عشقی، گاهی اوقات بسیار به منظوری که آدم میخواد بیان کنه نزدیکه:
خلقت من در جهان یک وصله ناجور بود
من که خود راضی به این خلقت نبودم زور بود؟
خلق از من در عذاب و من خود از اخلاق خویش
از عذاب خلق و من، یارب چه ات منظور بود؟
حاصلی ای دهر، از من، غیر شر و شور نیست
مقصدت از خلقت من، سیر شر و شور بود؟
ذات من معلوم بودت نیست مرغوب از چه ام:
آفریدستی؟ زبانم لال، چشمت کور بود؟
ای چه خوش بود، چشم می پوشیدی از تکوین من
فرض می کردی که ناقص: خلقت یک مور بود؟
ای طبیعت گر نبودم من، جهانت نقص داشت
ای فلک گر من نمی زادی، اجاقت کور بود؟
قصد تو از خلق عشقی، من یقین دارم فقط:
دیدن هر روز یک گون، رنج جوراجور بود
گر نبودی تابش استاره من در سپهر
تیر و بهرام و خور و کیوان و مه بی نور بود؟
گر بدم من در عدم، استاره عورت نبود
آسمانت خالی از استارگان عور بود؟
راست گویم نیست جز این علت تکوین من
قالبی لازم، برای ساخت یک گور بود
آفریدن مردمی را بهر گور اندر عذاب
گر خدائی هست، ز انصاف خدائی دور بود
مقصد زارع، ز کشت و زرع، مشتی غله است
مقصد تو زآفرینش، مبلغی قاذور بود
گر من اندر جای تو، بودم امیر کائنات
هر کسی از بهر کار بهتری مأمور بود؟!
آن که نتواند به نیکی، پاس هر مخلوق داد:
از چه کرد این آفرینش را؟ مگر مجبور بود!
این شعر تند از میرزاده عشقی، گاهی اوقات بسیار به منظوری که آدم میخواد بیان کنه نزدیکه:
خلقت من در جهان یک وصله ناجور بود
من که خود راضی به این خلقت نبودم زور بود؟
خلق از من در عذاب و من خود از اخلاق خویش
از عذاب خلق و من، یارب چه ات منظور بود؟
حاصلی ای دهر، از من، غیر شر و شور نیست
مقصدت از خلقت من، سیر شر و شور بود؟
ذات من معلوم بودت نیست مرغوب از چه ام:
آفریدستی؟ زبانم لال، چشمت کور بود؟
ای چه خوش بود، چشم می پوشیدی از تکوین من
فرض می کردی که ناقص: خلقت یک مور بود؟
ای طبیعت گر نبودم من، جهانت نقص داشت
ای فلک گر من نمی زادی، اجاقت کور بود؟
قصد تو از خلق عشقی، من یقین دارم فقط:
دیدن هر روز یک گون، رنج جوراجور بود
گر نبودی تابش استاره من در سپهر
تیر و بهرام و خور و کیوان و مه بی نور بود؟
گر بدم من در عدم، استاره عورت نبود
آسمانت خالی از استارگان عور بود؟
راست گویم نیست جز این علت تکوین من
قالبی لازم، برای ساخت یک گور بود
آفریدن مردمی را بهر گور اندر عذاب
گر خدائی هست، ز انصاف خدائی دور بود
مقصد زارع، ز کشت و زرع، مشتی غله است
مقصد تو زآفرینش، مبلغی قاذور بود
گر من اندر جای تو، بودم امیر کائنات
هر کسی از بهر کار بهتری مأمور بود؟!
آن که نتواند به نیکی، پاس هر مخلوق داد:
از چه کرد این آفرینش را؟ مگر مجبور بود!
اندر افتضاحات تقویم گریگوری
مقدار زمانی که طول میکشه تا زمین یک دور حول خورشید بچرخه، ۳۶۵ روز و ۵ ساعت و ۴۸ دقیقه و ۴۵ ثانیه است. اون چند ساعت اضافه بر ۳۶۵ روز باعث میشه تا تقویمهای خورشیدی مجبور باشند که هر ۴ سال یک روز اضافه کبیسه در نظر بگیرند تا تقویم خراب نشه. اون روزی که قراره اضافه بشه که در تقویم میلادی ۲۹ فوریه و در تقویم هجری ۳۰ اسفند هستند با هم فاصله دارند. مثلا کبیسه میلادیها ۲۸ فوریه ۲۰۲۴ اضافه شده و کبیسه ما ۳۰ اسفند ۱۴۰۳، برای همین تاریخهایی که بین این دو قرار دارند (بین اسفند ۱۴۰۲ مثلا تا فروردین ۱۴۰۴) اینها از همخوانی میافتند. برای مثال تولد بنده ۱۱ اردیبهشت یا ۱ می هست، منتها در این حدفاصلهای کبیسه ۱۱ اردیبشهت میافته به ۳۰ آوریل. برای همین آنچه من و احتمالا شما در زندگیتون تجربه کردین این بوده که سه سال تاریخ تولدتون به میلادی یک چیز بوده و یک سال چیز دیگه. اما این پایان ماجرا نیست ....
سال دقیقا ۳۶۵ روز و ۶ ساعت نیست و بلکه ۳۶۵ روز و ۵ ساعت و ۴۸ دقیقه و ... هستش. وقتش شما اتومات هر ۴ سال رو کبیسه میگیرید انگار دارید از اون ۱۲ دقیقه چشمپوشی میکنید. اجداد ما و اروپاییها این موضوع رو چند صد سال قبل فهمیدند. در واقع اونها میدونستند که یک سال ۳۶۵ روز و حدود ۶ ساعته ولی اون مقدار اضافیترش نمیدونستند چه قدره (در واقع برای فهمیدن لحظه اعتدال بهاری گویا روشی وجود داره). اروپاییها در حدود سال ۱۵۸۲ دیدند که اعتدال بهاریشون ده روز جا به جا شده و افتاده به ۱۱ مارس و انگار که یک خردهای در اون ۶ ساعت هست و برای همین کبیسهشون درست کار نمیکنه. این جا یک آقایی اومد پیشنهاد جدیدی برای محاسبه کبیسه داد، به این صورت که هر سالی که مضرب ۴ هست کبیسه باشه ولی اون سالهایی که مضرب صد هستند کبیسه نباشه مگر این که مضرب ۴۰۰ باشند. اینجوری انگار به نحوی کبیسهها رو کاهش دادند. فرض کنید مثلا از سال ۲۰۹۶ کبیسه دیگه نخواهیم داشت تا ۲۱۰۴. این ابتکار رو که به خرج دادن اسم نسخه جدید تقویمشون رو گذاشتند گریگوری. یک کار دیگهای هم که کردن این بود که برای این که مشکل اون شیفت زمانی رو حل کنند، ده روز رو از تقویم حذف کردند و روز بعد از ۴ اکتبر ۱۵۸۲ رو ۱۵ اکتبر در نظر گرفتند !!!!!!!!!!!!!!!!!!!!!!!!! ابتکار اینها در کبیسهگیری باعث کمتر شدن خطا شد ولی همچنان دقیق نیست، به طوری که تقویم گریگوری هر ۳۳۲۰ سال، یک روز خطا داره.
اما برگردیم سمت هجری شمسی ببینیم اونها چه کردند. ایرانیها هم به همون طریق همون ۴ سال یکبار کبیسه میگرفتند و در زمان ملکشاه سلجوقی به این مشکل خوردند که دیدند اول فروردین در زمستون واقع شده. در این جا خیام ماموریت پیدا کرد مشکل رو حل کنه. خیام هم رفت و میزان زمان دقیق گردش زمین به دور خورشید رو تا چند رقم اعشار به درستی حساب کرد (چند رقم بیشتر هم محاسبه کرد که بعد مشخص شد غلط بوده و تقصیر خیام هم نبوده چون گویا میزان زمان گردش زمین به دور خورشید ثابت نیست) (ریسرچ واقعی به این میگن یک مشکل بزرگ رو حل کرده). حالا که میزان دقیق سال رو داشتند باید مکانیزم کبیسه رو درست میکردند. سوال کبیسه اینه که آیا روز بعد از ۲۹ اسفند، ۳۰ اسفند هست یا خیر؟ برای این پرسش، یک راه حل ساده وجود داره. اول حساب میکنند میبینند که لحظه تحویل سال کی میافته. اگر لحظه تحویل سال در روز ۲۹ اسفند واقع شده بود که روز بعدی ۱ فروردین میشه. اما اگر لحظه تحویل سال، روز بعد از ۲۹ اسفند واقع شده بود اون وقت دو حالت پیش میاد. اگر لحظه تحویل سال قبل از ساعت ۱۲ ظهر اون روز باشه، اون روز ۱ فروردینه و اگر لحظه تحویل سال بعد از ساعت ۱۲ ظهر باشه اون روز ۳۰ اسفنده. به همین راحتی. در ضمن میزان خطای تقویم جلالی ۱ روز در هر ۱۱۶۵۲۹ ساله!
حالا اگر دقت کنید به خاطر همون ۱۲ دقیقه کمتری که نسبت به ۶ ساعت داریم، لحظه تحویل سال هر چهار سال معمولا قدر ۴۵ دقیقه عقب میاد. مثلا چهار سال پیش حدود ۱۳:۱۵ ۳۰ اسفند بود و امسال ۱۲:۳۰ ۳۰ اسفند هست و گس وات؟ ۴ سال بعد لحظه تحویل سال حدود ۱۱:۴۵ اینا است و اون روز دیگه ۳۰ اسفند نیست و ۱ فروردینه :) در واقع ما با یک کبیسه ۵ ساله مواجه میشیم و عوض این که ۱۴۰۷ کبیسه باشه، ۱۴۰۸ کبیسه میشه. و گس وات؟ رابطه بین تقویم جلالی و گریگوری هم به هم میریزه. مثلا برای ۱۱ اردیبهشت، ۲ سال میشه ۱ می و ۲ سال میشه ۳۰ آوریل! اوضاع حالا جالبتر هم میشه، رابطه تقویم گریگوری و جلالی پیچیده میشه به خاطر عدم تطابقشون و در آینده نه چندان دور ۱۱ اردیبهشت یا ۱ می میشه یا ۲ می! خلاصه که علت این تفاوت اینه که در تقویم جلالی برای ما لحظه تحویل سال مهمه و بقیه چیزها رو روی اون سوار میکنیم ولی در تقویم گریگوری چون لحظه تحویل سال وجود نداره از خودشون دست به ابداع کبیسه زدند و خطاشون بیشتر از ماست.
مقدار زمانی که طول میکشه تا زمین یک دور حول خورشید بچرخه، ۳۶۵ روز و ۵ ساعت و ۴۸ دقیقه و ۴۵ ثانیه است. اون چند ساعت اضافه بر ۳۶۵ روز باعث میشه تا تقویمهای خورشیدی مجبور باشند که هر ۴ سال یک روز اضافه کبیسه در نظر بگیرند تا تقویم خراب نشه. اون روزی که قراره اضافه بشه که در تقویم میلادی ۲۹ فوریه و در تقویم هجری ۳۰ اسفند هستند با هم فاصله دارند. مثلا کبیسه میلادیها ۲۸ فوریه ۲۰۲۴ اضافه شده و کبیسه ما ۳۰ اسفند ۱۴۰۳، برای همین تاریخهایی که بین این دو قرار دارند (بین اسفند ۱۴۰۲ مثلا تا فروردین ۱۴۰۴) اینها از همخوانی میافتند. برای مثال تولد بنده ۱۱ اردیبهشت یا ۱ می هست، منتها در این حدفاصلهای کبیسه ۱۱ اردیبشهت میافته به ۳۰ آوریل. برای همین آنچه من و احتمالا شما در زندگیتون تجربه کردین این بوده که سه سال تاریخ تولدتون به میلادی یک چیز بوده و یک سال چیز دیگه. اما این پایان ماجرا نیست ....
سال دقیقا ۳۶۵ روز و ۶ ساعت نیست و بلکه ۳۶۵ روز و ۵ ساعت و ۴۸ دقیقه و ... هستش. وقتش شما اتومات هر ۴ سال رو کبیسه میگیرید انگار دارید از اون ۱۲ دقیقه چشمپوشی میکنید. اجداد ما و اروپاییها این موضوع رو چند صد سال قبل فهمیدند. در واقع اونها میدونستند که یک سال ۳۶۵ روز و حدود ۶ ساعته ولی اون مقدار اضافیترش نمیدونستند چه قدره (در واقع برای فهمیدن لحظه اعتدال بهاری گویا روشی وجود داره). اروپاییها در حدود سال ۱۵۸۲ دیدند که اعتدال بهاریشون ده روز جا به جا شده و افتاده به ۱۱ مارس و انگار که یک خردهای در اون ۶ ساعت هست و برای همین کبیسهشون درست کار نمیکنه. این جا یک آقایی اومد پیشنهاد جدیدی برای محاسبه کبیسه داد، به این صورت که هر سالی که مضرب ۴ هست کبیسه باشه ولی اون سالهایی که مضرب صد هستند کبیسه نباشه مگر این که مضرب ۴۰۰ باشند. اینجوری انگار به نحوی کبیسهها رو کاهش دادند. فرض کنید مثلا از سال ۲۰۹۶ کبیسه دیگه نخواهیم داشت تا ۲۱۰۴. این ابتکار رو که به خرج دادن اسم نسخه جدید تقویمشون رو گذاشتند گریگوری. یک کار دیگهای هم که کردن این بود که برای این که مشکل اون شیفت زمانی رو حل کنند، ده روز رو از تقویم حذف کردند و روز بعد از ۴ اکتبر ۱۵۸۲ رو ۱۵ اکتبر در نظر گرفتند !!!!!!!!!!!!!!!!!!!!!!!!! ابتکار اینها در کبیسهگیری باعث کمتر شدن خطا شد ولی همچنان دقیق نیست، به طوری که تقویم گریگوری هر ۳۳۲۰ سال، یک روز خطا داره.
اما برگردیم سمت هجری شمسی ببینیم اونها چه کردند. ایرانیها هم به همون طریق همون ۴ سال یکبار کبیسه میگرفتند و در زمان ملکشاه سلجوقی به این مشکل خوردند که دیدند اول فروردین در زمستون واقع شده. در این جا خیام ماموریت پیدا کرد مشکل رو حل کنه. خیام هم رفت و میزان زمان دقیق گردش زمین به دور خورشید رو تا چند رقم اعشار به درستی حساب کرد (چند رقم بیشتر هم محاسبه کرد که بعد مشخص شد غلط بوده و تقصیر خیام هم نبوده چون گویا میزان زمان گردش زمین به دور خورشید ثابت نیست) (ریسرچ واقعی به این میگن یک مشکل بزرگ رو حل کرده). حالا که میزان دقیق سال رو داشتند باید مکانیزم کبیسه رو درست میکردند. سوال کبیسه اینه که آیا روز بعد از ۲۹ اسفند، ۳۰ اسفند هست یا خیر؟ برای این پرسش، یک راه حل ساده وجود داره. اول حساب میکنند میبینند که لحظه تحویل سال کی میافته. اگر لحظه تحویل سال در روز ۲۹ اسفند واقع شده بود که روز بعدی ۱ فروردین میشه. اما اگر لحظه تحویل سال، روز بعد از ۲۹ اسفند واقع شده بود اون وقت دو حالت پیش میاد. اگر لحظه تحویل سال قبل از ساعت ۱۲ ظهر اون روز باشه، اون روز ۱ فروردینه و اگر لحظه تحویل سال بعد از ساعت ۱۲ ظهر باشه اون روز ۳۰ اسفنده. به همین راحتی. در ضمن میزان خطای تقویم جلالی ۱ روز در هر ۱۱۶۵۲۹ ساله!
حالا اگر دقت کنید به خاطر همون ۱۲ دقیقه کمتری که نسبت به ۶ ساعت داریم، لحظه تحویل سال هر چهار سال معمولا قدر ۴۵ دقیقه عقب میاد. مثلا چهار سال پیش حدود ۱۳:۱۵ ۳۰ اسفند بود و امسال ۱۲:۳۰ ۳۰ اسفند هست و گس وات؟ ۴ سال بعد لحظه تحویل سال حدود ۱۱:۴۵ اینا است و اون روز دیگه ۳۰ اسفند نیست و ۱ فروردینه :) در واقع ما با یک کبیسه ۵ ساله مواجه میشیم و عوض این که ۱۴۰۷ کبیسه باشه، ۱۴۰۸ کبیسه میشه. و گس وات؟ رابطه بین تقویم جلالی و گریگوری هم به هم میریزه. مثلا برای ۱۱ اردیبهشت، ۲ سال میشه ۱ می و ۲ سال میشه ۳۰ آوریل! اوضاع حالا جالبتر هم میشه، رابطه تقویم گریگوری و جلالی پیچیده میشه به خاطر عدم تطابقشون و در آینده نه چندان دور ۱۱ اردیبهشت یا ۱ می میشه یا ۲ می! خلاصه که علت این تفاوت اینه که در تقویم جلالی برای ما لحظه تحویل سال مهمه و بقیه چیزها رو روی اون سوار میکنیم ولی در تقویم گریگوری چون لحظه تحویل سال وجود نداره از خودشون دست به ابداع کبیسه زدند و خطاشون بیشتر از ماست.
تفاوت ایمان ساحران با بنیاسرائیل
آقای جوادی آملی یک تعبیر جالبی در موضوع رابطه ایمان و عقل و علم داره. میگه که موسی وقتی معجزاتش مثل تبدیل عصا به اژدها رو انجام میداد بنیاسرائیل صرفا از روی حس و سطحی مساله رو تماشا کردند و بدون تعقل و آگاهی از حقیقت معجزه، ایمان آوردند. در واقع ایمانشان بر پایه تجربه حسی بود و سامری هم روی همین قضیه سوار شد و جلوتر وقتی که یک گوساله طلایی براشون رو کرد که صدا تولید میکرد، از دین موسی برگشتند و شروع به پرستیدن گوساله کردند. در حالی که در طرف مقابل، در جریان رقابت موسی و ساحران فرعون، ساحران هنگامی که معجزه موسی رو مشاهده کردند، چون تفاوت میان سحر و معجزه را به درستی درک میکردند، نه تنها ایمان آوردند، بلکه به گونهای راستخ ایمان آوردند که حتی حاضر شدند به فجیعترین شکل کشته شوند. در واقع چه بسا اگر اون ساجرها زنده میموندند و با موسی همراه میشدند، مثل باقی بنیاسرائیل فریب گوساله سامری رو نمیخوردند. حالا تصویر کلی هم همینه، چه بسا خیلیها مثل خود بنده از روی ظاهر اعتقادی داشته باشیم و چون درک عمیقی از کنه قضیه نداریم، با یک چیز از جنس همون سطحیات جهتمون عوض بشه.
آقای جوادی آملی یک تعبیر جالبی در موضوع رابطه ایمان و عقل و علم داره. میگه که موسی وقتی معجزاتش مثل تبدیل عصا به اژدها رو انجام میداد بنیاسرائیل صرفا از روی حس و سطحی مساله رو تماشا کردند و بدون تعقل و آگاهی از حقیقت معجزه، ایمان آوردند. در واقع ایمانشان بر پایه تجربه حسی بود و سامری هم روی همین قضیه سوار شد و جلوتر وقتی که یک گوساله طلایی براشون رو کرد که صدا تولید میکرد، از دین موسی برگشتند و شروع به پرستیدن گوساله کردند. در حالی که در طرف مقابل، در جریان رقابت موسی و ساحران فرعون، ساحران هنگامی که معجزه موسی رو مشاهده کردند، چون تفاوت میان سحر و معجزه را به درستی درک میکردند، نه تنها ایمان آوردند، بلکه به گونهای راستخ ایمان آوردند که حتی حاضر شدند به فجیعترین شکل کشته شوند. در واقع چه بسا اگر اون ساجرها زنده میموندند و با موسی همراه میشدند، مثل باقی بنیاسرائیل فریب گوساله سامری رو نمیخوردند. حالا تصویر کلی هم همینه، چه بسا خیلیها مثل خود بنده از روی ظاهر اعتقادی داشته باشیم و چون درک عمیقی از کنه قضیه نداریم، با یک چیز از جنس همون سطحیات جهتمون عوض بشه.
Out of Distribution
نهضت ادامه دارد بعد از این که DeepSeek R1 نشون داد که میشه با RL با ریواردهای ساده و البته تکیه بر GRPO، مدل زبانی رو آموزش داد و تواناییهای ریزنینگیشون رو بهبود بخشید توجهات به این سمت، یعنی آموزش مدلها با RL جلب شده. حالا یک کار اومده که مدل کوچولوی…
دیپ لرنینگ در واقعیت آن چنان عمق تئوری نداره و بیشتر شبیه به لگوبازی میمونه. برای همین هر کسی میتونه با گذاشتن یک وقت معقول و بدون درگیرشدن با مفاهیم و فرمولهای پیچیده تئوری، به دیپ لرنینگ تا حد خوبی مسلط بشه و اکثر مقالات رو (که چیزی بیشتر از همین لگوبازیها نیستند) بفهمه. برای فهم بهتر این اتفاق، میشه دیپ لرنینگ رو بذاریم کنار یک علم نظری مثل فیزیک و مقایسه کنیم که چه قدر فیزیک نسبت به دیپ لرنینگ جنبههای تئوری بیشتری داره و دیپ لرنینگ چه قدر از این نظر کم عمقه. بعضیها هستند حالا مشکلی با این جنبه کمعمقی نظری ندارند و از همون جنبه لگوبازیه یا مهندسی قضیه لذت میبرند که چطور میشه حالا با این ابزاری که داریم چیزهای مختلفی بسازیم، در مقابل اینها اما یک عدهای هستند که براشون جالبه که اون مساله عمقش محدود نباشه و هر روز یک چیز جدید نظری عمیقتر باشه تا براشون مایه سوال و شگفتی باشه.
اما در عین حال، یک جنبهای از پارادایم هوش مصنوعی فعلی که توش مقداری تئوری وجود داره، RL هست. RL جاییه که دیگه همه چیز لگوبازی ساده نیست و یک اندک فرمولهایی برای اذیت کردن وجود دارند و ریزش آدمها همین جا شروع میشه :) بارها شده دیدم یک سری آدمها چه قدر خفن به نظر میرسن در حوزه دیپ لرنینگ و به راحتی تا آخرین مفاهیم و اخبار روز دیپ لرنینگ رو باهاش آشنا هستند و میتونن راجع بهشون صحبت کنند اما RL براشون شبیه یک جزیره مهآلود میمونه و وقتی سوالی حتی کلی در موردش پیش میآد پاسخی براش ندارن. در همین راستا چند وقت اخیر در اینستا و یوتیوب و توییتر زیاد محتوای از سمت فارسیزبان ها دیدم که دیپسیک رو بررسی کرده بودند و بهش تاخته بودند که این که چیز جدیدی نیست و از این قسم حرفا. امروز بعد از دیدن یکی دیگه از این محتواها به این فکر افتادم که اینها اغلب احتمالا با RL آشنایی دقیقی ندارند و برای همین چیزی که تو DeepSeek R1 اتفاق افتاده رو نمیبینند. این که چطوری شبکه با RL داره آموزش میبینه، چطوری صرفا یک ریوارد نهایی و یک ریوارد ساده میانی رول بیسد داره و این که چطور GRPO این وسط جواب میده از جمله همین نکاته. برای مثال اگر توییتر کامیونیتی هوش مصنوعی رو نگاه کنید (بر خلاف محتواهای داخلی که میگن دیپ سیک نوآوری نداره) یک ترندی در این چند وقت راه افتاده که ملت سعی میکنند ببینید چطور میشه این رویکرد آموزش با RL رو به مسائل دیگه و با تکنیکهای غیر از GRPO تعمیم داد.
پینوشت: البته واقعیتش RL هم آن چنان پیچیدگی نداره، در مقابل فیزیک و ریاضی همه مسائل ما متاسفانه در حکم خالهبازی اند.
اما در عین حال، یک جنبهای از پارادایم هوش مصنوعی فعلی که توش مقداری تئوری وجود داره، RL هست. RL جاییه که دیگه همه چیز لگوبازی ساده نیست و یک اندک فرمولهایی برای اذیت کردن وجود دارند و ریزش آدمها همین جا شروع میشه :) بارها شده دیدم یک سری آدمها چه قدر خفن به نظر میرسن در حوزه دیپ لرنینگ و به راحتی تا آخرین مفاهیم و اخبار روز دیپ لرنینگ رو باهاش آشنا هستند و میتونن راجع بهشون صحبت کنند اما RL براشون شبیه یک جزیره مهآلود میمونه و وقتی سوالی حتی کلی در موردش پیش میآد پاسخی براش ندارن. در همین راستا چند وقت اخیر در اینستا و یوتیوب و توییتر زیاد محتوای از سمت فارسیزبان ها دیدم که دیپسیک رو بررسی کرده بودند و بهش تاخته بودند که این که چیز جدیدی نیست و از این قسم حرفا. امروز بعد از دیدن یکی دیگه از این محتواها به این فکر افتادم که اینها اغلب احتمالا با RL آشنایی دقیقی ندارند و برای همین چیزی که تو DeepSeek R1 اتفاق افتاده رو نمیبینند. این که چطوری شبکه با RL داره آموزش میبینه، چطوری صرفا یک ریوارد نهایی و یک ریوارد ساده میانی رول بیسد داره و این که چطور GRPO این وسط جواب میده از جمله همین نکاته. برای مثال اگر توییتر کامیونیتی هوش مصنوعی رو نگاه کنید (بر خلاف محتواهای داخلی که میگن دیپ سیک نوآوری نداره) یک ترندی در این چند وقت راه افتاده که ملت سعی میکنند ببینید چطور میشه این رویکرد آموزش با RL رو به مسائل دیگه و با تکنیکهای غیر از GRPO تعمیم داد.
پینوشت: البته واقعیتش RL هم آن چنان پیچیدگی نداره، در مقابل فیزیک و ریاضی همه مسائل ما متاسفانه در حکم خالهبازی اند.
تعطیلات عید فقط اونجاییش که نه میدونی چند شنبه است و نه حتی مهمه برات که امروز چند شنبه است. اوج رهایی از زمان و تحقق زندگی در لحظه
Out of Distribution
فرانسوا شله، طی توییتی گفته که قصد دارند نسخه دوم ARC رو در فوریه منتشر کنند. همچنین گفته که در حال کار روی بنچمارک AGIای هستند که فورمتش کاملا با ARC فعلی فرق داره. برام جالبه ببینم مساله جدیدی که میخواد مطرح کنه باز هم در قالب program synthesis میگنجه…
ریزنینگ زنده است، چون ARC زنده است
سرانجام ساعاتی پیش ARC-2 رو رونمایی کردند. تسکها به نظر کامپوزیشنالتر شدند یعنی با ruleهایی مواجهیم که هم خودشون ترکیب چند تا rule پایه هستند و هم خیلی به context وابستهاند.
جایزه رو هم بردن روی ۷۰۰ هزار دلار. به شرطی که دقت بالای ۸۵ درصد گرفته بشه، این در حالیه که عملکرد o3 رو این بنچمارک ۵ درصده
لینک:
https://arcprize.org/
سرانجام ساعاتی پیش ARC-2 رو رونمایی کردند. تسکها به نظر کامپوزیشنالتر شدند یعنی با ruleهایی مواجهیم که هم خودشون ترکیب چند تا rule پایه هستند و هم خیلی به context وابستهاند.
جایزه رو هم بردن روی ۷۰۰ هزار دلار. به شرطی که دقت بالای ۸۵ درصد گرفته بشه، این در حالیه که عملکرد o3 رو این بنچمارک ۵ درصده
لینک:
https://arcprize.org/
Out of Distribution
دیشب بیحوصله بودم و دوباره مقداری ور رفتم. تصاویر به نظر خودم قشنگ اند ولی وقتی مقایسه میکنم میبینم که حسی که از کشیدن یک دایره و رنگ کردنش میگیرم خیلی متفاوتتره تا این که یک پرامپت میدم به هوش مصنوعی و برام تصویر تولید میکنه. شاید هنر صرفا اون outcome…
امروز دیدم یک مدل متن به تصویر جدیدی به نام reve اومده و خیلی ازش تعریف شده. من هم دیگه به عادت مالوف و از روی فان و تفریح مقداری باهاش ور رفتم نتایج این شد که میبینید. نکتهای که در توییتر هم خیلی مورد بحث بود توانایی عالی reve در خروجیدادن درست و صحیح متن هستش که جالبه.
لینک:
reve.art
لینک:
reve.art
Out of Distribution
راجع به ردهبندی الو و LMSYS Chatbot Arena و Gemini و اینها گوگل پس از چندی خفت و خواری در زمینه LLMها، سرانجام هفته پیش یک اتفاق مهم، یک اتفاق شاد رو تجربه کرد. اون اتفاق هم این بود که مدل Gemini-1.5-Pro سرانجام تونست صدرنشین بنچمارک LMSYS بشه و بالاتر…
Google
Gemini 2.5: Our most intelligent AI model
Gemini 2.5 is our most intelligent AI model, now with thinking.
هشت ماه از این پست میگذره و نبرد ادامه داره و امروز Gemini 2.5 این بار با حاشیه قابل توجه دوباره صدرنشین شد. تا همین چند وقت پیش یادمه که گوگل به شدت از رقابت LLMها عقب بود و حتی برخی تصور میکردند که بلایی که گوگل سر یاهو آورد این بار openai سر خودش میاره اما گوگل دلاور بازگشت خوبی رو تا اینجا به رقابت داشته. عملکردشون در این چند وقت و مخصوصا از Gemini 1.5 به بعد جذاب بوده.
لینک:
https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking
پینوشت: از این که سرعت رشد و رقابت بین اینها این قدر بالاست و سرعت رشد من نسبت به اینها صفره و اصلا ما جایی از این بازی نیستیم، افسردهام. یارب چقدر فاصلهی دست و زبان است
لینک:
https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking
پینوشت: از این که سرعت رشد و رقابت بین اینها این قدر بالاست و سرعت رشد من نسبت به اینها صفره و اصلا ما جایی از این بازی نیستیم، افسردهام. یارب چقدر فاصلهی دست و زبان است
ارومیه، تار مویی میان پانترک و پانکرد
ارومیه و کلا آذربایجان غربی موقعیت قابل تاملی دارند. منطقهای که ترکیبی از اقوام آذری و کرد و اقلیتی ارمنی هست. از طرفی بین سه منطقه خارجی قفقاز، کردستان و ترکیه قرار گرفته. این ویژگی جغرافیای و قومیتی خاص، این منطقه رو مستعد درگیریهای شدید کرده. اتفاقاتی که در این هفته در ارومیه افتاد نسبت به اتفاقات بعد از جنگ جهانی اول هیچ بود. در جنگ جهانی اول و در شرایط فلج بودن دولت مرکزی ایران، ارومیه تبدیل به محل نزاع بین عثمانی و روسیه و ارمنیها در پی تشکیل کشور مستقل و کردها شد و بسیاری فجایع قتل و غارت درش رخ داد. درگیری قومیتی و تمایلات جدایی طلبانه در ایران چیز غیرعادی نیستند ولی اون چیزی که داستان ارومیه رو نسبت به بقیه جاهای ایران متمایزتر میکنه، اینه که اگر در بقیه جغرافیای مرزی ایران بین دو گروه دعوای قومیتی هست معمولا اونجاها یک گروه از گروه دیگه داخلیتر محسوب میشه و صرفا یک گروه تمایلات جدایی طلبانه داره ولی در ارومیه در بدترین حالت میشه شاهد حضور همزمان تمایلات جدایی طلبی پان ترکی و پان کردی بود. جایی که به علت نزدیک به مناطق مختلف خارجی می تونه اتش بحران رو شعلهورتر کنه.
گذشته از شرایط جمعیتی و جغرافیایی، دعواهای قومیتی خطیر هستند. فرض کنید روزی در خیابون با کسی دعواتون میشه و مثلا سر شما در اثنای دعوا میشکنه. شما احتمالا خاطره دعوا و آسیب براتون میمونه اما این خاطره به شما جهت دهی نمیده. حالا فرض کنید در خیابون با یکی دعواتون میشه و از روی ظاهر یا لهجه طرف، قومیت یا صنفش رو میشناسید. احتمالا تا عمر دارید وقتی شخص دیگه ای رو از اون قومیت یا صنف ببینید براتون اون خاطره ناگوار و حس خطر و بی اعتمادی تداعی میشه. و این نسل اندار نسل ممکنه انتقال پیدا کنه بچه شما هم میبینه و این حس منفیاش رو به نسل بعدی منتقل میکنه. و اصلا حتی شاید شما هم اون واقعه دعوا و آسیب رو تجربه نکنید و صرفا بشنیود یکی از یک قومیتی یکی از قومیت شما رو آسیب زده. بدون این که فکر کنید که مقصر چه کسی بوده این حس ترس و ناامنی در خودآگاه یا ناخودآگاه شما شکل میگیره. این چرخه باطل شکسته نمیشه مگر این که آدمها به قدری با هم در ارتباط باشند و آدمهای مختلفی از قومیتهای مختلف رو تجربه کنند تا اون حس تمایزشون کمرنگتر بشه و اشتراکات دیگهای پررنگ بشن. فرض کنید مثلا در دنیایی میگن علیآبادیها آدمهای خشنی هستند و اگر شما در زندگیتون با ده تا علی آبادی درست دوست بوده باشید اگر حتی یک علی آبادی خشنی ببینید در ذهنتون تعمیم پیدا نمیکنه.
به هر صورت تفاوتهای قومیتی با یک جرقه میتونن منجر به یک انفجار بشن. اتفاقی که این هفته در ارومیه بین ترک ها و کردها افتاد قابلیت این که به جاهای بدتری بکشه رو داشت و خدا رو شکر زود خاتمه پیدا کرد. ما در کشوری زندگی میکنیم که گروههای مختلف از نظر قومیتی، زبانی، فرهنگی، مذهب و صنفی با هم تفاوت دارند. هر جرقه در گروهی اگر بخواد پاسخ گروهی از سمت دیگه رو داشته باشه منجر به انفجار میشه. سیاست بهینه در این بین باید برقراری مماشات گروههای مختلف با هم و همچنین جلوگیری از تحرکات گروهی در راستای واگرایی باشه. در واقع مرز رفتاری در رفتار درست با چنین مقولهای برای قدرت مرکزی بسیار ظریف و باریکه. تلاش برای دخالت و پذیرفتن تمایزات در عین این که واگرایی بیشتری ایجاد نشه خیلی حرکت ظریف و خطرناکیه
ارومیه و کلا آذربایجان غربی موقعیت قابل تاملی دارند. منطقهای که ترکیبی از اقوام آذری و کرد و اقلیتی ارمنی هست. از طرفی بین سه منطقه خارجی قفقاز، کردستان و ترکیه قرار گرفته. این ویژگی جغرافیای و قومیتی خاص، این منطقه رو مستعد درگیریهای شدید کرده. اتفاقاتی که در این هفته در ارومیه افتاد نسبت به اتفاقات بعد از جنگ جهانی اول هیچ بود. در جنگ جهانی اول و در شرایط فلج بودن دولت مرکزی ایران، ارومیه تبدیل به محل نزاع بین عثمانی و روسیه و ارمنیها در پی تشکیل کشور مستقل و کردها شد و بسیاری فجایع قتل و غارت درش رخ داد. درگیری قومیتی و تمایلات جدایی طلبانه در ایران چیز غیرعادی نیستند ولی اون چیزی که داستان ارومیه رو نسبت به بقیه جاهای ایران متمایزتر میکنه، اینه که اگر در بقیه جغرافیای مرزی ایران بین دو گروه دعوای قومیتی هست معمولا اونجاها یک گروه از گروه دیگه داخلیتر محسوب میشه و صرفا یک گروه تمایلات جدایی طلبانه داره ولی در ارومیه در بدترین حالت میشه شاهد حضور همزمان تمایلات جدایی طلبی پان ترکی و پان کردی بود. جایی که به علت نزدیک به مناطق مختلف خارجی می تونه اتش بحران رو شعلهورتر کنه.
گذشته از شرایط جمعیتی و جغرافیایی، دعواهای قومیتی خطیر هستند. فرض کنید روزی در خیابون با کسی دعواتون میشه و مثلا سر شما در اثنای دعوا میشکنه. شما احتمالا خاطره دعوا و آسیب براتون میمونه اما این خاطره به شما جهت دهی نمیده. حالا فرض کنید در خیابون با یکی دعواتون میشه و از روی ظاهر یا لهجه طرف، قومیت یا صنفش رو میشناسید. احتمالا تا عمر دارید وقتی شخص دیگه ای رو از اون قومیت یا صنف ببینید براتون اون خاطره ناگوار و حس خطر و بی اعتمادی تداعی میشه. و این نسل اندار نسل ممکنه انتقال پیدا کنه بچه شما هم میبینه و این حس منفیاش رو به نسل بعدی منتقل میکنه. و اصلا حتی شاید شما هم اون واقعه دعوا و آسیب رو تجربه نکنید و صرفا بشنیود یکی از یک قومیتی یکی از قومیت شما رو آسیب زده. بدون این که فکر کنید که مقصر چه کسی بوده این حس ترس و ناامنی در خودآگاه یا ناخودآگاه شما شکل میگیره. این چرخه باطل شکسته نمیشه مگر این که آدمها به قدری با هم در ارتباط باشند و آدمهای مختلفی از قومیتهای مختلف رو تجربه کنند تا اون حس تمایزشون کمرنگتر بشه و اشتراکات دیگهای پررنگ بشن. فرض کنید مثلا در دنیایی میگن علیآبادیها آدمهای خشنی هستند و اگر شما در زندگیتون با ده تا علی آبادی درست دوست بوده باشید اگر حتی یک علی آبادی خشنی ببینید در ذهنتون تعمیم پیدا نمیکنه.
به هر صورت تفاوتهای قومیتی با یک جرقه میتونن منجر به یک انفجار بشن. اتفاقی که این هفته در ارومیه بین ترک ها و کردها افتاد قابلیت این که به جاهای بدتری بکشه رو داشت و خدا رو شکر زود خاتمه پیدا کرد. ما در کشوری زندگی میکنیم که گروههای مختلف از نظر قومیتی، زبانی، فرهنگی، مذهب و صنفی با هم تفاوت دارند. هر جرقه در گروهی اگر بخواد پاسخ گروهی از سمت دیگه رو داشته باشه منجر به انفجار میشه. سیاست بهینه در این بین باید برقراری مماشات گروههای مختلف با هم و همچنین جلوگیری از تحرکات گروهی در راستای واگرایی باشه. در واقع مرز رفتاری در رفتار درست با چنین مقولهای برای قدرت مرکزی بسیار ظریف و باریکه. تلاش برای دخالت و پذیرفتن تمایزات در عین این که واگرایی بیشتری ایجاد نشه خیلی حرکت ظریف و خطرناکیه