این عکس هام خیلی قشنگن. اوج نبوغ معماری و هندسه نسل های قبلی رو برای همیشه در تاریخ ثبت کردند.
❤24🔥4
این مقاله از هاروارد و MIT بدون سر و صدا به مهمترین سؤال هوش مصنوعی پاسخ میدهد که هیچکس به درستی بنچمارک نکرده(محک نزده):
آیا مدلهای زبانی بزرگ واقعاً میتوانند مطلب علمی جدیدی را کشف کنند، یا فقط در حرف زدن درباره آن خوب هستند؟
این مقاله که با عنوان «ارزیابی مدلهای زبانی بزرگ در کشف علمی» نامیده میشود و به جای پرسیدن سؤالات پیش پا افتاده و(trivia) ویا معمول از مدلها، چیزی بسیار سختتر را مورد آزمایش قرار داده :
آیا مدلها میتوانند فرضیه بسازند، آزمایش طراحی کنند، نتایج را تفسیر کنند و باورها را مانند دانشمندان واقعی بهروزرسانی کنند؟
این چیزی است که نویسندگان به شیوه متفاوتی انجام دادند 👇
• آنها مدلهای زبانی را در کل حلقه کشف ارزیابی میکنند:
فرضیه → آزمایش → مشاهده → بازنگری
• وظایف شامل زیستشناسی، شیمی و فیزیک هستند، نه پازلهای اسباببازی
• مدلها باید با دادههای ناقص، نتایج پر از نویز(اختلال) و سرنخهای غلط کار کنند
• موفقیت بر اساس پیشرفت علمی اندازهگیری میشود، نه روان بودن یا اعتماد به نفس
آنچه پیدا کردند، تکاندهنده است.
مدلهای زبانی بزرگ در پیشنهاد فرضیهها خوب هستند، اما در همه چیزهای بعدی شکنندهاند.
✓ آنها داده ها را بیش از اندازه با الگوهای سطحی مطابقت میکنند(over fit)
✓ حتی وقتی شواهد با آنها تناقض دارد، رها کردن فرضیههای بد برایشان سخت است
✓ همبستگی را با علیت اشتباه میگیرند
✓ وقتی آزمایشها شکست میخورند، توضیحات توهمی میسازند
✓ برای محتمل بودن بهینهسازی میکنند، نه پیدا کردن حقیقت
شگفتانگیزترین نتیجه:
برخی از مدلهای برتر که در آزمونهای استدلال استاندارد غالب هستند، وقتی مجبور به اجرای آزمایشهای تکراری و بهروزرسانی نظریهها شوند، کاملاً شکست میخورند.
چرا این مهم است:
علم واقعی استدلال یکباره نیست.
علم واقعی حاصل از بازخورد، شکست، بازنگری و خویشتنداری است.
مدلهای زبانی بزرگ امروز:
• مانند دانشمندان حرف میزنند
• مانند دانشمندان مینویسند
• اما هنوز مانند دانشمندان فکر نمیکنند
پیام اصلی مقاله:
هوش علمی، هوش زبانی نیست.
نیاز به حافظه، ردیابی فرضیه، استدلال علی، و توانایی گفتن «اشتباه کردم» دارد.
تا وقتی مدلها نتوانند این کار را به طور قابل اعتماد انجام دهند، ادعاها درباره «دانشمندان هوش مصنوعی» عمدتاً نابهنگام هستند.
این مقاله هوش مصنوعی را تبلیغ نمیکند. شکاف باقیمانده را تعریف میکند.
و دقیقاً به همین دلیل مهم است.
🔗 Alex Prompter
🔻پیوند به مقاله:
https://arxiv.org/abs/2512.15567
https://x.com/i/status/2001909854525624770
آیا مدلهای زبانی بزرگ واقعاً میتوانند مطلب علمی جدیدی را کشف کنند، یا فقط در حرف زدن درباره آن خوب هستند؟
این مقاله که با عنوان «ارزیابی مدلهای زبانی بزرگ در کشف علمی» نامیده میشود و به جای پرسیدن سؤالات پیش پا افتاده و(trivia) ویا معمول از مدلها، چیزی بسیار سختتر را مورد آزمایش قرار داده :
آیا مدلها میتوانند فرضیه بسازند، آزمایش طراحی کنند، نتایج را تفسیر کنند و باورها را مانند دانشمندان واقعی بهروزرسانی کنند؟
این چیزی است که نویسندگان به شیوه متفاوتی انجام دادند 👇
• آنها مدلهای زبانی را در کل حلقه کشف ارزیابی میکنند:
فرضیه → آزمایش → مشاهده → بازنگری
• وظایف شامل زیستشناسی، شیمی و فیزیک هستند، نه پازلهای اسباببازی
• مدلها باید با دادههای ناقص، نتایج پر از نویز(اختلال) و سرنخهای غلط کار کنند
• موفقیت بر اساس پیشرفت علمی اندازهگیری میشود، نه روان بودن یا اعتماد به نفس
آنچه پیدا کردند، تکاندهنده است.
مدلهای زبانی بزرگ در پیشنهاد فرضیهها خوب هستند، اما در همه چیزهای بعدی شکنندهاند.
✓ آنها داده ها را بیش از اندازه با الگوهای سطحی مطابقت میکنند(over fit)
✓ حتی وقتی شواهد با آنها تناقض دارد، رها کردن فرضیههای بد برایشان سخت است
✓ همبستگی را با علیت اشتباه میگیرند
✓ وقتی آزمایشها شکست میخورند، توضیحات توهمی میسازند
✓ برای محتمل بودن بهینهسازی میکنند، نه پیدا کردن حقیقت
شگفتانگیزترین نتیجه:
نمرات بالای بنچمارک (محک زدن) با توانایی کشف علمی همبستگی ندارد.برخی از مدلهای برتر که در آزمونهای استدلال استاندارد غالب هستند، وقتی مجبور به اجرای آزمایشهای تکراری و بهروزرسانی نظریهها شوند، کاملاً شکست میخورند.
چرا این مهم است:
علم واقعی استدلال یکباره نیست.
علم واقعی حاصل از بازخورد، شکست، بازنگری و خویشتنداری است.
مدلهای زبانی بزرگ امروز:
• مانند دانشمندان حرف میزنند
• مانند دانشمندان مینویسند
• اما هنوز مانند دانشمندان فکر نمیکنند
پیام اصلی مقاله:
هوش علمی، هوش زبانی نیست.
نیاز به حافظه، ردیابی فرضیه، استدلال علی، و توانایی گفتن «اشتباه کردم» دارد.
تا وقتی مدلها نتوانند این کار را به طور قابل اعتماد انجام دهند، ادعاها درباره «دانشمندان هوش مصنوعی» عمدتاً نابهنگام هستند.
این مقاله هوش مصنوعی را تبلیغ نمیکند. شکاف باقیمانده را تعریف میکند.
و دقیقاً به همین دلیل مهم است.
🔗 Alex Prompter
🔻پیوند به مقاله:
https://arxiv.org/abs/2512.15567
https://x.com/i/status/2001909854525624770
arXiv.org
Evaluating Large Language Models in Scientific Discovery
Large language models (LLMs) are increasingly applied to scientific research, yet prevailing science benchmarks probe decontextualized knowledge and overlook the iterative reasoning, hypothesis...
❤10🔥2✍1👍1
10 معما برای کريسمس
سوفیا کووالفسکایا، بانوی ریاضیدان معروف روسیه میگه:«ریاضیات علمی است که بیش از هر چیز به تخیل نیاز دارد.»
همه ما قدرت تخیل داریم، پس همه مون میتونیم از ریاضی لذت ببریم. ریاضی فقط حسابوکتاب نیست؛ ترکیبی جادویی از منطق، استدلال، یافتن الگوها و تفکر خلاق است.
10 معمای زیر برای سرگرم شدن در تعطیلات کريسمس میاونه برای هرکسی جذاب و جالب باشه.
حل این پازلها نه تنها سرگرمکننده است، بلکه طبق تئوری یادگیری «دونالد هب»،
" when neurons fire together, they wire together"
باعث ایجاد مسیرهای عصبی جدید در مغز و حفظ سلامت عملکردهای شناختی میشود.
این معماها به هیچ فرمول پیچیدهای نیاز ندارند و برای تمام اعضای خانواده مناسب هستند.
منبع
سوفیا کووالفسکایا، بانوی ریاضیدان معروف روسیه میگه:«ریاضیات علمی است که بیش از هر چیز به تخیل نیاز دارد.»
همه ما قدرت تخیل داریم، پس همه مون میتونیم از ریاضی لذت ببریم. ریاضی فقط حسابوکتاب نیست؛ ترکیبی جادویی از منطق، استدلال، یافتن الگوها و تفکر خلاق است.
10 معمای زیر برای سرگرم شدن در تعطیلات کريسمس میاونه برای هرکسی جذاب و جالب باشه.
حل این پازلها نه تنها سرگرمکننده است، بلکه طبق تئوری یادگیری «دونالد هب»،
" when neurons fire together, they wire together"
باعث ایجاد مسیرهای عصبی جدید در مغز و حفظ سلامت عملکردهای شناختی میشود.
این معماها به هیچ فرمول پیچیدهای نیاز ندارند و برای تمام اعضای خانواده مناسب هستند.
منبع
❤6
Infinity
10 معما برای کريسمس سوفیا کووالفسکایا، بانوی ریاضیدان معروف روسیه میگه:«ریاضیات علمی است که بیش از هر چیز به تخیل نیاز دارد.» همه ما قدرت تخیل داریم، پس همه مون میتونیم از ریاضی لذت ببریم. ریاضی فقط حسابوکتاب نیست؛ ترکیبی جادویی از منطق، استدلال، یافتن…
۱. سکه تقلبی:
۳. تقسیم نوشیدنی:
۶. دروغسنج:
۷. کلاه رنگی:
۸. جعبههای جابهجا:
۹. ترکیب آبمیوهها:
۱۰. کارتهای بابانوئل:
۹ سکه طلا دارید که کاملاً همشکل هستند، اما یکی از آنها تقلبی و سبکتر است. با یک ترازوی دوکفهای، حداقل با چند بار وزنکشی میتوانید سکه تقلبی را پیدا کنید؟۲. زمانبندی دقیق:
شما دو ساعت شنی دارید؛ یکی ۴ دقیقهای و دیگری ۷ دقیقهای. چطور میتوانید دقیقاً ۱۰ دقیقه زمان بگیرید؟
۳. تقسیم نوشیدنی:
دو بشکه ۱۰ لیتری دارید. سرآشپز دو بطری خالی (یکی ۵ لیتری و یکی ۴ لیتری) به شما میدهد. چطور میتوانید بدون هدر دادن یک قطره، در هر بطری دقیقاً ۳ لیتر مایع بریزید؟۴. هدیه ۱۰۰ روزه:
فرض کنید ۱۰۰ روز هدیه میگیرید. روز اول ۱ دلار، روز دوم ۲ دلار و به همین ترتیب تا روز صدم که ۱۰۰ دلار میگیرید. بدون جمع زدن تکتک اعداد، مجموع پول شما چقدر است؟۵. دنباله اعداد:
عدد بعدی در این دنباله چیست؟
9, 11, 10, 12, 9, 5, ...
۶. دروغسنج:
لیستی از ۱۰۰ جمله داریم:
۱. دقیقاً یک جمله در این لیست غلط است.
۲. دقیقاً دو جمله در این لیست غلط است.
...
۱۰۰. دقیقاً ۱۰۰ جمله در این لیست غلط است.
کدام جمله در این لیست «درست» است؟
۷. کلاه رنگی:
شما و دو نفر دیگر (آرتور و باب) کلاههایی قرمز یا سبز به سر دارید. شما کلاه آرتور و باب را میبینید که هر دو قرمز است. به شما گفته میشود «حداقل یک کلاه قرمز وجود دارد». آرتور میگوید: «رنگ کلاه خودم را نمیدانم». باب هم میگوید: «نمیدانم». آیا شما میتوانید رنگ کلاهتان را بفهمید؟
۸. جعبههای جابهجا:
سه جعبه دارید: یکی حاوی دو هدیه، یکی حاوی دو تکه زغال و یکی حاوی یک هدیه و یک زغال. برچسب روی جعبهها کاملاً اشتباه چسبانده شده است. اگر فقط اجازه داشته باشید یک هدیه از «یک جعبه» بیرون بکشید، کدام جعبه را انتخاب میکنید تا بتوانید برچسب همه را اصلاح کنید؟
۹. ترکیب آبمیوهها:
یک لیتر آبپرتقال و یک لیتر آبسیب داریم. یک قاشق از آبپرتقال را در ظرف آبسیب میریزیم و هم میزنیم. سپس یک قاشق از مخلوط جدید را برداشته و به ظرف آبپرتقال برمیگردانیم. حالا مقدار آبپرتقال در ظرف سیب بیشتر است یا آبسیب در ظرف پرتقال؟
۱۰. کارتهای بابانوئل:
روی هر کارت یک سمت تصویر (بابانوئل یا همسرش) و سمت دیگر یک شکل (هدیه یا گوزن) است. قانون این است: «اگر یک سمت بابانوئل باشد، سمت دیگر باید هدیه باشد». برای امتحان کردن صحت این قانون، کدام کارتها را باید پشتورو کنید؟منبع
(کارتهای روی میز: بابانوئل | همسر بابانوئل | هدیه | گوزن)
❤7👍4
Infinity
۱. سکه تقلبی: ۹ سکه طلا دارید که کاملاً همشکل هستند، اما یکی از آنها تقلبی و سبکتر است. با یک ترازوی دوکفهای، حداقل با چند بار وزنکشی میتوانید سکه تقلبی را پیدا کنید؟ ۲. زمانبندی دقیق: شما دو ساعت شنی دارید؛ یکی ۴ دقیقهای و دیگری ۷ دقیقهای. چطور…
یه ورژن دیجیتال و شبیه به معمای شماره 1 اینه:
10 تا کیسه پر از سکه های طلا داریم که همه کیسه ها سکه هاشون 10 گرمی ولی یه کیسه حاوی سکه های 9 گرمی است.
چطوری میشه با یک بار وزنکشی با یک ترازوی دیجیتال کیسه سکه های 9 گرمی رو پیدا کرد.
10 تا کیسه پر از سکه های طلا داریم که همه کیسه ها سکه هاشون 10 گرمی ولی یه کیسه حاوی سکه های 9 گرمی است.
چطوری میشه با یک بار وزنکشی با یک ترازوی دیجیتال کیسه سکه های 9 گرمی رو پیدا کرد.
❤1👏1🤔1
Infinity
یه ورژن دیجیتال و شبیه به معمای شماره 1 اینه: 10 تا کیسه پر از سکه های طلا داریم که همه کیسه ها سکه هاشون 10 گرمی ولی یه کیسه حاوی سکه های 9 گرمی است. چطوری میشه با یک بار وزنکشی با یک ترازوی دیجیتال کیسه سکه های 9 گرمی رو پیدا کرد.
یه معمای دیگه توی این مایه ها یادم اومد اونم جالبه:
یه ترازوی دو کفه ای داریم که میخواهیم جرم های 1 تا 40 گرمی رو باهاش اندازه گیری کنیم.
مینیم تعداد وزنه برای این کار چندتاست؟
یه ترازوی دو کفه ای داریم که میخواهیم جرم های 1 تا 40 گرمی رو باهاش اندازه گیری کنیم.
مینیم تعداد وزنه برای این کار چندتاست؟
❤1👏1
از تمامی پژوهشگران و صاحبنظران دعوت میکنیم مقالات ارزشمند و دستاوردهای پژوهشی خود را در حوزههای مربوط به تاریخ علم برای ارائه در اولین کنفرانس بین المللی تاریخ علم کوشیار گیلانی ارسال نمایند.
مهلت ارسال چکیده مقالات:
⏰ بهمن ۱۴۰۴
برای ارسال مقاله و کسب اطلاعات تکمیلی، به سایت کنفرانس مراجعه کنید:
https://ichs-kushyar1.ir/fa
ما را در شبکههای اجتماعی دنبال کنید:
https://chat.whatsapp.com/DDYIGysoxZz7m12Pq91Kzk
📧 Email:ichs-kushyar@guilan.ac.ir
📅 تاریخ برگزاری: ۲۶ و ۲۷ فروردین ۱۴۰۵
📍 **مکان: رشت، دانشگاه گیلان
مهلت ارسال چکیده مقالات:
⏰ بهمن ۱۴۰۴
برای ارسال مقاله و کسب اطلاعات تکمیلی، به سایت کنفرانس مراجعه کنید:
https://ichs-kushyar1.ir/fa
ما را در شبکههای اجتماعی دنبال کنید:
https://chat.whatsapp.com/DDYIGysoxZz7m12Pq91Kzk
📧 Email:ichs-kushyar@guilan.ac.ir
📅 تاریخ برگزاری: ۲۶ و ۲۷ فروردین ۱۴۰۵
📍 **مکان: رشت، دانشگاه گیلان
❤2