Infinity
2.25K subscribers
1.51K photos
197 videos
361 files
620 links
Mathematics and Education

Admins:
@saahmou
@HassanMalekii
Download Telegram
این عکس هام خیلی قشنگن. اوج نبوغ معماری و هندسه نسل های قبلی رو برای همیشه در تاریخ ثبت کردند.
24🔥4
‌این مقاله از هاروارد و MIT بدون سر و صدا به مهم‌ترین سؤال هوش مصنوعی پاسخ می‌دهد که هیچ‌کس به درستی بنچمارک نکرده(محک نزده):

آیا مدل‌های زبانی بزرگ واقعاً می‌توانند مطلب علمی جدیدی را کشف کنند، یا فقط در حرف زدن درباره آن خوب هستند؟

این مقاله که با عنوان «ارزیابی مدل‌های زبانی بزرگ در کشف علمی» نامیده می‌شود و به جای پرسیدن سؤالات  پیش پا افتاده  و(trivia) ویا معمول از مدل‌ها، چیزی بسیار سخت‌تر را مورد آزمایش قرار داده :

آیا مدل‌ها می‌توانند فرضیه بسازند، آزمایش طراحی کنند، نتایج را تفسیر کنند و باورها را مانند دانشمندان واقعی به‌روزرسانی کنند؟

این چیزی است که نویسندگان به شیوه متفاوتی انجام دادند 👇

• آن‌ها مدل‌های زبانی را در کل حلقه کشف ارزیابی می‌کنند:
فرضیه → آزمایش → مشاهده → بازنگری
• وظایف شامل زیست‌شناسی، شیمی و فیزیک هستند، نه پازل‌های اسباب‌بازی
• مدل‌ها باید با داده‌های ناقص، نتایج پر از نویز(اختلال) و سرنخ‌های غلط کار کنند
• موفقیت بر اساس پیشرفت علمی اندازه‌گیری می‌شود، نه روان بودن یا اعتماد به نفس

آنچه پیدا کردند، تکان‌دهنده است.

مدل‌های زبانی بزرگ در پیشنهاد فرضیه‌ها خوب هستند، اما در همه چیزهای بعدی شکننده‌اند.

✓ آن‌ها داده ها را بیش از اندازه  با الگوهای سطحی مطابقت می‌کنند(over fit)
✓ حتی وقتی شواهد با آن‌ها تناقض دارد، رها کردن فرضیه‌های بد برایشان سخت است
✓ همبستگی را با علیت اشتباه می‌گیرند
✓ وقتی آزمایش‌ها شکست می‌خورند، توضیحات توهمی می‌سازند
✓ برای محتمل بودن بهینه‌سازی می‌کنند، نه پیدا کردن حقیقت

شگفت‌انگیزترین نتیجه:

نمرات بالای بنچمارک (محک زدن) با توانایی کشف علمی همبستگی ندارد.

برخی از مدل‌های برتر که در آزمون‌های استدلال استاندارد غالب هستند، وقتی مجبور به اجرای آزمایش‌های تکراری و به‌روزرسانی نظریه‌ها شوند، کاملاً شکست می‌خورند.

چرا این مهم است:

علم واقعی استدلال یک‌باره نیست.

علم واقعی حاصل از  بازخورد، شکست، بازنگری و خویشتن‌داری است.

مدل‌های زبانی بزرگ امروز:

• مانند دانشمندان حرف می‌زنند
• مانند دانشمندان می‌نویسند
• اما هنوز مانند دانشمندان فکر نمی‌کنند

پیام اصلی مقاله:

هوش علمی، هوش زبانی نیست.

نیاز به حافظه، ردیابی فرضیه، استدلال علی، و توانایی گفتن «اشتباه کردم» دارد.

تا وقتی مدل‌ها نتوانند این کار را به طور قابل اعتماد انجام دهند، ادعاها درباره «دانشمندان هوش مصنوعی» عمدتاً نابهنگام هستند.

این مقاله هوش مصنوعی را تبلیغ نمی‌کند. شکاف باقی‌مانده را تعریف می‌کند.

و دقیقاً به همین دلیل مهم است.

🔗 Alex Prompter

🔻پیوند به مقاله:

https://arxiv.org/abs/2512.15567

https://x.com/i/status/2001909854525624770
10🔥21👍1
پارادوکس روز تولد: میشه نشون داد تو هر جمع ۲۳ نفری از آدما احتمال اینکه دو نفر در یک تاریخ متولد شده باشن تقریبا ۵۰ درصده.
😱5👍4🔥21👏1🎉1🆒1
9
10 معما برای کريسمس

​سوفیا کووالفسکایا، بانوی ریاضیدان معروف روسیه میگه:​«ریاضیات علمی است که بیش از هر چیز به تخیل نیاز دارد.»

همه ما قدرت تخیل داریم، پس همه مون می‌تونیم از ریاضی لذت ببریم. ریاضی فقط حساب‌وکتاب نیست؛ ترکیبی جادویی از منطق، استدلال، یافتن الگوها و تفکر خلاق است.
10 معمای زیر برای سرگرم شدن در تعطیلات کريسمس می‌اونه برای هرکسی جذاب و جالب باشه.
​حل این پازل‌ها نه تنها سرگرم‌کننده است، بلکه طبق تئوری یادگیری «دونالد هب»،
" when neurons fire together, they wire together"
باعث ایجاد مسیرهای عصبی جدید در مغز و حفظ سلامت عملکردهای شناختی می‌شود.

این معماها به هیچ فرمول پیچیده‌ای نیاز ندارند و برای تمام اعضای خانواده مناسب هستند.

منبع
6
Infinity
10 معما برای کريسمس ​سوفیا کووالفسکایا، بانوی ریاضیدان معروف روسیه میگه:​«ریاضیات علمی است که بیش از هر چیز به تخیل نیاز دارد.» همه ما قدرت تخیل داریم، پس همه مون می‌تونیم از ریاضی لذت ببریم. ریاضی فقط حساب‌وکتاب نیست؛ ترکیبی جادویی از منطق، استدلال، یافتن…
​۱. سکه تقلبی:
۹ سکه طلا دارید که کاملاً هم‌شکل هستند، اما یکی از آن‌ها تقلبی و سبک‌تر است. با یک ترازوی دوکفه‌ای، حداقل با چند بار وزن‌کشی می‌توانید سکه تقلبی را پیدا کنید؟
​۲. زمان‌بندی دقیق:
شما دو ساعت شنی دارید؛ یکی ۴ دقیقه‌ای و دیگری ۷ دقیقه‌ای. چطور می‌توانید دقیقاً ۱۰ دقیقه زمان بگیرید؟


​۳. تقسیم نوشیدنی:
دو بشکه ۱۰ لیتری دارید. سرآشپز دو بطری خالی (یکی ۵ لیتری و یکی ۴ لیتری) به شما می‌دهد. چطور می‌توانید بدون هدر دادن یک قطره، در هر بطری دقیقاً ۳ لیتر مایع بریزید؟
​۴. هدیه ۱۰۰ روزه:
فرض کنید ۱۰۰ روز هدیه می‌گیرید. روز اول ۱ دلار، روز دوم ۲ دلار و به همین ترتیب تا روز صدم که ۱۰۰ دلار می‌گیرید. بدون جمع زدن تک‌تک اعداد، مجموع پول شما چقدر است؟
​۵. دنباله اعداد:
عدد بعدی در این دنباله چیست؟
9, 11, 10, 12, 9, 5, ...


​۶. دروغ‌سنج:
لیستی از ۱۰۰ جمله داریم:
۱. دقیقاً یک جمله در این لیست غلط است.
۲. دقیقاً دو جمله در این لیست غلط است.
...
۱۰۰. دقیقاً ۱۰۰ جمله در این لیست غلط است.
کدام جمله در این لیست «درست» است؟


​۷. کلاه رنگی:
شما و دو نفر دیگر (آرتور و باب) کلاه‌هایی قرمز یا سبز به سر دارید. شما کلاه آرتور و باب را می‌بینید که هر دو قرمز است. به شما گفته می‌شود «حداقل یک کلاه قرمز وجود دارد». آرتور می‌گوید: «رنگ کلاه خودم را نمی‌دانم». باب هم می‌گوید: «نمی‌دانم». آیا شما می‌توانید رنگ کلاهتان را بفهمید؟


​۸. جعبه‌های جابه‌جا:
سه جعبه دارید: یکی حاوی دو هدیه، یکی حاوی دو تکه زغال و یکی حاوی یک هدیه و یک زغال. برچسب روی جعبه‌ها کاملاً اشتباه چسبانده شده است. اگر فقط اجازه داشته باشید یک هدیه از «یک جعبه» بیرون بکشید، کدام جعبه را انتخاب می‌کنید تا بتوانید برچسب همه را اصلاح کنید؟


​۹. ترکیب آبمیوه‌ها:
یک لیتر آب‌پرتقال و یک لیتر آب‌سیب داریم. یک قاشق از آب‌پرتقال را در ظرف آب‌سیب می‌ریزیم و هم می‌زنیم. سپس یک قاشق از مخلوط جدید را برداشته و به ظرف آب‌پرتقال برمی‌گردانیم. حالا مقدار آب‌پرتقال در ظرف سیب بیشتر است یا آب‌سیب در ظرف پرتقال؟

​۱۰. کارت‌های بابانوئل:
روی هر کارت یک سمت تصویر (بابانوئل یا همسرش) و سمت دیگر یک شکل (هدیه یا گوزن) است. قانون این است: «اگر یک سمت بابانوئل باشد، سمت دیگر باید هدیه باشد». برای امتحان کردن صحت این قانون، کدام کارت‌ها را باید پشت‌ورو کنید؟
(کارت‌های روی میز: بابانوئل | همسر بابانوئل | هدیه | گوزن)
منبع
7👍4
Infinity
​۱. سکه تقلبی: ۹ سکه طلا دارید که کاملاً هم‌شکل هستند، اما یکی از آن‌ها تقلبی و سبک‌تر است. با یک ترازوی دوکفه‌ای، حداقل با چند بار وزن‌کشی می‌توانید سکه تقلبی را پیدا کنید؟ ​۲. زمان‌بندی دقیق: شما دو ساعت شنی دارید؛ یکی ۴ دقیقه‌ای و دیگری ۷ دقیقه‌ای. چطور…
یه ورژن دیجیتال و شبیه به معمای شماره 1 اینه:

10 تا کیسه پر از سکه های طلا داریم که همه کیسه ها سکه هاشون 10 گرمی ولی یه کیسه حاوی سکه های 9 گرمی است.
چطوری میشه با یک بار وزن‌کشی با یک ترازوی دیجیتال کیسه سکه های 9 گرمی رو پیدا کرد.
1👏1🤔1
Infinity
یه ورژن دیجیتال و شبیه به معمای شماره 1 اینه: 10 تا کیسه پر از سکه های طلا داریم که همه کیسه ها سکه هاشون 10 گرمی ولی یه کیسه حاوی سکه های 9 گرمی است. چطوری میشه با یک بار وزن‌کشی با یک ترازوی دیجیتال کیسه سکه های 9 گرمی رو پیدا کرد.
یه معمای دیگه توی این مایه ها یادم اومد اونم جالبه:
یه ترازوی دو کفه ای داریم که میخواهیم جرم های 1 تا 40 گرمی رو باهاش اندازه گیری کنیم.

مینیم تعداد وزنه برای این کار چندتاست؟
1👏1
Infinity
Photo
مجموعه گنجعلی‌خان کرمان
و دوباره اعجاز هندسه و معماری
11
واقعا الان هم میشه یه چنین چیزهایی خلق کرد؟
16🔥5👍1
از تمامی پژوهشگران و صاحبنظران دعوت می‌کنیم مقالات ارزشمند و دستاوردهای پژوهشی خود را در حوزه‌های مربوط به تاریخ علم برای ارائه در اولین کنفرانس بین المللی تاریخ علم کوشیار گیلانی ارسال نمایند.


مهلت ارسال چکیده مقالات:
بهمن ۱۴۰۴

برای ارسال مقاله و کسب اطلاعات تکمیلی، به سایت کنفرانس مراجعه کنید:
https://ichs-kushyar1.ir/fa

ما را در شبکه‌های اجتماعی دنبال کنید:
https://chat.whatsapp.com/DDYIGysoxZz7m12Pq91Kzk

📧 Email:ichs-kushyar@guilan.ac.ir

📅 تاریخ برگزاری: ۲۶ و ۲۷ فروردین ۱۴۰۵
📍 **مکان: رشت، دانشگاه گیلان
2