آنتروپیک یه گزارش جدید منتشر کرده که میگه مدل جدیدش یعنی Mythos Preview داره به سطحی میرسه که شاید تو آینده بتونه به ساخت نسخههای بعدی AI کمک کنه
هر نسخه از Claude رو با یه تست ثابت میسنجن: به مدل یه کد آموزش AI میدن و ازش میخوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic میشن، توسط خود Claude نوشته میشن، نه انسانها.
توی آزمایشهای تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسانها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI میتونه مستقل کار کنه هم داره سریع زیاد میشه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام میداد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار میکنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
هر نسخه از Claude رو با یه تست ثابت میسنجن: به مدل یه کد آموزش AI میدن و ازش میخوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic میشن، توسط خود Claude نوشته میشن، نه انسانها.
توی آزمایشهای تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسانها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI میتونه مستقل کار کنه هم داره سریع زیاد میشه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام میداد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار میکنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
👍14❤3🔥1😱1
میتونین با انواع مدل های قدرتمند متنی و تصویری
🔹 OpenAI
🔹 Anthropic
🔹 Google
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com
🔹 OpenAI
🔹 Anthropic
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com
👍4❤2👎1
دستورات Claude
chat.zharph.com
اگه به Claude دسترسی ندارین میتونین از طریق پلتفرم ژرف باهاش کار کنین
chat.zharph.com
🤣13👍7
جدیدا OpenAI راهنمای prompting برای GPT-5.5 رو منتشر کرده و پیام اصلیش اینه که کمتر توضیح بده، نتیجه بهتر بگیر
برخلاف نسلهای قبلی، توی GPT-5.5 معمولاً پرامپتهای کوتاهتر و outcome-first بهتر جواب میدن. یعنی بهجای اینکه مرحلهبهمرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیتهایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینهتر شده و خیلی وقتها بدون مصرف محاسبات بیشتر هم نتیجه خوب میده.
برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.
همچنین OpenAI پیشنهاد میکنه برای ساخت تجربه بهتر توی agentic UX و محصولهای کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
برخلاف نسلهای قبلی، توی GPT-5.5 معمولاً پرامپتهای کوتاهتر و outcome-first بهتر جواب میدن. یعنی بهجای اینکه مرحلهبهمرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیتهایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینهتر شده و خیلی وقتها بدون مصرف محاسبات بیشتر هم نتیجه خوب میده.
برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.
همچنین OpenAI پیشنهاد میکنه برای ساخت تجربه بهتر توی agentic UX و محصولهای کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.
خلاصه اینکه توی GPT-5.5 بهجای اینکه مسیر حل مسئله رو کامل دیکته کنی، بهتره فقط هدف، محدودیتها و خروجی موردنظر رو مشخص کنی و اجازه بدی مدل خودش مسیر بهینه رو پیدا کنهاین میتونه کمکم آغازی برای پایان مفاهیمی مثل prompt engineering باشه
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
👍7❤2
همونطور که در پست قبلی مطرح شد مفهوم Prompt Engineering دیگه داره به پایانش میرسه و بعضی ها معتقد هستند که جای خودش رو به Loop Engineering میده.
به جای اینکه دستی برای ایجنت پرامپت بنویسید، خروجی بگیرید و ارورها رو دوباره به خورد مدل بدید، یک سیستم طراحی میکنید که خودش کار رو پیدا کنه، انجام بده، با ابزارهای واقعی تست کنه و در صورت خطا خودش رو اصلاح کنه. این تغییر پارادایم، باتلنک توسعه رو از سرعت تایپ انسان به طراحی سیستمهای خودکار و مستقل منتقل کرده.
پیادهسازی لوپها روی کاغذ جذابه اما تو واقعیت به شدت پرهزینه است. یک لوپ ساده برای یک تسک برنامهنویسی میتونه به راحتی بین ۵۰ تا ۲۰۰ هزار توکن مصرف کنه.
اگه محدودیت نذارید و از مدلهای گرونقیمت استفاده کنید، تو چند روز کل بودجه API شما نابود میشه. دلیل اینکه این روزها پیادهسازی لوپ منطقی شده، ظهور مدلهای ارزونقیمت با کانتکست بالا (مثل سری DeepSeek V4) هست که اجازه میدن ایجنتها بدون نگرانی از هزینه، بارها خطا کنن و خودشون رو دیباگ کنن.
@silicon_brain | از هوش مصنوعی عقب نمانید
حالا Loop Engineering چیه؟
به جای اینکه دستی برای ایجنت پرامپت بنویسید، خروجی بگیرید و ارورها رو دوباره به خورد مدل بدید، یک سیستم طراحی میکنید که خودش کار رو پیدا کنه، انجام بده، با ابزارهای واقعی تست کنه و در صورت خطا خودش رو اصلاح کنه. این تغییر پارادایم، باتلنک توسعه رو از سرعت تایپ انسان به طراحی سیستمهای خودکار و مستقل منتقل کرده.
چالش های اصلی Loop Engineering
پیادهسازی لوپها روی کاغذ جذابه اما تو واقعیت به شدت پرهزینه است. یک لوپ ساده برای یک تسک برنامهنویسی میتونه به راحتی بین ۵۰ تا ۲۰۰ هزار توکن مصرف کنه.
اگه محدودیت نذارید و از مدلهای گرونقیمت استفاده کنید، تو چند روز کل بودجه API شما نابود میشه. دلیل اینکه این روزها پیادهسازی لوپ منطقی شده، ظهور مدلهای ارزونقیمت با کانتکست بالا (مثل سری DeepSeek V4) هست که اجازه میدن ایجنتها بدون نگرانی از هزینه، بارها خطا کنن و خودشون رو دیباگ کنن.
@silicon_brain | از هوش مصنوعی عقب نمانید
👍6❤3🔥1
گفتم حالا که جام جهانی شروع میشه و فرصت خوبی هست عملکرد AI رو در مورد پیش بینی نتایج فوتبال مورد بررسی قرار بدیم.
یه کانال ساختم و پیش بینی نتایج بازی ها رو قبل از شروع بازی میذارم تو این کانال:
@preaiball
اگه فرصت کنم یه بنچمارک تعریف میکنم تا خطای هر بخش از پیش بینی رو اعلام کنه و آخر جام جهانی یه بنچمارک استاندارد از عملکرد AI تو این رقابت ها داشته باشیم.
لطفا عضو شین و حمایت کنین ببینیم چی میشه. مرسی ❤️
@preaiball
یه کانال ساختم و پیش بینی نتایج بازی ها رو قبل از شروع بازی میذارم تو این کانال:
@preaiball
اگه فرصت کنم یه بنچمارک تعریف میکنم تا خطای هر بخش از پیش بینی رو اعلام کنه و آخر جام جهانی یه بنچمارک استاندارد از عملکرد AI تو این رقابت ها داشته باشیم.
لطفا عضو شین و حمایت کنین ببینیم چی میشه. مرسی ❤️
@preaiball
👍9🔥2
Silicon Brain | جامعه هوش مصنوعی
گفتم حالا که جام جهانی شروع میشه و فرصت خوبی هست عملکرد AI رو در مورد پیش بینی نتایج فوتبال مورد بررسی قرار بدیم. یه کانال ساختم و پیش بینی نتایج بازی ها رو قبل از شروع بازی میذارم تو این کانال: @preaiball اگه فرصت کنم یه بنچمارک تعریف میکنم تا خطای هر بخش…
پیش بینی دقیق نتیجه بازی مکزیک - آفریقای جنوبی😁
شروعش قدرتمند بود، ببینیم در ادامه چیکار میکنه
@preaiball
شروعش قدرتمند بود، ببینیم در ادامه چیکار میکنه
@preaiball
👍6🔥3
مشکل اصلی توی ایجنتهای برنامهنویسی معمولاً خود پرامپتها نیستن مشکل واقعی از خروجی ابزارها (Tool Outputs) میاد
لاگهای طولانی ترمینال، خروجی تستها، نتایج سرچ و لیست Dependencyها خیلی وقتها بدون هیچ فیلتری وارد کانتکست مدل میشن و اینجوری حجم زیادی از توکن الکی مصرف میشه و مدل هم روی اطلاعات کمارزش تمرکز کنه
برای حل این مشکل، ابزار RTK (Rust Token Killer) ساخته شده. یه Proxy محلی که بین ایجنت و ترمینال قرار میگیره. RTK قبل از اینکه خروجی به مدل برسه، اون رو تمیز و فشرده میکنه و فقط بخشهای مهم مثل خطاها یا فایلهای تغییر کرده رو نگه میداره. نکته جالب اینه که برای خلاصهسازی سراغ LLM نمیره و با Regex، خروجیهای ساختاریافته و State Machine این کار رو به شکل قابل پیشبینی انجام میده.
در عمل هم ایده پشت RTK فقط صرفهجویی توکن نیست؛ در واقع این مدل فقط سیگنالهای مهم رو ببینه و با نویز کمتر تصمیم بگیره. این دقیقاً همون چیزیه که احتمالاً معماری نسل بعدی ایجنتها رو شکل میده.
گیتهاب
@silicon_brain I از هوش مصنوعی عقب نمانید
لاگهای طولانی ترمینال، خروجی تستها، نتایج سرچ و لیست Dependencyها خیلی وقتها بدون هیچ فیلتری وارد کانتکست مدل میشن و اینجوری حجم زیادی از توکن الکی مصرف میشه و مدل هم روی اطلاعات کمارزش تمرکز کنه
برای حل این مشکل، ابزار RTK (Rust Token Killer) ساخته شده. یه Proxy محلی که بین ایجنت و ترمینال قرار میگیره. RTK قبل از اینکه خروجی به مدل برسه، اون رو تمیز و فشرده میکنه و فقط بخشهای مهم مثل خطاها یا فایلهای تغییر کرده رو نگه میداره. نکته جالب اینه که برای خلاصهسازی سراغ LLM نمیره و با Regex، خروجیهای ساختاریافته و State Machine این کار رو به شکل قابل پیشبینی انجام میده.
طبق ادعای سازندهها، این کار میتونه بین ۶۰ تا ۹۰ درصد مصرف توکن رو کم کنه.
در عمل هم ایده پشت RTK فقط صرفهجویی توکن نیست؛ در واقع این مدل فقط سیگنالهای مهم رو ببینه و با نویز کمتر تصمیم بگیره. این دقیقاً همون چیزیه که احتمالاً معماری نسل بعدی ایجنتها رو شکل میده.
گیتهاب
@silicon_brain I از هوش مصنوعی عقب نمانید
👍8❤3
Forwarded from پیشبینی فوتبال با AI
Prediction System Performance in 4 World Cup Matches:
🔹Game Winner Accuracy: 75%
🔹Goals Scored Accuracy: 81.25%
🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
RAG و fine-tuning هر دو برای شخصیسازی LLM استفاده میشن، ولی دو مشکل کاملاً متفاوت رو حل میکنن
توی RAG خود مدل تغییر نمیکنه؛ موقع سؤال، اطلاعات مرتبط از knowledge base (معمولاً با vector DB) پیدا و به مدل داده میشه. یعنی دانش مدل همیشه میتونه بهروز بمونه و فقط data رو آپدیت میکنی، نه خود مدل.
ولی fine-tuning خود مدل رو تغییر میده. با train کردن روی مثالهای مشخص، وزنهای مدل (weights) تغییر میکنن تا مدل یه رفتار، لحن یا فرمت خروجی خاص رو یاد بگیره.
در واقع RAG به مدل یاد میده چی بدونه
ولی fine-tuning به مدل یاد میده چطور رفتار کنه
پس:
اگر اطلاعات جدید، قابل استناد و بهروز میخوای 👈 RAG
اگر خروجی با لحن، سبک یا فرمت ثابت میخوای 👈fine-tuning
اگر هر دو رو میخوای 👈 ترکیب RAG + fine-tuning
@silicon_brain | از هوش مصنوعی عقب نمانید
توی RAG خود مدل تغییر نمیکنه؛ موقع سؤال، اطلاعات مرتبط از knowledge base (معمولاً با vector DB) پیدا و به مدل داده میشه. یعنی دانش مدل همیشه میتونه بهروز بمونه و فقط data رو آپدیت میکنی، نه خود مدل.
ولی fine-tuning خود مدل رو تغییر میده. با train کردن روی مثالهای مشخص، وزنهای مدل (weights) تغییر میکنن تا مدل یه رفتار، لحن یا فرمت خروجی خاص رو یاد بگیره.
قانون کلی
در واقع RAG به مدل یاد میده چی بدونه
ولی fine-tuning به مدل یاد میده چطور رفتار کنه
پس:
اگر اطلاعات جدید، قابل استناد و بهروز میخوای 👈 RAG
اگر خروجی با لحن، سبک یا فرمت ثابت میخوای 👈fine-tuning
اگر هر دو رو میخوای 👈 ترکیب RAG + fine-tuning
@silicon_brain | از هوش مصنوعی عقب نمانید
👍8❤5🔥1
🎓 آشنایی با اساتید «بوتکمپ هوش مصنوعی مولد» (با محوریت تصویر)
⚙️ در بوتکمپ جدید آکادمی همراه، میزبان متخصصان و مدیران با تجربهی بسیاری هستیم تا جامعترین دانش و تجربیات در خصوص هوش مصنوعی مولد را، در اختیار شرکتکنندگان قرار بدهیم.
🔸 آرش امینی | سرپرست تیم هوش مصنوعی همراه اول، فوقدکتری پردازش تصاویر پزشکی دانشگاه EPFL
🔸 محمدرضا محمدی | استادیار گروه هوش مصنوعی دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت
🔸 رشاد حسینی | عضو هیئت علمی دانشگاه تهران
🔸 علیرضا اخوان پور | مدیر فنی مجموعه دانش بنیان شناسا
🔸 حسن کتابی | سرپرست تیم هوش مصنوعی شرکت فناوری اطلاعات آدین
🔸 احسان ناظرفرد | عضو هیئت علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی امیرکبیر
🔸 مریم امیرمزلقانی | دانشیار گروه هوش مصنوعی و رباتیک دانشگاه امیرکبیر
🔸 شهره کسائی | استاد تمام دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
🔸 مصطفی توسلیپور | عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه تهران
🔸 سهیل تهرانیپور | مدیرعامل و متخصص هوش مصنوعی ساعیان ارتباط
🔸 مسعود کاویانی | دانشمند داده در صبا ایده (آپارات، فیلیمو، سینماتیکت)
🔸 محسن دارچینی | دکتری مهندسی کامپیوتر و استاد دانشگاه علم و صنعت
🔸 هادی عاشری | مدیر تیم هوش مصنوعی شرکت ارتباط فردا
🔸 احمدرضا هروی | مشاور تیم هوش مصنوعی Sensifai
🔸 جمال کزازی | مدرس مدعو همکاران سیستم و دانشگاه تهران
🔸 سینا رنجکشزاده | دانشجوی دکتری مهندسی مخابرات دانشگاه شریف - AI Developer
🔸 امین دهنوی | پژوهشگر هوش مصنوعی شرکت پارت
🌐پیشثبتنام #رایگان:
🔗 https://l.hamrah.academy/4wh
⭐️ @hamrah_academy | آکادمی همراه اول
⚙️ در بوتکمپ جدید آکادمی همراه، میزبان متخصصان و مدیران با تجربهی بسیاری هستیم تا جامعترین دانش و تجربیات در خصوص هوش مصنوعی مولد را، در اختیار شرکتکنندگان قرار بدهیم.
🔸 آرش امینی | سرپرست تیم هوش مصنوعی همراه اول، فوقدکتری پردازش تصاویر پزشکی دانشگاه EPFL
🔸 محمدرضا محمدی | استادیار گروه هوش مصنوعی دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت
🔸 رشاد حسینی | عضو هیئت علمی دانشگاه تهران
🔸 علیرضا اخوان پور | مدیر فنی مجموعه دانش بنیان شناسا
🔸 حسن کتابی | سرپرست تیم هوش مصنوعی شرکت فناوری اطلاعات آدین
🔸 احسان ناظرفرد | عضو هیئت علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی امیرکبیر
🔸 مریم امیرمزلقانی | دانشیار گروه هوش مصنوعی و رباتیک دانشگاه امیرکبیر
🔸 شهره کسائی | استاد تمام دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
🔸 مصطفی توسلیپور | عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه تهران
🔸 سهیل تهرانیپور | مدیرعامل و متخصص هوش مصنوعی ساعیان ارتباط
🔸 مسعود کاویانی | دانشمند داده در صبا ایده (آپارات، فیلیمو، سینماتیکت)
🔸 محسن دارچینی | دکتری مهندسی کامپیوتر و استاد دانشگاه علم و صنعت
🔸 هادی عاشری | مدیر تیم هوش مصنوعی شرکت ارتباط فردا
🔸 احمدرضا هروی | مشاور تیم هوش مصنوعی Sensifai
🔸 جمال کزازی | مدرس مدعو همکاران سیستم و دانشگاه تهران
🔸 سینا رنجکشزاده | دانشجوی دکتری مهندسی مخابرات دانشگاه شریف - AI Developer
🔸 امین دهنوی | پژوهشگر هوش مصنوعی شرکت پارت
⏰ 170 ساعت | آموزش آنلاین و آفلاین
💎 امکان کارآموزی در گروه همراه اول
🌐پیشثبتنام #رایگان:
🔗 https://l.hamrah.academy/4wh
⭐️ @hamrah_academy | آکادمی همراه اول