Silicon Brain | جامعه هوش مصنوعی
7.07K subscribers
1.06K photos
120 videos
60 files
524 links
مغز سیلیکونی|جامعه هوش مصنوعی و یادگیری ماشین

گروه بحث و تبادل نظر:
https://xn--r1a.website/+SWbgmMZt0XU0MGY0

مطالب و بحث های بیشتر در اینستاگرام:
https://www.instagram.com/silicon_brain/

ارتباط با ادمین:
@silicon_brain_admin
Download Telegram
آنتروپیک یه گزارش جدید منتشر کرده که می‌گه مدل جدیدش یعنی Mythos Preview داره به سطحی می‌رسه که شاید تو آینده بتونه به ساخت نسخه‌های بعدی AI کمک کنه

هر نسخه از Claude رو با یه تست ثابت می‌سنجن: به مدل یه کد آموزش AI می‌دن و ازش می‌خوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic می‌شن، توسط خود Claude نوشته می‌شن، نه انسان‌ها.

توی آزمایش‌های تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسان‌ها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI می‌تونه مستقل کار کنه هم داره سریع زیاد می‌شه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام می‌داد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار می‌کنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید
👍143🔥1😱1
میتونین با انواع مدل های قدرتمند متنی و تصویری
🔹 OpenAI
🔹 Anthropic
🔹 Google
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com
👍42👎1
دستورات Claude
اگه به Claude دسترسی ندارین میتونین از طریق پلتفرم ژرف باهاش کار کنین

chat.zharph.com
🤣13👍7
جدیدا OpenAI راهنمای prompting برای GPT-5.5 رو منتشر کرده و پیام اصلیش اینه که کمتر توضیح بده، نتیجه بهتر بگیر

برخلاف نسل‌های قبلی، توی GPT-5.5 معمولاً پرامپت‌های کوتاه‌تر و outcome-first بهتر جواب می‌دن. یعنی به‌جای اینکه مرحله‌به‌مرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیت‌هایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینه‌تر شده و خیلی وقت‌ها بدون مصرف محاسبات بیشتر هم نتیجه خوب می‌ده.

برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.

همچنین OpenAI پیشنهاد می‌کنه برای ساخت تجربه بهتر توی agentic UX و محصول‌های کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.

خلاصه اینکه توی GPT-5.5 به‌جای اینکه مسیر حل مسئله رو کامل دیکته کنی، بهتره فقط هدف، محدودیت‌ها و خروجی موردنظر رو مشخص کنی و اجازه بدی مدل خودش مسیر بهینه رو پیدا کنه
این می‌تونه کم‌کم آغازی برای پایان مفاهیمی مثل prompt engineering باشه
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید
👍72
همونطور که در پست قبلی مطرح شد مفهوم Prompt Engineering دیگه داره به پایانش می‌رسه و بعضی ها معتقد هستند که جای خودش رو به Loop Engineering میده.
حالا Loop Engineering چیه؟

به جای اینکه دستی برای ایجنت پرامپت بنویسید، خروجی بگیرید و ارورها رو دوباره به خورد مدل بدید، یک سیستم طراحی می‌کنید که خودش کار رو پیدا کنه، انجام بده، با ابزارهای واقعی تست کنه و در صورت خطا خودش رو اصلاح کنه. این تغییر پارادایم، باتل‌نک توسعه رو از سرعت تایپ انسان به طراحی سیستم‌های خودکار و مستقل منتقل کرده.
چالش های اصلی Loop Engineering

پیاده‌سازی لوپ‌ها روی کاغذ جذابه اما تو واقعیت به شدت پرهزینه است. یک لوپ ساده برای یک تسک برنامه‌نویسی می‌تونه به راحتی بین ۵۰ تا ۲۰۰ هزار توکن مصرف کنه.
اگه محدودیت نذارید و از مدل‌های گرون‌قیمت استفاده کنید، تو چند روز کل بودجه API شما نابود میشه. دلیل اینکه این روزها پیاده‌سازی لوپ منطقی شده، ظهور مدل‌های ارزون‌قیمت با کانتکست بالا (مثل سری DeepSeek V4) هست که اجازه میدن ایجنت‌ها بدون نگرانی از هزینه، بارها خطا کنن و خودشون رو دیباگ کنن.

@silicon_brain | از هوش مصنوعی عقب نمانید
👍63🔥1
گفتم حالا که جام جهانی شروع میشه و فرصت خوبی هست عملکرد AI رو در مورد پیش بینی نتایج فوتبال مورد بررسی قرار بدیم.
یه کانال ساختم و پیش بینی نتایج بازی ها رو قبل از شروع بازی میذارم تو این کانال:
@preaiball
اگه فرصت کنم یه بنچمارک تعریف میکنم تا خطای هر بخش از پیش بینی رو اعلام کنه و آخر جام جهانی یه بنچمارک استاندارد از عملکرد AI تو این رقابت ها داشته باشیم.
لطفا عضو شین و حمایت کنین ببینیم چی میشه. مرسی ❤️
@preaiball
👍9🔥2
مشکل اصلی توی ایجنت‌های برنامه‌نویسی معمولاً خود پرامپت‌ها نیستن مشکل واقعی از خروجی ابزارها (Tool Outputs) میاد

لاگ‌های طولانی ترمینال، خروجی تست‌ها، نتایج سرچ و لیست Dependencyها خیلی وقت‌ها بدون هیچ فیلتری وارد کانتکست مدل می‌شن و اینجوری حجم زیادی از توکن‌ الکی مصرف میشه و مدل هم روی اطلاعات کم‌ارزش تمرکز کنه

برای حل این مشکل، ابزار RTK (Rust Token Killer) ساخته شده. یه Proxy محلی که بین ایجنت و ترمینال قرار می‌گیره. RTK قبل از اینکه خروجی به مدل برسه، اون رو تمیز و فشرده می‌کنه و فقط بخش‌های مهم مثل خطاها یا فایل‌های تغییر کرده رو نگه می‌داره. نکته جالب اینه که برای خلاصه‌سازی سراغ LLM نمی‌ره و با Regex، خروجی‌های ساختاریافته و State Machine این کار رو به شکل قابل پیش‌بینی انجام می‌ده.
طبق ادعای سازنده‌ها، این کار می‌تونه بین ۶۰ تا ۹۰ درصد مصرف توکن رو کم کنه.


در عمل هم ایده پشت RTK فقط صرفه‌جویی توکن نیست؛ در واقع این مدل فقط سیگنال‌های مهم رو ببینه و با نویز کمتر تصمیم بگیره. این دقیقاً همون چیزیه که احتمالاً معماری نسل بعدی ایجنت‌ها رو شکل می‌ده.
گیتهاب
@silicon_brain I از هوش مصنوعی عقب نمانید
👍83
Prediction System Performance in 4 World Cup Matches:

🔹Game Winner Accuracy: 75%
🔹Goals Scored Accuracy: 81.25%
🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
RAG و fine-tuning هر دو برای شخصی‌سازی LLM استفاده می‌شن، ولی دو مشکل کاملاً متفاوت رو حل می‌کنن

توی RAG خود مدل تغییر نمی‌کنه؛ موقع سؤال، اطلاعات مرتبط از knowledge base (معمولاً با vector DB) پیدا و به مدل داده می‌شه. یعنی دانش مدل همیشه می‌تونه به‌روز بمونه و فقط data رو آپدیت می‌کنی، نه خود مدل.
ولی fine-tuning خود مدل رو تغییر می‌ده. با train کردن روی مثال‌های مشخص، وزن‌های مدل (weights) تغییر می‌کنن تا مدل یه رفتار، لحن یا فرمت خروجی خاص رو یاد بگیره.
قانون کلی

در واقع RAG به مدل یاد می‌ده چی بدونه
ولی fine-tuning به مدل یاد می‌ده چطور رفتار کنه
پس:
اگر اطلاعات جدید، قابل استناد و به‌روز می‌خوای 👈 RAG
اگر خروجی با لحن، سبک یا فرمت ثابت می‌خوای 👈fine-tuning
اگر هر دو رو می‌خوای 👈 ترکیب RAG + fine-tuning

@silicon_brain | از هوش مصنوعی عقب نمانید
👍85🔥1
🎓 آشنایی با اساتید «بوت‌کمپ هوش مصنوعی مولد» (با محوریت تصویر)

⚙️ در بوت‌کمپ جدید آکادمی همراه، میزبان متخصصان و مدیران با تجربه‌ی بسیاری هستیم تا جامع‌ترین دانش و تجربیات در خصوص هوش مصنوعی مولد را، در اختیار شرکت‌کنندگان قرار بدهیم.

🔸 آرش امینی | سرپرست تیم هوش مصنوعی همراه اول، فوق‌دکتری پردازش تصاویر پزشکی دانشگاه EPFL
🔸 محمدرضا محمدی | استادیار گروه هوش مصنوعی دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت
🔸 رشاد حسینی | عضو هیئت علمی دانشگاه تهران
🔸 علیرضا اخوان پور | مدیر فنی مجموعه دانش بنیان شناسا
🔸 حسن کتابی | سرپرست تیم هوش مصنوعی شرکت فناوری اطلاعات آدین
🔸 احسان ناظرفرد | عضو هیئت علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی امیرکبیر
🔸 مریم امیرمزلقانی | دانشیار گروه هوش مصنوعی و رباتیک دانشگاه امیرکبیر
🔸 شهره کسائی | استاد تمام دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
🔸 مصطفی توسلی‌پور | عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه تهران
🔸 سهیل تهرانی‌پور | مدیرعامل و متخصص هوش مصنوعی ساعیان ارتباط
🔸 مسعود کاویانی | دانشمند داده در صبا ایده (آپارات، فیلیمو، سینماتیکت)
🔸 محسن دارچینی | دکتری مهندسی کامپیوتر و استاد دانشگاه علم و صنعت
🔸 هادی عاشری | مدیر تیم هوش مصنوعی شرکت ارتباط فردا
🔸 احمدرضا هروی | مشاور تیم هوش مصنوعی Sensifai
🔸 جمال کزازی | مدرس مدعو همکاران سیستم و دانشگاه تهران
🔸 سینا رنج‌کش‌زاده | دانشجوی دکتری مهندسی مخابرات دانشگاه شریف - AI Developer
🔸 امین دهنوی | پژوهشگر هوش مصنوعی شرکت پارت
170 ساعت | آموزش آنلاین و آفلاین
💎 امکان کارآموزی در گروه همراه اول



🌐پیش‌ثبت‌نام #رایگان:
🔗 https://l.hamrah.academy/4wh

⭐️ @hamrah_academy | آکادمی همراه اول