DLeX: AI Python
21.5K subscribers
5.17K photos
1.25K videos
765 files
4.64K links
هوش‌مصنوعی و برنامه‌نویسی

توییتر :

https://twitter.com/NaviDDariya

تا آزادی ایران از جمهوری اسلامی تبهکار، تبلیغات نداریم.
Download Telegram
👉 @ai_python ✍️
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
با ویژگی btw که البته مخفف همون By the way هست، خیلی راحت می تونید وقتی که Claude Code داره کارش رو انجام می ده یه دونه /btw بذارید و ازش سوالات دیگه بپرسید :

👉 @ai_python 🦁 ☀️

https://x.com/trq212/status/2031506296697131352
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍6
This media is not supported in your browser
VIEW IN TELEGRAM
رباتی که پت سیتری هم بلده 💓

👉 @ai_python 🦁 ☀️

For an industrial robot built for the rigors of factories and power plants, tidying up a living room may seem like a light day at the office for Spot. Yet, this demonstration represents the promise of AI models in robotics. In this case, @GoogleDeepMind's visual-language model (VLM) Gemini Robotics-ER 1.5 was empowering Spot with embodied reasoning.
Go behind the scenes and watch the full demo in our blog: https://bosdyn.co/483K9JM

📎 Boston Dynamics (@ BostonDynamics) (https://x.com/BostonDynamics/status/2044069050347561172)
Please open Telegram to view this post
VIEW IN TELEGRAM
12🐳2👍1
در حالی که مدت زیادی هست که هواپیماها با اینترنت استارلینک به پهنای باند بالا متصل هستند، حکومت امام زمان از ترس مردم (الناس) کشور، اینترنت را برای مدت 54 روز است که قطع کرده است.

🖥 @elonfact 🙄
Please open Telegram to view this post
VIEW IN TELEGRAM
15💔21😭6🐳3
مدل Gemini Embedding 2 برای استفاده عرضه شد. این مدل از امبدینگ متن، تصویر، ویدیو و صدا، پشتیبانی می کند.

👉 @ai_python ✍️
Please open Telegram to view this post
VIEW IN TELEGRAM
1116👍3💔2😭2
به نظر می رسه که انتروپیک اداپتری به نام Introspection Adapters معرفی کرده که بهمون کمک می کنه مثل یک اسکن مغزی متوجه بشیم، مدل دقیقن از درون داره چیکار می کنه و چطور تصمیم می گیره

👉 @ai_python ✍️

لینک توییت :

https://x.com/bigsuey/status/2050002421259104281
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍4🐳2
This media is not supported in your browser
VIEW IN TELEGRAM
قدرت دیپ فیک هر روز خطرناک تر از قبل شده و این لزوم آگاهی بخشی، به خصوص به کودکان رو چند برابر می کنه.

👉 @ai_python ✍️

منبع ویدیو :

https://x.com/Patrick_Proemer/status/2050212718368424214
Please open Telegram to view this post
VIEW IN TELEGRAM
2🐳8💔7👍32
Media is too big
VIEW IN TELEGRAM
ادیت و تدوین ویدیو با استفاده از Claude AI نسخه دسکتاپ به راحتی آب خوردن ...

👉 @ai_python ✍️

منبع ویدیو برای دیدن محتوای بیش تر :

https://x.com/LouiseDSadeleer/status/2051652715617378655

لینک Skill معرفی شده در این ویدیو در گیت هاب :

https://github.com/louisedesadeleer/clipify
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍32
Media is too big
VIEW IN TELEGRAM
این دوتا ربات با کمک هم اتاق رو مرتب می کنن.

شرکت Figure

👉 @ai_python ✍️

لینک توییت : https://x.com/Figure_robot/status/2052770982214172892?s=20
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
DLeX: AI Python
این دوتا ربات با کمک هم اتاق رو مرتب می کنن. شرکت Figure 👉 @ai_python ✍️ لینک توییت : https://x.com/Figure_robot/status/2052770982214172892?s=20
آقای Corey Lynch در این باره خاطر نشان کردن که :

To be clear, there's no explicit messaging between these robots, they coordinate their actions fully visually, e.g. head nods.
2👍41
گوگل کروم هم قابلیت Skills اضافه کرده

👉 @ai_python ✍️

X
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍31
Forwarded from Reza Jafari
معرفی بنچمارک جدید ProgramBench : سخترین آزمون مهندسی نرم افزار برای LLMها

بنچمارک ProgramBench یه بنچمارک خیلی جدی و متفاوت برای ارزیابی توانایی LLMها در ساخت نرم‌افزار از صفره. ایده‌ی اصلیش اینه که ببینه آیا مدل‌های زبانی واقعاً می‌تونن فقط با داشتن یک executable و documentation، دوباره کل یک برنامه رو بازسازی کنن یا نه.

توی هر تسک، Agent فقط به فایل اجرایی برنامه و مستنداتش دسترسی داره؛ نه Source Code رو می‌بینه، نه اجازه‌ی decompile کردن داره و نه حتی اینترنت در اختیارشه. یعنی مدل باید دقیقاً مثل یه مهندس نرم‌افزار واقعی، رفتار برنامه رو بررسی کنه، Architecture طراحی کنه، Language انتخاب کنه، کل Source Code رو بنویسه و حتی Build Script هم بسازه.

این بنچمارک حدود ۲۰۰ تسک مختلف داره؛ از ابزارهای سبک command-line مثل jq و ripgrep گرفته تا پروژه‌های سنگین و پیچیده‌ای مثل PHP، FFmpeg و SQLite.

نکته‌ی مهم اینه که ProgramBench هیچ ساختار آماده‌ای به مدل نمی‌ده. خبری از method signature، class skeleton یا حتی توضیح درباره‌ی ساختار فایل‌ها نیست. Agent خودش باید تصمیم بگیره برنامه چطور modular بشه، چه abstractionهایی تعریف بشه و interfaceها چه شکلی باشن. همین باعث میشه این بنچمارک بیشتر از اینکه صرفاً coding رو بسنجه، توانایی واقعی software design و system architecture رو اندازه‌گیری کنه.

بعد از اینکه Agent برنامه رو تحویل می‌ده، یه test suite خیلی بزرگ رفتار نسخه‌ی ساخته‌شده رو با برنامه‌ی اصلی مقایسه می‌کنه. این تست‌ها با agent-driven fuzzing تولید شدن و در مجموع بیشتر از 248 هزار behavioral test روی ۲۰۰ تسک اجرا میشه. فقط وقتی همه‌ی تست‌ها پاس بشن، اون تسک «حل‌شده» حساب میشه.

یکی از جذاب‌ترین بخش‌های ProgramBench اینه که عمداً جلوی shortcutها و cheating گرفته شده. Agentها داخل sandbox اجرا میشن، اینترنت ندارن و حتی دسترسی read به binary هم ندارن؛ یعنی ابزارهایی مثل decompiler، disassembler یا objdump عملاً کار نمی‌کنن. هدف اینه که benchmark واقعاً توانایی “building from scratch” رو اندازه بگیره، نه سرهم کردن کدهای decompiled.

امتیازها فعلاً خیلی پایینن، ولی این خودش نشون می‌ده مسئله چقدر سخت و واقعی طراحی شده. با اینکه مدل‌ها روی خیلی از تسک‌ها partial progress دارن، ولی هنوز ساخت کامل و بدون نقص نرم‌افزارهای بزرگ برای AI یه چالش جدیه.

در کل، ProgramBench الان یکی از جدی‌ترین بنچمارک‌ها برای سنجش توانایی واقعی AI Agentها در Software Engineering محسوب میشه؛ جایی که فقط code generation مهم نیست، بلکه planning، architecture، debugging و understanding رفتار سیستم هم نقش اصلی رو دارن.

🔗 لینک سایت ProgramBench


👑 توضیحات در مورد دوره منتورینگ
🏆 نحوه ثبت‌نام در دوره منتورینگ
🤝 تجارب موفق قبلی بچه‌ها از منتورینگ

@reza_jafari_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
39👍6
😂😂😂

🖥 @elonfact 🙄
Please open Telegram to view this post
VIEW IN TELEGRAM
8🐳52