AI Labdon
475 subscribers
30 photos
4 videos
949 links
🕸 AI Labdon

بروز ترین مرجع خبری در مورد دنیایی هوش مصنوعی

حمایت مالی:
https://www.coffeete.ir/mrbardia72

ادمین:
@mrbardia72
Download Telegram
🔵 عنوان مقاله
Multimodal Embedding & Reranker Models with Sentence Transformers (8 minute read)

🟢 خلاصه مقاله:
بلی، در ادامه متن بازنویسی‌شده و ترجمه‌شده به زبان فارسی آورده شده است:

در نسخه ۵.۴ از مجموعه مدل‌های Sentence Transformers، امکانات جدیدی ارائه شده است که شامل مدل‌های جاسازی چندرسانه‌ای (مولتی‌مدال) و ریکانرهای پیشرفته می‌شود. این فناوری‌ها توانایی رمزگذاری و مقایسه متن‌ها، تصاویر، صداها و ویدئوها را در یک فضای جاسازی مشترک فراهم می‌کنند. هدف از این توسعه، بهبود عملکرد در وظایفی مانند جستجوی چندرسانه‌ای، بازیابی اطلاعات میان مدلی و تولید محتوا با کمک قابلیت‌های تصویربرداری از چندین قالب داده است.

این مدل‌های پیشرفته قادر هستند تا مدهای مختلف رسانه‌ای را در یک فضای یکنواخت قرار دهند و بر اساس آن، میزان ارتباط و تطابق میان جفت‌های چندرسانه‌ای را ارزیابی کنند. بر خلاف مدل‌های تک‌مدلی، که تنها بر یک نوع رسانه تمرکز دارند، این مدل‌ها می‌توانند روابط بین متن و تصویر، صدا و ویدئو، یا ترکیبی از همه اینها را نیز سنجش کنند. البته، در این فرآیند، ممکن است نمره‌های شباهت بین مدهای مختلف پایین‌تر از حالت‌های هم‌مدلی باشد، که این نتیجه به دلیل گروه‌بندی مدهای متفاوت در فضای جاسازی است.

نکته جذاب در این به‌روزرسانی، قابلیت‌های چندرسانه‌ای است که انطباق میان قالب‌های مختلف را تقویت می‌کند و امکانات جدیدی در زمینه جستجو و بازیابی اطلاعات فراهم می‌آورد. این فناوری، مرزهای میان مدهای گوناگون رسانه‌ای را کاهش داده و امکان توسعه برنامه‌ها و سیستم‌های هوشمند چندرسانه‌ای مؤثرتر را ممکن می‌سازد.

#هوش_مصنوعی #یادگیری_عمیق #رسانه_های_ترکیبی #مدل‌های_مولتی‌مدال

🟣لینک مقاله:
https://huggingface.co/blog/multimodal-sentence-transformers?utm_source=tldrai


👑 @ai_Labdon
🔵 عنوان مقاله
Continual learning for AI agents (4 minute read)

🟢 خلاصه مقاله:
در فرآیند یادگیری مستمر برای عوامل هوشمند مصنوعی، این امکان وجود دارد که یادگیری در سه لایه مختلف رخ دهد: لایه مدل، لایهHarness، و لایه زمینه یا Context. هر یک از این لایه‌ها نقش خاصی در بهبود و توسعه سیستم‌های هوش مصنوعی دارند و درک تفاوت‌های آن‌ها می‌تواند نحوه طراحی سیستم‌هایی که در طول زمان بهتر می‌شوند را تحت تأثیر قرار دهد.

لایه مدل شامل وزن‌ها و پارامترهای داخلی است که بر پایه داده‌های آموزش اولیه تنظیم می‌شود. این لایه مسئول حافظه بلندمدت و یادگیری‌های بنیادی سیستم است. در مقابل، لایه harness شامل کد، دستورات، و ابزارهای اجرایی است که عامل هوشمند را فعال و هدایت می‌کند. این قسمت وظیفه فراهم کردن محیط عملیاتی مناسب برای فعالیت‌های سیستم را بر عهده دارد. اما لایه زمینه یا Context، به اطلاعات و داده‌های خارجی و محیطی اشاره دارد که خارج از کد harness قرار دارد، ولی می‌تواند برای تنظیم و پیکربندی بهتر سیستم مورد استفاده قرار گیرد.

بسیاری از افراد زمانی که درباره یادگیری مستمر صحبت می‌کنند، تمرکز خود را بر روی به‌روزرسانی لایه مدل می‌گذارند. در حالی که در واقع، یک سیستم هوشمند می‌تواند در همه‌ی این سه لایه یادگیری داشته باشد و به تدریج توانایی‌های خود را توسعه دهد. بنابراین، درک درست و جامع این سه لایه برای طراحی سیستم‌های هوش مصنوعی پیشرفته‌تر و سازگارتر با شرایط مختلف حیاتی است و می‌تواند منجر به ساخت سیستم‌هایی شود که در طول زمان بهتر و هوشمندتر عمل می‌کنند.

#یادگیری_مستمر #هوش_مصنوعی #توسعه_سیستم_هوشمند #پیشرفت_در_هوش

🟣لینک مقاله:
https://blog.langchain.com/continual-learning-for-ai-agents/?utm_source=tldrai


👑 @ai_Labdon
🔵 عنوان مقاله
LLM Wiki (20 minute read)

🟢 خلاصه مقاله:
در این مقاله کوتاه، به مفهوم و کاربردهای ویکی ساخته شده با کمک الگوریتم‌های زبان بزرگ (LLMs) پرداخته می‌شود. این «فایل ایده» که قابل کپی و چسباندن در یک عامل (آگنت) LLM است، الگویی برای ساختن پایگاه‌های دانش مبتنی بر هوش مصنوعی ارائه می‌دهد. هدف از این سیستم، توسعه یک ویکیو دائم و مستمر است که مدل‌های زبان قادر به افزودن، بروزرسانی و نگهداری آن به صورت پیوسته باشند. در این ساختار، انسان نقش سرپرست منابع و مبدأ تحلیل‌ها را بر عهده دارد، سوال‌ها مطرح می‌کند، مسیرهای پژوهش را تعیین می‌نماید و درک کلی موضوعات را می‌سازد. در مقابل، مدل زبان بزرگ به عنوان دستیار، کارهای پژوهشی، ویرایش و ثبت تغییرات را انجام می‌دهد. این عامل، بر اساس گفتگو و تعاملات کاربر، تغییرات و ویرایش‌ها را اعمال می‌کند و کاربران می‌توانند این تغییرات را در زمان واقعی مشاهده و مرور کنند، که این فرایند دریافت و جمع‌بندی دانش را سریع‌تر و شفاف‌تر می‌کند.

#هوش_مصنوعی #دانش_پایگاه #هوش_مستمر #یادگیری_انسان_و_ماشین

🟣لینک مقاله:
https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f?utm_source=tldrai


👑 @ai_Labdon
🔵 عنوان مقاله
Google develops its own desktop Agent to compete with Cowork (3 minute read)

🟢 خلاصه مقاله:
گوگل اخیراً نسخه جدیدی از agents دسکتاپ خود را در قالب پروژه‌ی Gemini Enterprise معرفی کرده است. این توسعه نشان‌دهنده تمایل این شرکت به رقابت با پلتفرم‌هایی مانند Claude Cowork است، جایی که تمرکز بر تسهیل انجام وظایف در فضاهای کاری مجازی است. طراحی جدید رابط کاربری این ابزار شامل یک سوییچ با عنوان «نیاز به بازبینی انسانی» است که نشان می‌دهد گوگل قصد دارد امکانات نظارتی و کنترل بیشتری برای وظایف در سطح کامپیوتر را فراهم کند. این بروزرسانی‌ها نشانگر حرکت گوگل به سمت ایجاد یک بستر کاری جامع است، که ممکن است با AI Studio ادغام شده و یک محصول یکپارچه و قدرتمند را ارائه دهد. این تلاش‌ها نشان می‌دهد که غول فناوری به دنبال تقویت ابزارهای هوشمند خود برای بهبود کارایی و راهبردهای همکاری در محیط‌های کاری است.

#هوش_مصنوعی #نرم_افزارهای_دسکتاپ #تکنولوژی_هوشمند #گوگل

🟣لینک مقاله:
https://www.testingcatalog.com/google-develops-its-own-desktop-agent-to-compete-with-cowork/?utm_source=tldrai


👑 @ai_Labdon
🧠 یک ترفند ساده برای گرفتن جواب‌های دقیق‌تر از ChatGPT

▪️قبل از اینکه سؤال اصلیت رو بپرسی، این دو جمله رو برای ChatGPT بفرست:

Before answering, take a moment to recall the necessary facts step by step.

Organize the information in your working memory before generating the final answer.

▪️این دو دستور از مدل می‌خوان قبل از پاسخ دادن، اطلاعات مرتبط رو مرور و دسته‌بندی کنه؛ در نتیجه احتمال جا افتادن جزئیات کمتر میشه و جواب‌ها معمولاً منظم‌تر، دقیق‌تر و مرتبط‌تر با سؤال خواهند بود.

▪️البته معجزه نمیکنه ؛ ولی در خیلی از موارد باعث میشه مدل قبل از پاسخ، ساختار ذهنی بهتری برای جوابش بسازه و کمتر دچار پراکنده‌گویی بشه.
😨 باگ عجیب ChatGPT؛ وقتی هوش مصنوعی چیزی را می‌بیند که وجود ندارد!

▪️برخی کاربران به رفتار عجیبی در ابزار تولید تصویر ChatGPT برخورد کردند. ماجرا از جایی شروع میشه که مدل بدون دریافت هیچ تصویری، تلاش میکنه یک عکس «فرضی» رو بازسازی کنه ؛ اون هم با جزئیاتی که گاهی کاملاً عجیب، ناآشنا و حتی ترسناک به نظر میرسه.

▪️نکته جالب اینجاست که هیچ تصویر واقعی‌ای در اختیار مدل نیست؛ اما هوش مصنوعی به‌جای اینکه بگه «اطلاعات کافی ندارم»، بر اساس الگوهایی که قبلاً یاد گرفته شروع به حدس زدن و تولید محتوا میکنه.

+ این اتفاق نمونه‌ای از پدیده معروف «توهم هوش مصنوعی» هست ؛ جایی که مدل با اطمینان کامل چیزی رو تولید میکنه که در واقع وجود خارجی نداره.
🔥 بیاید شمارو با تکنیک RPP در پرامپت نویسی آشنا کنم...!

▪️این آموزش به قدری دست اوله که خود ChatGPT و Claude و Gemini هم بلد نیستن و اولین باره که باهاش روبه‌رو میشن 🤪

• اسم تکنیک:

Reverse Pyramid Prompting (RPP)

🌀 ببینید ، مدل‌های زبانی برعکس انسان فکر میکنن ← ما اول کلیات و بعد جزئیات رو درک میکنیم ، اما مدل‌ها وقتی اول جزئیات حیاتی رو بگیرن، خروجی‌شون چند برابر خلاق‌تر، دقیق‌تر و باکیفیت‌تر میشه.

حالا روش استفاده از این ترفند چیه؟!

به‌جای اینکه مثل 99% مردم مستقیم موضوع رو بگی ، مثلاً : یه پست درباره رژیم کتو بنویس

این ترتیب رو رعایت کن ↓

1) نتیجه نهایی رو بگو
2) معیارهای موفقیت رو مشخص کن
3) محدودیت‌ها + لحن و سبک
4) در آخر موضوع اصلی
گیتهاب سیستم استفاده از هوش مصنوعی GitHub Copilot برای کد زدن رو تغییر داده و در حالی که در گذشته هر کاربر تعداد درخواست ثابتی داشت که میتونست برای درخواستهای ساده تا بسیار بزرگ از اونها استفاده کنه ولی سیستم جدید، براساس توکنهای استفاده شده بنا شده که به هیچ وجه به صرفه نیست و داد کاربران زیادی رو دراورده.

در گذشته مثلا اشتراک 10 دلاری گیتهاب کوپایلت شامل 300 درخواست ماهانه به هوش مصنوعی های مختلف میشد و مثلا یک کاربر میتونست درخواست بسیار پیچیده ای که میتونست اجرای اون ساعتها طول میکشه رو به مدلهای گرانی همچون Opus بده و گیتهاب حداکثر مثلا اون درخواست رو با ضریب 15 حساب میکرد.

ولی حالا گران بودن یک مدل، تاثیر مستقیمی رو میزان استفاده از سهمیه داره و مثلا اشتراک پایه 10 دلاری گیتهاب، حدود 15 دلار استفاده از مدلهای مختلف رو شامل میشه و ممکنه حالا کاربران با یک درخواست به Claude، کل سهمیه یک ماهشون رو تموم کنن!

با سیستم قبلی عملا مایکروسافت برای درخواست پیچیده کاربران سوبسید میداد تا کاربران رو جذب سرویسش کنه ولی حالا با افزایش هزینه های هوش مصنوعی، این شرکت هزینه مدلهای هوش مصنوعی رو بدون سوبسید خاصی روی دوش کاربران قرار میده که باعث میشه استفاده از این سرویس مثل گذشته به صرفه نباشه.

به دلیل این تغییر کاربران زیادی قصد لغو اشتراکشون و مهاجرت به سرویس های دیگه مثل OpenCode Go و اشتراکهای Codex و Claude Code دارن که کماکان درخواستهای کاربران رو با سوبسید حساب میکنن.

بقیه هم این واقعیت جدید استفاده از مدلهای هوش مصنوعی رو قبول کردن و درخواستهاشون رو با دقت بیشتر و با استفاده از مدلهای بسیار ارزانتر مثل Deepseek V4 انجام میدن.
شاهکار جدید گوگل برای اجرای آفلاین هوش مصنوعی: Gemma 4 QAT

مدل‌های جدید Gemma 4 انقدر هوشمندانه فشرده شدن که کوچیک‌ترین نسخه‌ش کمتر از ۱ گیگابایت رم می‌خواد و راحت روی گوشی موبایل اجرا می‌شه. بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.

| <Behrad Javed/>
🔵 عنوان مقاله
Lovable Payments lets you monetize websites via chat (1 minute read)

🟢 خلاصه مقاله:
پلتفرم Lovable Payments به کاربران امکان می‌دهد تا با استفاده از چت، سایت‌های خود را به‌طور مستقیم درآمدزایی کنند. این سیستم یک قابلیت پرداخت داخلی دارد که به کاربران اجازه می‌دهد محصولات خود را از طریق گفت‌وگو در سایت به فروش برسانند. کاربران می‌توانند در گفت‌وگو، توضیحاتی درباره‌ی کالا، قیمت و دارایی‌ها را وارد کنند و پس از فعال‌سازی ادغام پرداخت‌ها و تکمیل جزئیات مربوط به تطابق، بدون نیاز به تنظیمات پیچیده خارجی، سایت خود را منتشر کنند. این سیستم همچنین امکانات تحلیلی ارائه می‌دهد، مانند میزان درآمد ماهانه‌تکراری (MRR) و داده‌های فروش بر اساس مناطق جغرافیایی، که از طریق چت در اختیار کاربران قرار می‌گیرد و به آن‌ها کمک می‌کند تا کارایی فروش خود را بهتر مدیریت کنند.

در کل، Lovable Payments یک راهکار جامع و آسان برای کسب‌وکارهای آنلاین است تا با ابزارهای ساده در کنار تجربه کاربری بهتر، فرآیند فروش و تحلیل داده‌های خود را بهبود بخشند، بدون نیاز به زیرساخت‌های پیچیده.

#پرداخت_درمانی #فروش_آنلاین #تحلیل_فروش #کسب_و_کار

🟣لینک مقاله:
https://x.com/robiot/status/2043782837971890279?utm_source=tldrai


👑 @ai_Labdon
🔥 مدل هوش مصنوعی Gemma 4 QAT معرفی شد؛ برگ برنده گوگل که فقط یک گیگابایت حافظه رم می‌خواهد

🚀 گوگل مدل جدید Gemma 4 QAT را معرفی کرد؛ یک هوش مصنوعی آفلاین که تنها به حدود 1 گیگابایت رم نیاز دارد! نسخه جدید Gemma 4 با فناوری Quantization-Aware Training (QAT) توسعه یافته تا در عین کاهش شدید حجم، کیفیت پاسخ‌ها را حفظ کند.

📌 جالب‌تر اینکه نسخه E2B این مدل با کمتر از 1GB حافظه اجرا می‌شود و حتی روی برخی گوشی‌های هوشمند و لپ‌تاپ‌های قدیمی نیز قابل استفاده است.

گوگل می‌گوید این مدل‌ها برای اجرای محلی روی ابزارهایی مانند llama.cpp، Ollama، LiteRT-LM، vLLM و MLX بهینه شده‌اند و اکنون نسخه‌های Q4_0 و موبایل آن از طریق Hugging Face قابل دانلود هستند.

⚡️ اگر این ادعاها در عمل هم درست باشند، اجرای یک مدل زبانی قدرتمند روی دستگاه‌های معمولی بدون نیاز به اینترنت یا سخت‌افزار گران‌قیمت، بیش از هر زمان دیگری در دسترس خواهد بود.
2
انویدیا اومده دسترسی به API بیش از ۷۰ مدل زبانی رو رایگان و بدون محدودیت در اختیار همه گذاشته. یعنی همون چیزی که تا دیروز باید بابتش دلار $$$ می‌دادی و حساب‌وکتاب توکن ها رو می‌کردی، الان رایگان جلوی دستته. می‌تونی تست کنی، بسازی، آزمایش کنی، خراب کنی و دوباره بسازی، بدون اینکه نگران پولش باشی.
این جنس فرصت‌ها معمولاً عمر کوتاهی دارن. شرکت‌ها این کارو می‌کنن تا اکوسیستم بسازن و توسعه‌دهنده جذب کنن، ولی هیچ‌وقت معلوم نیست تا کی روی همین مدل رایگان می‌مونه. پس تا فرصت هست بشتابید!

اگه دنبال یادگیری مدل‌های زبانی هستی، اگه می‌خوای یه ایده رو پروتوتایپ کنی، یا فقط می‌خوای ببینی این همه سروصدا سر چیه، این بهترین زمانشه که دست به کار شی.
لینک دسترسی رو زیر همین پست می‌ذارم. اگه براتون مفید بود، یه ری‌پست کنید تا به دست بقیه هم برسه.

https://build.nvidia.com/models
<Reza Tashtboland/>
1
سرویس‌های ایرانی برای اجاره کارت گرافیک (GPU) جهت پژوهش، دانشجویی و پروژه‌های هوش مصنوعی
اگر برای آموزش مدل‌های هوش مصنوعی، رندرینگ، پردازش‌های سنگین یا کارهای پژوهشی نیاز به کارت گرافیک‌ دارید، این سرویس‌های ایرانی امکان اجاره GPU را به‌صورت ساعتی یا ماهانه فراهم کرده‌اند:
ابر فردوسی (Ferdowsi Cloud)
https://ferdowsi.cloud/fa
ارائه GPU برای پردازش‌های سنگین با امکان اجاره ساعتی. برای دانشجوها و تست پروژه‌ها گزینه مناسبی است.
IranGPU
https://irangpu.com
ارائه سرورهای GPU برای استفاده‌های طولانی‌مدت و پروژه‌های جدی‌تر هوش مصنوعی.
ابررایانه شریف (HPC Sharif)
https://hpc.sharif.ir/costs
زیرساخت پردازش قدرتمند دانشگاه شریف با قیمت ساعتی مناسب برای پردازش‌های علمی و پژوهشی.
ابر سیمرغ
https://simorgh.cloud
مرکز پردازش فوق سریع با GPUهای قدرتمند مانند A100 ،V100 و RTX 3090. ارائه سرویس‌های مختلف مثل GPU as a Service و AI Platform برای پروژه‌های تحقیقاتی و صنعتی.
آروان کلاد (ArvanCloud GPU Server)
https://www.arvancloud.ir/fa/products/gpu-server
ارائه سرورهای GPU روی زیرساخت ابری با پلن‌های ماهانه. کارت‌ها معمولا متوسط‌تر هستند اما برای بسیاری از پروژه‌ها کافی‌اند.
ایران‌سرور (GPU VPS)
https://www.iranserver.com/vps/gpu
سرورهای GPU قدرتمند با پلن‌های ماهانه؛ بیشتر مناسب شرکت‌ها و پروژه‌های بزرگ به دلیل قیمت بالاتر.
اگر لینک‌ها در بله باز نشدند، لینک را کپی کنید و داخل مرورگر (مثل Google Chrome) پیست کنید.
یکی از مباحثی که خیلی بهش علاقه دارم knowledge graph و استفاده‌اش توی Agent Memory‌ه.
معمولاً سیستم‌های مموری entity ها رو جداگانه ذخیره می‌کنن و رابطه بینشون رو به‌صورت ضمنی (مثلاً از طریق embedding similarity) نگه می‌دارن. مشکل اینجاست که این رابطه‌ها نه explicit‌ان نه typed.

knowledge graph این مشکل رو حل می‌کنه: entity ها رو تبدیل می‌کنه به node و رابطه‌شون رو به‌صورت edge‌های معنادار نگه می‌داره (مثلاً "کار می‌کنه در" یا "دوست است با"). با گذر زمان، یه شناخت واقعی از محیط پیرامون کاربر شکل می‌گیره.
متأسفانه ساختن همچین گرافی ساده نیست و بعد از مدتی پیچیدگی‌اش اونقدر زیاد می‌شه که نگهداری‌اش دیگه اقتصادی نیست.
یکی از سیستم‌هایی که خوب از این ایده استفاده کرده (هرچند نه دقیقاً برای همین منظور) Obsidian‌ه.
اخیراً برای نوت‌برداری از http://mem.ai استفاده می‌کنم و به نظر می‌رسه این هم مفهوم رو خوب پیاده‌سازی کرده: نوت‌ها رو پروسس می‌کنه، یواش‌یواش گراف رو می‌سازه، و بعد جایگذاری نوت‌های جدید توی گراف خیلی خوب جواب می‌ده.
یه قابلیت جالب دیگه‌اش (که Zoom Agent و Granola هم دارن) اینه که از audio device مک استفاده می‌کنه تا میتینگ‌های آنلاین رو رکورد کنه، تبدیل به نوت کنه، و توی همون سیستم مرتبشون کنه.

البته تازه شروع کردم و هنوز صد درصد مطمئن نیستم که در طولانی مدت هم کار کنه.

اگه علاقه دارید https://github.com/getzep/graphiti پروژه خیلی خوبیه که داره روی این موضوع کار می‌کنه.

| <وحیدیدو/>
چند وقت پیش شرکت انتروپیک از هوش مصنوعی Mythos رونمایی کرد که در پیدا کردن حفره های امنیتی قدرت خاصی داشت و به دلیل ریسکهای امنیتی که چنین مدلی قدرتمندی به همراه میاره، اون رو فقط در اختیار شرکتهای خاصی از جمله شرکتهای امنیتی برای پیدا کردن حفره های امنیتی زیرساختها قرار داد.

حالا انتروپیک نسخه عمومی این مدل به نام Claude Fable 5 رو عرضه کرده که مدلی در کلاس Mythos هست و در کدنویسی، پیدا کردن مشکلات امنیتی و بیولوژی مهارت خاصی داره.

اما انتروپیک استفاده از این مدل رو برای پیدا کردن حفره های امنیتی و بیولوژی محدود کرده در نتیجه کاربران عادی در هنگام استفاده از این مدل برای این کاربردها با خطا روبرو میشن یا درخواست اونها به مدل Opus 4.8 پاس داده میشه.

مدل Fable 5 از حالا تا 1 تیر، در اشتراک Pro به بالای Claude در دسترس خواهد بود و بعد از اون فقط از طریق API میشه از اون استفاده کرد تا وقتی که انتروپیک بتونه ظرفیت محاسباتی لازم برای اون به دست بیاره و اون رو دوباره در اختیار مشترکینش قرار بده.

🔎 techcrunch
کدوم هوش مصنوعی برای استفاده روزمره بهتره؟

▪️اگر دنبال یک مدل همه‌فن‌حریف هستید، GPT-5.5 هنوز یکی از بهترین انتخاب‌هاست. از تولید محتوا و ترجمه گرفته تا تحلیل اطلاعات، برنامه‌ریزی و یادگیری، تقریباً در همه زمینه‌ها عملکرد قدرتمندی داره.

1⃣ رتبه اول GPT-5.5
انتخاب اول برای اکثر کاربران

2⃣ رتبه دوم Claude Opus 4.8
فوق‌العاده در استدلال، تحلیل عمیق و کارهای پژوهشی

3⃣ رتبه سوم Gemini 3.1 Pro
مناسب برای کار با فایل‌ها، اسناد حجیم و اکوسیستم گوگل

4⃣ رتبه چهارم Qwen 3.7 Max
عملکرد نزدیک به مدل‌های پرچمدار با هزینه کمتر

5⃣ رتبه پنجم Kimi K2.6
یکی از بهترین گزینه‌ها از نظر ارزش در برابر هزینه

+ نکته جالب اینجاست که فاصله مدل‌های برتر نسبت به گذشته کمتر شده و حالا انتخاب بهترین مدل بیشتر به نوع استفاده شما بستگی داره تا صرفاً رتبه‌بندی‌ها.
⁉️ تا حالا شده فکر کنی ChatGPT احمق شده...؟!

🌀 اینکه یه همچین اتفاقی میفته نه به این معنیه که تو داری اشتباه میکنی و نه به این معنیه که اون داره اشتباه میکنه ؛ باید یادش بدی چطور باهات مچ بشه!

خب حالا چیکار کنم؟! برو تو تنطیمات و بخش Personalization ... اونجا چندتا شخصیت داره که اینجا باهم مرورش میکنیم :

1⃣ شخصیت Default : خنثی و محافظه کار

2⃣ شخصیت Cynic : شکاک و منتقد
(واسه ایده پردازی این Cynic عالیه)

3⃣ شخصیت Robot : خشک و دقیق
(واسه برنامه نویسا این یکی خیلی عالیه)

4⃣ شخصیت Listener : احساسی و همدل
(برای گفت‌و‌گو و روانشناسی پیشنهاد میکمم)

5⃣ شخصیت Nerd : پرحرف و باهوش
(واسه آموزش ، تحلیل کار های پیچیده خوبه)

🔹این کارارو که کردی بعدش برو تو بخش Custom Instructions و اینجا باید بهش بگی کی هستی و چی میخوای ... مثلا :

• Creative Co - Writer → هم نویس و خلاق
• Startup Advisor → مشاور و استارتاپ
• Though Coach → ساکته و بیشتر گوش میده
• Devil's Advocate → تورو به چالش میکشه

شرکت انتروپیک خیلی وقت هست که استفاده از مدلهای هوش مصنوعی این شرکت برای توسعه مدلهای رقیب رو در قوانینش ممنوع کرده ولی اعمال این قوانین تنها وابسته به میل استفاده کننده به رعایت این قوانین بود.

ولی حالا با عرضه مدل Fable 5، این شرکت پا رو از این هم فراتر گذاشته و اقدامات حفاظتی جدیدی رو در دل مدل اضافه کرده به طوری که وقتی این مدل تشخیص بده که استفاده کننده در حال توسعه مدل های هوش مصنوعی و یا پیاده سازی اونها در مقیاس وسیع هست، به طور مخفیانه کدهایی که مینویسه ضعیف هستن و درخواست استفاده کننده رو درست پیاده نمیکنن، بدون اینکه اون فرد از انجام اینکار باخبر باشه!

علاوه بر این انتروپیک تمام درخواستها و جوابی که مدل Fable 5 به درخواستها میده رو بهانه های حفظ امنیت و جلوگیری از جیل بریک کردن مدل، جمع اوری میکنه و حتی سازمانها و شرکتهای بزرگ که قوانین بسیار سخت گیرانه ای روی انتقال و حفظ اطلاعات دارن هم از این قاعده مستنثی نیستن و در صورت تمایل به استفاده از این مدل باید این شرط رو بپذیرن.

🔎 jonready
مدل جدید Claude Fable 5 چیه؟

آنتروپیک تو فروردین یک مدلی داد به اسم Mythos که خیلی مدل قدرتمندی بود ولی مشکل ایمنی داشت، به همین خاطر آنتروپیک مجبور شد به خاطر قابلیت‌های پیشرفته‌ی cybersecurity، دسترسی بهش رو محدود کنه.

حالا Fable 5 همون قدرت Mythos رو داره، ولی با safeguard‌هایی که جلوی استفاده‌ی مخرب در حوزه‌های پرخطر مثل cybersecurity و biology رو می‌گیره.

در حوزه‌های پرخطر مثل cybersecurity، biology، chemistry و distillation، مدل جواب نمیده و به جاش با Claude Opus 4.8 جواب رو میده.

از قابلیت‌های کلیدی این مدل اینه که می‌تونه اعداد دقیق از عکس‌های علمی استخراج کنه یا تسک‌های پیچیده‌ای مثل ساختن سورس کد یه وب‌اپ فقط از روی اسکرین‌شات رو با کیفیت بالا انجام بده.

دیاگرام، چارت‌ها و جداول داخل PDF و فایل رو هم میفهمه که برای کارهایی تو حوزه‌های حقوقی، اقتصادی و آماری خیلی به کار میاد و مفیده.

تا 23 June برای کسایی که پلن‌های Team، Pro، Max و Enterprise دارن بدون هزینه قابل استفاده‌س ولی بعدش نیاز به credit داره.

قیمتش سر به فلک می‌کشه و 10 دلار برای ورودی و 50 دلار برای توکن‌های خروجیه.

در مجموع مدل به شدت قوی از نوع Mythos که آنتروپیک گفته تونسته کنترلش کنه تا باهاش کارهای مخرب انجام ندن.