Forwarded from زندگی به عنوان سرویس
این مقاله الف تا یای مدلهای زبانی رو توی خودش جا داده. از جمع آوری و آمادهسازی داده گرفته تا آموزش مدل و فاینتیون کردن و دیپلوی کردن روی پروداکشن و بهبود پرفورمنس. پیشنهاد میکنم یه نگاه چشمی هم شده بهش بندازید.
🖇 لینک مقاله
#LLM
#Generative_AI
#paper
🆔 @lifeAsAService
🖇 لینک مقاله
#LLM
#Generative_AI
#paper
🆔 @lifeAsAService
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Qwen-Image-Edit — ابزار جدید و هوشمند برای ویرایش تصاویر از Qwen
حالا دیگه فقط تولید تصویر نیست — میتونی مستقیماً با دستور، عکس رو ویرایش کنی: تغییر اشیاء، استایل، پسزمینه یا حتی متن روی تصویر!
قابلیتها:
✨ تغییر معنا و جزئیات — مثلاً میتونی شیء رو بچرخونی، رنگ یا سبک رو عوض کنی بدون اینکه بقیه بخشها خراب بشن.
🔤 ویرایش متن روی تصویر — اضافه کردن، حذف یا تغییر نوشتهها به انگلیسی و چینی، با حفظ فونت و استایل.
🏆 نتایج برتر در تستها — این مدل در بین ابزارهای متنباز عملکرد سطح بالا نشون داده.
چطور کار میکنه؟
ترکیب مدل درک تصویر (VL) و کدگذار VAE باعث میشه هم معنا و هم جزئیات عکس بعد از ویرایش حفظ بشه.
🟢 چطور امتحان کنیم؟
کافیه وارد Qwen Chat بشی و حالت Image Editing رو انتخاب کنی.
#qwen #ml #llm #ai
حالا دیگه فقط تولید تصویر نیست — میتونی مستقیماً با دستور، عکس رو ویرایش کنی: تغییر اشیاء، استایل، پسزمینه یا حتی متن روی تصویر!
قابلیتها:
✨ تغییر معنا و جزئیات — مثلاً میتونی شیء رو بچرخونی، رنگ یا سبک رو عوض کنی بدون اینکه بقیه بخشها خراب بشن.
🔤 ویرایش متن روی تصویر — اضافه کردن، حذف یا تغییر نوشتهها به انگلیسی و چینی، با حفظ فونت و استایل.
🏆 نتایج برتر در تستها — این مدل در بین ابزارهای متنباز عملکرد سطح بالا نشون داده.
چطور کار میکنه؟
ترکیب مدل درک تصویر (VL) و کدگذار VAE باعث میشه هم معنا و هم جزئیات عکس بعد از ویرایش حفظ بشه.
🟢 چطور امتحان کنیم؟
کافیه وارد Qwen Chat بشی و حالت Image Editing رو انتخاب کنی.
#qwen #ml #llm #ai
🚀 تیم Qwen از بزرگترین مدل خودش رونمایی کرد: Qwen3-Max-Preview (Instruct) با بیش از ۱ تریلیون پارامتر.
📊 طبق بنچمارکها، این مدل از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 قویتره.
🗣️ تستهای داخلی و اولین بازخوردها نشون میده که مدل توی دیالوگ، اجرای وظایف عاملمحور، پیروی از دستورها و گسترهی دانش پیشرفت چشمگیری داشته.
🔮 تیم Qwen قول داده بهزودی خبرهای جذابتری منتشر کنه.
🟢 Qwen Chat: https://chat.qwen.ai
🟢 Alibaba Cloud API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview
#هوش_مصنوعی #Qwen3 #LLM #AlibabaCloud #QwenChat
📊 طبق بنچمارکها، این مدل از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 قویتره.
🗣️ تستهای داخلی و اولین بازخوردها نشون میده که مدل توی دیالوگ، اجرای وظایف عاملمحور، پیروی از دستورها و گسترهی دانش پیشرفت چشمگیری داشته.
🔮 تیم Qwen قول داده بهزودی خبرهای جذابتری منتشر کنه.
🟢 Qwen Chat: https://chat.qwen.ai
🟢 Alibaba Cloud API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview
#هوش_مصنوعی #Qwen3 #LLM #AlibabaCloud #QwenChat
❤1
⚡️ Ling-flash-2.0 در دسترس عموم قرار گرفت! ⚡️
🔹 مدل با ۱۰۰ میلیارد پارامتر، اما تنها ≈۶.۱B فعال — فوقالعاده بهینه در مصرف منابع
🔹 آموزشدیده با بیش از ۲۰ تریلیون توکن + مراحل RL و فاینتیونینگ
🔹 بهترین عملکرد در بین مدلهای تا ۴۰B، بهخصوص در استدلال پیچیده، تولید کد و تسکهای فرانتاند
🔹 معماری MoE با فعالسازی 1/32 پارامترها، به همراه تکنیکهای پیشرفته مسیریابی و تعادل توجه
🔹 سرعت: تولید ۲۰۰+ توکن در ثانیه روی H20 (۳ برابر سریعتر از مدلهای متراکم 36B)
🔹 پشتیبانی از کانتکست تا ۱۲۸K توکن (با YaRN)
#moe #llm #ml #ai #opensource
🔹 مدل با ۱۰۰ میلیارد پارامتر، اما تنها ≈۶.۱B فعال — فوقالعاده بهینه در مصرف منابع
🔹 آموزشدیده با بیش از ۲۰ تریلیون توکن + مراحل RL و فاینتیونینگ
🔹 بهترین عملکرد در بین مدلهای تا ۴۰B، بهخصوص در استدلال پیچیده، تولید کد و تسکهای فرانتاند
🔹 معماری MoE با فعالسازی 1/32 پارامترها، به همراه تکنیکهای پیشرفته مسیریابی و تعادل توجه
🔹 سرعت: تولید ۲۰۰+ توکن در ثانیه روی H20 (۳ برابر سریعتر از مدلهای متراکم 36B)
🔹 پشتیبانی از کانتکست تا ۱۲۸K توکن (با YaRN)
#moe #llm #ml #ai #opensource
🎉 مدل Qwen3-VL حالا در llama.cpp هم قابل استفاده است!
این یعنی میتوانید مدل را مستقیماً روی سیستم خودتان اجرا کنید — با پشتیبانی از CPU، CUDA، Metal، Vulkan و سایر بکاندها. 🚀
📦 وزنهای GGUF برای همه نسخهها — از ۲B تا ۲۳۵B — در دسترساند.
قابل اجرا بهصورت آفلاین و بدون نیاز به سرویسهای ابری یا اتصال خارجی.
🔗 لینکها:
🔗 Hugging Face (مجموعه کامل مدلها):
👉 https://huggingface.co/collections/Qwen/qwen3-vl
🔗 ModelScope (مدلها و نسخههای مختلف):
👉 https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b
🔗 افزوده شدن Qwen3-VL به llama.cpp در GitHub (کد و جزئیات اجرا):
👉 https://github.com/ggerganov/llama.cpp/pull/16780
#Qwen3 #LLM
این یعنی میتوانید مدل را مستقیماً روی سیستم خودتان اجرا کنید — با پشتیبانی از CPU، CUDA، Metal، Vulkan و سایر بکاندها. 🚀
📦 وزنهای GGUF برای همه نسخهها — از ۲B تا ۲۳۵B — در دسترساند.
قابل اجرا بهصورت آفلاین و بدون نیاز به سرویسهای ابری یا اتصال خارجی.
🔗 لینکها:
🔗 Hugging Face (مجموعه کامل مدلها):
👉 https://huggingface.co/collections/Qwen/qwen3-vl
🔗 ModelScope (مدلها و نسخههای مختلف):
👉 https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b
🔗 افزوده شدن Qwen3-VL به llama.cpp در GitHub (کد و جزئیات اجرا):
👉 https://github.com/ggerganov/llama.cpp/pull/16780
#Qwen3 #LLM
👍2
🚀 معرفی Gemma 4 12B؛ مدل چندوجهی جدید گوگل
مدل Gemma 4 12B از ورودیهای متنی، صوتی و تصاویر استخراجشده از ویدئو پشتیبانی میکند.
🔹 حداکثر طول ویدئو: ۳۰ ثانیه
🔹 حداکثر طول فایل صوتی: ۶۰ ثانیه
🔹 دارای قابلیت استدلال (Reasoning)
🔹 پنجره متنی (Context Window) برابر با ۲۵۶ هزار توکن
🔹 منتشرشده تحت مجوز Apache 2.0
✨ نکته جالب این نسخه در اغلب مدلهای چندوجهی، برای پردازش تصاویر و صدا به یک «انکودر» (Encoder) جداگانه نیاز است. اما در Gemma 4 12B این قابلیت با استفاده از پروجکشنهای خطی ساده (Linear Projections) پیادهسازی شده است؛ روشی که به پارامترها و توان محاسباتی کمتری نیاز دارد.
📄 متأسفانه هنوز گزارش فنی (Technical Report) این مدل منتشر نشده است؛ بنابراین جزئیات نحوه آموزش این معماری جدید مشخص نیست. انتظار میرود همانند مدل بزرگتر Gemma 4 124B در آینده اطلاعات بیشتری درباره آن منتشر شود.
#هوش_مصنوعی #Gemma #GoogleAI #LLM #Multimodal #AINews
مدل Gemma 4 12B از ورودیهای متنی، صوتی و تصاویر استخراجشده از ویدئو پشتیبانی میکند.
🔹 حداکثر طول ویدئو: ۳۰ ثانیه
🔹 حداکثر طول فایل صوتی: ۶۰ ثانیه
🔹 دارای قابلیت استدلال (Reasoning)
🔹 پنجره متنی (Context Window) برابر با ۲۵۶ هزار توکن
🔹 منتشرشده تحت مجوز Apache 2.0
✨ نکته جالب این نسخه در اغلب مدلهای چندوجهی، برای پردازش تصاویر و صدا به یک «انکودر» (Encoder) جداگانه نیاز است. اما در Gemma 4 12B این قابلیت با استفاده از پروجکشنهای خطی ساده (Linear Projections) پیادهسازی شده است؛ روشی که به پارامترها و توان محاسباتی کمتری نیاز دارد.
📄 متأسفانه هنوز گزارش فنی (Technical Report) این مدل منتشر نشده است؛ بنابراین جزئیات نحوه آموزش این معماری جدید مشخص نیست. انتظار میرود همانند مدل بزرگتر Gemma 4 124B در آینده اطلاعات بیشتری درباره آن منتشر شود.
#هوش_مصنوعی #Gemma #GoogleAI #LLM #Multimodal #AINews
🚀 انتشار GLM 5.2 با پنجره متنی یک میلیون توکنی
نسخه جدید GLM 5.2 منتشر شد و مهمترین ویژگی آن، افزایش طول کانتکست به ۱ میلیون توکن است.
🧠 برای دستیابی به این پنجره متنی بسیار بزرگ، تغییراتی در معماری مدل اعمال شده است. این قابلیت به مدل اجازه میدهد اسناد بسیار طولانی، کدهای حجیم و مکالمات گسترده را بهصورت یکجا پردازش کند.
📌 نکات مهم این نسخه:
طول کانتکست: ۱٬۰۰۰٬۰۰۰ توکن
مدل چند روزی بود که در سرویس اشتراکی در دسترس قرار داشت.
اکنون بهصورت رسمی، پست فنی، وزنهای مدل و دسترسی API نیز منتشر شدهاند.
قیمت استفاده از API تغییری نکرده است.
💰 هزینه استفاده همچنان برابر است با:
۱٫۴ دلار برای هر یک میلیون توکن ورودی
۴٫۴ دلار برای هر یک میلیون توکن خروجی
🔓 همچنین وزنهای مدل با مجوز MIT منتشر شدهاند که امکان استفاده و توسعه آزادتر را برای پژوهشگران و توسعهدهندگان فراهم میکند.
⚡ با افزایش طول کانتکست به یک میلیون توکن، GLM 5.2 وارد رقابت مستقیم با مدلهایی شده که بر پردازش اسناد و حافظه طولانیمدت تمرکز دارند.
#هوش_مصنوعی #GLM #LLM #AI #OpenSource #MachineLearning #TechNews
نسخه جدید GLM 5.2 منتشر شد و مهمترین ویژگی آن، افزایش طول کانتکست به ۱ میلیون توکن است.
🧠 برای دستیابی به این پنجره متنی بسیار بزرگ، تغییراتی در معماری مدل اعمال شده است. این قابلیت به مدل اجازه میدهد اسناد بسیار طولانی، کدهای حجیم و مکالمات گسترده را بهصورت یکجا پردازش کند.
📌 نکات مهم این نسخه:
طول کانتکست: ۱٬۰۰۰٬۰۰۰ توکن
مدل چند روزی بود که در سرویس اشتراکی در دسترس قرار داشت.
اکنون بهصورت رسمی، پست فنی، وزنهای مدل و دسترسی API نیز منتشر شدهاند.
قیمت استفاده از API تغییری نکرده است.
💰 هزینه استفاده همچنان برابر است با:
۱٫۴ دلار برای هر یک میلیون توکن ورودی
۴٫۴ دلار برای هر یک میلیون توکن خروجی
🔓 همچنین وزنهای مدل با مجوز MIT منتشر شدهاند که امکان استفاده و توسعه آزادتر را برای پژوهشگران و توسعهدهندگان فراهم میکند.
⚡ با افزایش طول کانتکست به یک میلیون توکن، GLM 5.2 وارد رقابت مستقیم با مدلهایی شده که بر پردازش اسناد و حافظه طولانیمدت تمرکز دارند.
#هوش_مصنوعی #GLM #LLM #AI #OpenSource #MachineLearning #TechNews
🚀 انتشار Kimi K2.7 Code؛ سریعتر و بهینهتر برای برنامهنویسی
نسخه جدید Kimi K2.7 Code منتشر شد و طبق اعلام توسعهدهندگان، عملکرد آن در برنامهنویسی نسبت به نسخه قبلی بهبود یافته است.
💻 مهمترین تغییرات این نسخه:
🔹 عملکرد بهتر در وظایف کدنویسی نسبت به K2.6
🔹 مصرف حدود ۳۰٪ توکن کمتر برای دستیابی به همان نتایج یا حتی نتایج بهتر
🔹 حفظ همان مجوز انتشار نسخههای قبلی
⚙️ این مدل همچنان دارای حدود یک تریلیون پارامتر است؛ موضوعی که میزبانی و اجرای آن روی سختافزار شخصی را بسیار دشوار میکند و استفاده از زیرساختهای قدرتمند را ضروری میسازد.
📈 بهبود کیفیت کدنویسی همراه با کاهش مصرف توکن، میتواند هزینه استفاده از مدل را کاهش داده و بهرهوری توسعهدهندگان را افزایش دهد.
🌐 انتشار این مدل بار دیگر نشان میدهد که مدلهای متنباز و آزاد در حوزه هوش مصنوعی با سرعت زیادی در حال نزدیک شدن به مدلهای تجاری و بسته هستند.
#هوش_مصنوعی #Kimi #Coding #LLM #OpenSource #Programing #AI #TechNews
نسخه جدید Kimi K2.7 Code منتشر شد و طبق اعلام توسعهدهندگان، عملکرد آن در برنامهنویسی نسبت به نسخه قبلی بهبود یافته است.
💻 مهمترین تغییرات این نسخه:
🔹 عملکرد بهتر در وظایف کدنویسی نسبت به K2.6
🔹 مصرف حدود ۳۰٪ توکن کمتر برای دستیابی به همان نتایج یا حتی نتایج بهتر
🔹 حفظ همان مجوز انتشار نسخههای قبلی
⚙️ این مدل همچنان دارای حدود یک تریلیون پارامتر است؛ موضوعی که میزبانی و اجرای آن روی سختافزار شخصی را بسیار دشوار میکند و استفاده از زیرساختهای قدرتمند را ضروری میسازد.
📈 بهبود کیفیت کدنویسی همراه با کاهش مصرف توکن، میتواند هزینه استفاده از مدل را کاهش داده و بهرهوری توسعهدهندگان را افزایش دهد.
🌐 انتشار این مدل بار دیگر نشان میدهد که مدلهای متنباز و آزاد در حوزه هوش مصنوعی با سرعت زیادی در حال نزدیک شدن به مدلهای تجاری و بسته هستند.
#هوش_مصنوعی #Kimi #Coding #LLM #OpenSource #Programing #AI #TechNews
6️⃣ Large Action Models
مدلهایی که علاوه بر تولید متن، قادر به اجرای کد، فراخوانی APIها و انجام وظایف بهصورت خودکار هستند.
7️⃣ Hierarchical Language Models
این مدلها مسائل پیچیده را به چندین زیرمسئله تقسیم میکنند و برای برنامهریزی بلندمدت و مدیریت وظایف چندمرحلهای کاربرد دارند.
8️⃣ Large Concept Models
مدلهایی که روی مفاهیم انتزاعی و دانش سطح بالا تمرکز دارند و میتوانند درک و تعمیم بهتری از مفاهیم جدید ارائه دهند.
💡 نکته مهم این است که «عامل هوش مصنوعی» دیگر یک مفهوم واحد نیست. امروزه AI به مجموعهای از معماریهای مکمل تبدیل شده که هرکدام برای لایه متفاوتی از هوش و تصمیمگیری بهینه شدهاند.
🤖 آینده هوش مصنوعی احتمالاً ترکیبی از این معماریها خواهد بود، نه تکیه بر یک مدل واحد.
#هوش_مصنوعی #AIAgents #LLM #AI #MachineLearning #TechNews #AgenticAI
مدلهایی که علاوه بر تولید متن، قادر به اجرای کد، فراخوانی APIها و انجام وظایف بهصورت خودکار هستند.
7️⃣ Hierarchical Language Models
این مدلها مسائل پیچیده را به چندین زیرمسئله تقسیم میکنند و برای برنامهریزی بلندمدت و مدیریت وظایف چندمرحلهای کاربرد دارند.
8️⃣ Large Concept Models
مدلهایی که روی مفاهیم انتزاعی و دانش سطح بالا تمرکز دارند و میتوانند درک و تعمیم بهتری از مفاهیم جدید ارائه دهند.
💡 نکته مهم این است که «عامل هوش مصنوعی» دیگر یک مفهوم واحد نیست. امروزه AI به مجموعهای از معماریهای مکمل تبدیل شده که هرکدام برای لایه متفاوتی از هوش و تصمیمگیری بهینه شدهاند.
🤖 آینده هوش مصنوعی احتمالاً ترکیبی از این معماریها خواهد بود، نه تکیه بر یک مدل واحد.
#هوش_مصنوعی #AIAgents #LLM #AI #MachineLearning #TechNews #AgenticAI
🤖 GPT-5.6 معرفی شد، اما هنوز در اختیار عموم قرار نگرفته است
بر اساس گزارشها، نسخه جدید GPT-5.6 فعلاً بهصورت دسترسی محدود و آزمایشی در اختیار گروه کوچکی از توسعهدهندگان مورد اعتماد قرار گرفته و هنوز عرضه عمومی نشده است.
📌 گفته میشود این رویکرد محتاطانه تا حدی به نگرانیهای مربوط به ایمنی مدلهای قدرتمند هوش مصنوعی و تجربه شرکتهای دیگر در زمینه انتشار مدلهای پیشرفته مرتبط است.
⚠️ با این حال، تا این لحظه OpenAI بهصورت رسمی وجود مدل GPT-5.6 یا جزئیات معماری آن را تأیید نکرده است. بنابراین اطلاعات مربوط به این نسخه و نامگذاریهای جدید را باید در حد گزارشها و شایعات صنعت در نظر گرفت.
🌌 طبق این گزارشها، خانواده جدید مدلها ممکن است شامل سه شاخه باشد:
✅ Sol
مدلی بسیار قدرتمند که برای وظایف پیچیده و استدلال پیشرفته طراحی شده است.
✅ Terra
مدلی متعادل از نظر هزینه و عملکرد که برای استفاده عمومی مناسبتر است.
✅ Luna
مدلی سبک، سریع و ارزان برای کارهای روزمره و ساده.
#هوش_مصنوعی #OpenAI #GPT #AI #LLM #TechNews
بر اساس گزارشها، نسخه جدید GPT-5.6 فعلاً بهصورت دسترسی محدود و آزمایشی در اختیار گروه کوچکی از توسعهدهندگان مورد اعتماد قرار گرفته و هنوز عرضه عمومی نشده است.
📌 گفته میشود این رویکرد محتاطانه تا حدی به نگرانیهای مربوط به ایمنی مدلهای قدرتمند هوش مصنوعی و تجربه شرکتهای دیگر در زمینه انتشار مدلهای پیشرفته مرتبط است.
⚠️ با این حال، تا این لحظه OpenAI بهصورت رسمی وجود مدل GPT-5.6 یا جزئیات معماری آن را تأیید نکرده است. بنابراین اطلاعات مربوط به این نسخه و نامگذاریهای جدید را باید در حد گزارشها و شایعات صنعت در نظر گرفت.
🌌 طبق این گزارشها، خانواده جدید مدلها ممکن است شامل سه شاخه باشد:
✅ Sol
مدلی بسیار قدرتمند که برای وظایف پیچیده و استدلال پیشرفته طراحی شده است.
✅ Terra
مدلی متعادل از نظر هزینه و عملکرد که برای استفاده عمومی مناسبتر است.
✅ Luna
مدلی سبک، سریع و ارزان برای کارهای روزمره و ساده.
#هوش_مصنوعی #OpenAI #GPT #AI #LLM #TechNews
👍1