مسابقهی جدید در روبواپیکس 😎
چالش هوش مصنوعی «شطرنج باز» با 45 میلیون تومان جایزه نقدی
صفحه شطرنج را تجزیه و تحلیل کنید
مهرهها را در یک صفحه شناسایی کنید
حرکت مهرهها را تشخیص دهید
و شانس پیروزی را پیشبینی کنید
دغدغهی اصلی روبواپیکس ساخت جامعهای هدفمند و پویا از متخصصان و علاقهمندان هوش مصنوعی است.
برای همین هم ما تمام تلاشمان را میکنیم و از تمام کسانی که میخواهند در این اکوسیستم قدمی بردارند حمایت میکنیم.
💥این مسابقه هم از اولین سری مسابقات هوش مصنوعی DueML است که به سفارش زیما (زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
این مسابقه از 5 چالش بینایی ماشین تشکیل شده که در یک ماه فرصت دارید تا به چالشها پاسخ دهید.
این مسابقه رو حتما برای دوستانتون و علاقه مندای هوش مصنوعی ارسال کنید
برای اطلاعات بیشتر و ثبت نام در مسابقه بر روی متن کلیک کنید.
_______________________________________
@Roboepics
چالش هوش مصنوعی «شطرنج باز» با 45 میلیون تومان جایزه نقدی
صفحه شطرنج را تجزیه و تحلیل کنید
مهرهها را در یک صفحه شناسایی کنید
حرکت مهرهها را تشخیص دهید
و شانس پیروزی را پیشبینی کنید
دغدغهی اصلی روبواپیکس ساخت جامعهای هدفمند و پویا از متخصصان و علاقهمندان هوش مصنوعی است.
برای همین هم ما تمام تلاشمان را میکنیم و از تمام کسانی که میخواهند در این اکوسیستم قدمی بردارند حمایت میکنیم.
💥این مسابقه هم از اولین سری مسابقات هوش مصنوعی DueML است که به سفارش زیما (زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
این مسابقه از 5 چالش بینایی ماشین تشکیل شده که در یک ماه فرصت دارید تا به چالشها پاسخ دهید.
این مسابقه رو حتما برای دوستانتون و علاقه مندای هوش مصنوعی ارسال کنید
برای اطلاعات بیشتر و ثبت نام در مسابقه بر روی متن کلیک کنید.
_______________________________________
@Roboepics
🔥3👌1
یادگیری ماشین به سبک مایکل شوماخر
مایکل شوماخر یه جمله داره که میگه رمز موفقیت من اینه که وقتی بقیه ترمز میکنن من بیشتر گاز میدم 🏎
حالا توی عید، بهترین فرصته که شما بیشتر از بقیه پدال گازو فشار بدید. برای همین ما در روبواپیکس براتون یه مسابقه آموزشی بینایی ماشین تحت عنوان شطرنج باز رو آماده کردیم که ۴۵ میلیون تومان جایزه نقدی داره 🤓
💥این مسابقه به سفارش زیما(زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
یکی از دوستامون در جامعه روبواپیکس هم یه ویدیو آموزشی در مورد قسمت بینایی ماشین این مسابقه درست کرده که ایده هایی رو به صورت کلی برای حل مسائل ارائه میده، اگه زیاد با بینایی ماشین کار نکردین میتونه بهتون تو مسابقه کمک کنه.
لینک ویدئو
فرصتو از دست ندید و همین الان روی متن کلیک کنید و توی مسابقه شرکت کنید.
با عضو شدن توی سرور دیسکورد روبواپیکس هم میتونید با ما و بقیه ی شرکت کننده ها در ارتباط باشید و اگر سوالی داشتید میتونید از بقیه بپرسید تا بهتون کمک کنن.
لینک سرور دیسکورد
@RoboEpics
مایکل شوماخر یه جمله داره که میگه رمز موفقیت من اینه که وقتی بقیه ترمز میکنن من بیشتر گاز میدم 🏎
حالا توی عید، بهترین فرصته که شما بیشتر از بقیه پدال گازو فشار بدید. برای همین ما در روبواپیکس براتون یه مسابقه آموزشی بینایی ماشین تحت عنوان شطرنج باز رو آماده کردیم که ۴۵ میلیون تومان جایزه نقدی داره 🤓
💥این مسابقه به سفارش زیما(زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
یکی از دوستامون در جامعه روبواپیکس هم یه ویدیو آموزشی در مورد قسمت بینایی ماشین این مسابقه درست کرده که ایده هایی رو به صورت کلی برای حل مسائل ارائه میده، اگه زیاد با بینایی ماشین کار نکردین میتونه بهتون تو مسابقه کمک کنه.
لینک ویدئو
فرصتو از دست ندید و همین الان روی متن کلیک کنید و توی مسابقه شرکت کنید.
با عضو شدن توی سرور دیسکورد روبواپیکس هم میتونید با ما و بقیه ی شرکت کننده ها در ارتباط باشید و اگر سوالی داشتید میتونید از بقیه بپرسید تا بهتون کمک کنن.
لینک سرور دیسکورد
@RoboEpics
👏7
ایلان ماسک و تعدادی از رهبران هوش مصنوعی دنیا با امضا کردن نامهای سرگشاده خواستن که ساختن هوش مصنوعیهای بزرگتر از GPT4 رو به مدت 6 ماه متوقف کنند.
توی این نامه به مطالب مختلفی اشاره شده به عنوان مثال
◀️ سیستم های هوش مصنوعی خطرات عمیقی برای جامعه و بشریت دارن
◀️اصول هوش مصنوعی آسیلومار بر برنامه ریزی و مدیریت دقیق تاکید داره
◀️توسعه فعلی هوش مصنوعی سریع و غیرقابل پیش بینیه
◀️تصمیم گیری در مورد هوش مصنوعی نباید به رهبران فناوری غیر منتخب واگذار بشه
◀️برای آموزش سیستم های هوش مصنوعی قدرتمندتر از GPT4 به مدت 6 ماه توقف کنید.
◀️پروتکل های ایمنی مشترک را در طول بازهی توقف ایجاد کنید.
◀️تمرکز تحقیقات هوش مصنوعی رو تغییر بدید و بیشتر روی بهبود دقت، ایمنی و شفافیت کار کنید
◀️با سیاست گذارا برای توسعه سیستم های مدیریتی قوی مبتنی بر هوش مصنوعی کار کنید.
◀️به جامعه اجازه بدید تا با پیشرفت هوش مصنوعی هماهنگ بشن و با اون جامعه ای شکوفا رو هدف بگیرید
برای خوندن کامل نامه و افرادی که امضا کردند میتونید روی متن کلیک کنید.
@RoboEpics
توی این نامه به مطالب مختلفی اشاره شده به عنوان مثال
◀️ سیستم های هوش مصنوعی خطرات عمیقی برای جامعه و بشریت دارن
◀️اصول هوش مصنوعی آسیلومار بر برنامه ریزی و مدیریت دقیق تاکید داره
◀️توسعه فعلی هوش مصنوعی سریع و غیرقابل پیش بینیه
◀️تصمیم گیری در مورد هوش مصنوعی نباید به رهبران فناوری غیر منتخب واگذار بشه
◀️برای آموزش سیستم های هوش مصنوعی قدرتمندتر از GPT4 به مدت 6 ماه توقف کنید.
◀️پروتکل های ایمنی مشترک را در طول بازهی توقف ایجاد کنید.
◀️تمرکز تحقیقات هوش مصنوعی رو تغییر بدید و بیشتر روی بهبود دقت، ایمنی و شفافیت کار کنید
◀️با سیاست گذارا برای توسعه سیستم های مدیریتی قوی مبتنی بر هوش مصنوعی کار کنید.
◀️به جامعه اجازه بدید تا با پیشرفت هوش مصنوعی هماهنگ بشن و با اون جامعه ای شکوفا رو هدف بگیرید
برای خوندن کامل نامه و افرادی که امضا کردند میتونید روی متن کلیک کنید.
@RoboEpics
👎9👍7😁1
مدل بزرگ زبانی برای کارهای مالی
بلومبرگ مقالهای رو منتشر کرده که توی اون BloombergGPT رو معرفی کرده.
این مدل بزرگ زبانی 50 میلیارد پارامتر داره و روی مقدار زیادی دادههای اقتصادی آموزش دیده و میخوان که از اون برای کمک به کارهای اقتصادی استفاده کنن.
برای خوندن مقاله روی متن کلیک کنید.
@RoboEpics
بلومبرگ مقالهای رو منتشر کرده که توی اون BloombergGPT رو معرفی کرده.
این مدل بزرگ زبانی 50 میلیارد پارامتر داره و روی مقدار زیادی دادههای اقتصادی آموزش دیده و میخوان که از اون برای کمک به کارهای اقتصادی استفاده کنن.
برای خوندن مقاله روی متن کلیک کنید.
@RoboEpics
This media is not supported in your browser
VIEW IN TELEGRAM
مدلی که با یک کلیک، هر چیزی رو که بخواید از عکس و ویدئو جدا میکنه 😮
تیم متا مدلی رو به اسم SAM (Segment Anything Model) معرفی کرده که با استفاده از اون شما میتونید هر چیزی رو توی عکس و ویدئو جدا کنید.
مدل SAM قابلیت ادغام شدن با مدلهای دیگه رو هم داره به عنوان مثال شما میتونید اونو روی تکنولوژیهای AR , VR سوار کنید و باهاش محصولهای هیجان انگیزی رو درست کنید.
میتونید اونو با مدلهای تبدیل صدا به متن ادغام کنید و افراد با استفاده از صدا بتونن چیزهایی که میخوان رو جدا کنن و همینطور میتونید از خروجی هایی مدل برای ساخت مدلهای سه بعدی استفاده کنید.
برای دیدن سایت این محصول میتونید روی متن کنید.
برای خوندن کامل بلاگ میتونید روی این متن کنید.
برای دیدن گیت هاب این مدل هم میتونید روی متن کلیک کنید.
این پست رو حتما با دوستاتون و افرادی که علاقهمندن به اشتراک بذارید 😎
@RoboEpics
تیم متا مدلی رو به اسم SAM (Segment Anything Model) معرفی کرده که با استفاده از اون شما میتونید هر چیزی رو توی عکس و ویدئو جدا کنید.
مدل SAM قابلیت ادغام شدن با مدلهای دیگه رو هم داره به عنوان مثال شما میتونید اونو روی تکنولوژیهای AR , VR سوار کنید و باهاش محصولهای هیجان انگیزی رو درست کنید.
میتونید اونو با مدلهای تبدیل صدا به متن ادغام کنید و افراد با استفاده از صدا بتونن چیزهایی که میخوان رو جدا کنن و همینطور میتونید از خروجی هایی مدل برای ساخت مدلهای سه بعدی استفاده کنید.
برای دیدن سایت این محصول میتونید روی متن کنید.
برای خوندن کامل بلاگ میتونید روی این متن کنید.
برای دیدن گیت هاب این مدل هم میتونید روی متن کلیک کنید.
این پست رو حتما با دوستاتون و افرادی که علاقهمندن به اشتراک بذارید 😎
@RoboEpics
یک مقاله کلی از معماری و الگوریتمهای ترانسفورمرها (Transformer) که توسط تیم Deepmind نوشته شده.
هدف کلی این مقاله اینه که یه نمای کلی دقیق و مستقل از معماریها و الگوریتمهای ترانسفورمرها بده.(نه نتایج)
مطالب این مقاله در مورد اینه که :
⬅️ ترانسفورمرها چین؟
⬅️ چی جوری آموزش داده میشن؟
⬅️ برای چه چیزی استفاده میشن؟
⬅️ اجزای اصلی معماری اونها چیه؟
⬅️ یه توضیح کلی در مورد بهترین مدلهای موجود که با ترانسفورمرها نوشته شدن رو میده.
برای فهمیدن این مقاله لازمه که با اصطلاحات پایه ی یادگیری ماشین و معماری شبکههای عصبی ساده تر مثل MLP آشنا باشید.
برای دیدن مقاله رو متن کلیک کنید.
این پیام رو حتما برای دوستان علاقهمندتون هم بفرستید 😎
@RoboEpics
هدف کلی این مقاله اینه که یه نمای کلی دقیق و مستقل از معماریها و الگوریتمهای ترانسفورمرها بده.(نه نتایج)
مطالب این مقاله در مورد اینه که :
⬅️ ترانسفورمرها چین؟
⬅️ چی جوری آموزش داده میشن؟
⬅️ برای چه چیزی استفاده میشن؟
⬅️ اجزای اصلی معماری اونها چیه؟
⬅️ یه توضیح کلی در مورد بهترین مدلهای موجود که با ترانسفورمرها نوشته شدن رو میده.
برای فهمیدن این مقاله لازمه که با اصطلاحات پایه ی یادگیری ماشین و معماری شبکههای عصبی ساده تر مثل MLP آشنا باشید.
برای دیدن مقاله رو متن کلیک کنید.
این پیام رو حتما برای دوستان علاقهمندتون هم بفرستید 😎
@RoboEpics
👍1
کوالا، چت بات opensource دانشگاه برکلی که روی مدل LLama متا آموزش داده شده.🐨🐨
این چت بات روی مدل 13 میلیارد پارامتری LLama متا آموزش داده شده و همینطور روی داده های مکالمه ی افراد روی اینترنت fine tune شده.
بر اساس بلاگ خود دانشگاه برکلی کوالا در مقایسه با مدل Alpaca دانشگاه استنفورد و chatgpt، به خوبی میتونه به سوالات کاربرا جواب بده و جوابهایی رو تولید میکنه که بیشتر اوقات نسبت به Alpaca بیشتر ترجیح داده میشه و در نیمی از مواقع جواب ها با chatgpt برابره.
این مدل هنوز از نظر محتوایی، ایمنی و جوابهایی که میده هنوز مشکلات زیادی داره و فقط برای پروژههای تحقیقاتی اجازه استفاده از این مدل رو میدن.
برای خوندن کامل مقاله روی متن کلیک کنید.
حتما این پست رو برای دوستان علاقهمندتون هم بفرستید 😎👌
@RoboEpics
این چت بات روی مدل 13 میلیارد پارامتری LLama متا آموزش داده شده و همینطور روی داده های مکالمه ی افراد روی اینترنت fine tune شده.
بر اساس بلاگ خود دانشگاه برکلی کوالا در مقایسه با مدل Alpaca دانشگاه استنفورد و chatgpt، به خوبی میتونه به سوالات کاربرا جواب بده و جوابهایی رو تولید میکنه که بیشتر اوقات نسبت به Alpaca بیشتر ترجیح داده میشه و در نیمی از مواقع جواب ها با chatgpt برابره.
این مدل هنوز از نظر محتوایی، ایمنی و جوابهایی که میده هنوز مشکلات زیادی داره و فقط برای پروژههای تحقیقاتی اجازه استفاده از این مدل رو میدن.
برای خوندن کامل مقاله روی متن کلیک کنید.
حتما این پست رو برای دوستان علاقهمندتون هم بفرستید 😎👌
@RoboEpics
تیم Databricks به تازگی Dolly 2.0 رو منتشر کرد اولین مدل زبانی بزرگ open source که با گرفتن API میتونید به صورت رایگان از این مدل استفاده تجاری کنید.
این مدل 12 میلیارد پارامتری مدلی از خانوادهی EleutherAI pythia هست و روی دادههای کاملا با کیفیت انسانی fine tune شده.
برای خوندن کامل بلاگ روی متن کلیک کنید.
برای دیدن مدل در hugging face هم میتونید روی متن کلیک کنید.
این پست رو حتما برای دوستان علاقهمندتون بفرستید.😎👍
@RoboEpics
این مدل 12 میلیارد پارامتری مدلی از خانوادهی EleutherAI pythia هست و روی دادههای کاملا با کیفیت انسانی fine tune شده.
برای خوندن کامل بلاگ روی متن کلیک کنید.
برای دیدن مدل در hugging face هم میتونید روی متن کلیک کنید.
این پست رو حتما برای دوستان علاقهمندتون بفرستید.😎👍
@RoboEpics
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
دیگه لازم نیست برای خرید اکانت midjourney هزینه کنید! 😁
مدل Stable diffusion XL روی پلتفرم clip drop قابل استفادست.
این مدل آخرین مدل stable diffusion هست که توی ساخت تصاویر واقع گرایانه خیلی عالی عمل میکنه و حتی در بعضی حوزه ها از midjourney هم بهتر عمل میکنه.
شما با ساخت حساب کاربری توی سایت میتونید روزانه 60 تا عکس رایگان با هوش مصنوعی تولید کنید.
برای استفاده از مدل روی متن کلیک کنید.
این پست رو حتما برای کسایی که فکر میکنی به این مدل نیاز دارن بفرست. 😎
@RoboEpics
مدل Stable diffusion XL روی پلتفرم clip drop قابل استفادست.
این مدل آخرین مدل stable diffusion هست که توی ساخت تصاویر واقع گرایانه خیلی عالی عمل میکنه و حتی در بعضی حوزه ها از midjourney هم بهتر عمل میکنه.
شما با ساخت حساب کاربری توی سایت میتونید روزانه 60 تا عکس رایگان با هوش مصنوعی تولید کنید.
برای استفاده از مدل روی متن کلیک کنید.
این پست رو حتما برای کسایی که فکر میکنی به این مدل نیاز دارن بفرست. 😎
@RoboEpics
🤩1
تا حالا به این فکر کردین وقتی که به ChatGPT یا GPT-4 میگیم که چیزی رو داره اشتباه میگه میفهمه و اونو اصلاح میکنه؟
آیا براتون عجیب نیست که یه مدل با پارامترهای ثابت چرا دوباره همون جواب یکسان قبلی رو بهون نمیده؟
این قدرت مدلهای بزرگ زبانیه که این اجازه رو میده توی Context (موضوعی که دارن در موردش صحبت میکنن) یاد بگیرن.
اگر با ChatGPT صحبت طولانی کرده باشین و بهش گفته باشید که یه سری جزییات توی بحثتون رو تغییر بده و اون موضوع ها رو همیشه تو ذهنش نگه داره میبینید که به مرور یه سری چیزهایی که گفتید رو یادش میره.
به حداکثر طول کلماتی که یک مدل در یک انتشار به جلو میتونه انجام بده رو اصطلاحا Context window میگن و این معیار خیلی مهمیه و توی تمام مدلهای بزرگ زبانی اونو اندازه گیری میکنن و مقدار این معیار GPT3 هزار کلمست و در GPT4 به 25 هزار کلمه میرسه.
حالا یه مقاله ای هست که از طرف مایکروسافت منتشر شده که توی اون توضیح میده که این مدل های برزگ زبانی چی جوری میتونن توی اون زمینه ای که باهاش صحبت میکنی یاد بگیرن.
لینک مقاله
این پست رو حتما برای دوستان علاقه مندتون بفرستید😎👍
@RoboEpics
آیا براتون عجیب نیست که یه مدل با پارامترهای ثابت چرا دوباره همون جواب یکسان قبلی رو بهون نمیده؟
این قدرت مدلهای بزرگ زبانیه که این اجازه رو میده توی Context (موضوعی که دارن در موردش صحبت میکنن) یاد بگیرن.
اگر با ChatGPT صحبت طولانی کرده باشین و بهش گفته باشید که یه سری جزییات توی بحثتون رو تغییر بده و اون موضوع ها رو همیشه تو ذهنش نگه داره میبینید که به مرور یه سری چیزهایی که گفتید رو یادش میره.
به حداکثر طول کلماتی که یک مدل در یک انتشار به جلو میتونه انجام بده رو اصطلاحا Context window میگن و این معیار خیلی مهمیه و توی تمام مدلهای بزرگ زبانی اونو اندازه گیری میکنن و مقدار این معیار GPT3 هزار کلمست و در GPT4 به 25 هزار کلمه میرسه.
حالا یه مقاله ای هست که از طرف مایکروسافت منتشر شده که توی اون توضیح میده که این مدل های برزگ زبانی چی جوری میتونن توی اون زمینه ای که باهاش صحبت میکنی یاد بگیرن.
لینک مقاله
این پست رو حتما برای دوستان علاقه مندتون بفرستید😎👍
@RoboEpics
🐳3
This media is not supported in your browser
VIEW IN TELEGRAM
تیم متا به تازگی یک هوش مصنوعی برای کودکان منتشر کرد! 😃
تیم متا یک ابزار پویانمایی مبتنی بر هوش مصنوعی و 180 هزار عکس از نقاشی کودکان که با استفاده از اون تونستن این مدل رو بسازن منتشر کردن.
اسم این ابزار رو Animated Drawing گذاشتن و قابلیت تشخیص شکل، جدا کردن نقاشی از پس زمینه، اضافه کردن مفصل های حرکتی به نقاشی و حرکت دادن نقاشی رو داره.
شما همین الان میتونید از این محصول استفاده کنید و نقاشیها رو به حرکت دربیارید.
لینک بلاگ
لینک استفاده از مدل
لینک گیت هاب مدل
این پست رو برای کسایی که فکر میکنید علاقه مندن بفرستید😎👌
@RoboEpics
تیم متا یک ابزار پویانمایی مبتنی بر هوش مصنوعی و 180 هزار عکس از نقاشی کودکان که با استفاده از اون تونستن این مدل رو بسازن منتشر کردن.
اسم این ابزار رو Animated Drawing گذاشتن و قابلیت تشخیص شکل، جدا کردن نقاشی از پس زمینه، اضافه کردن مفصل های حرکتی به نقاشی و حرکت دادن نقاشی رو داره.
شما همین الان میتونید از این محصول استفاده کنید و نقاشیها رو به حرکت دربیارید.
لینک بلاگ
لینک استفاده از مدل
لینک گیت هاب مدل
این پست رو برای کسایی که فکر میکنید علاقه مندن بفرستید😎👌
@RoboEpics
🐳3
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Dino v2 به درد همه ی کسایی که بینایی ماشین کار میکنن، میخوره 😎
متا امروز مدل Dino v2 رو منتشر کرد که با اون میتونید مدل های بینایی ماشین رو با کارایی بالا آموزش بدید.
این مدل خودنظارتی(self supervised) بینایی با بهره گیری از معماری ترانسفورمر ها میتونه توی تموم کارهای بینایی ماشین شما نقش مهمی رو ایفا کنه و به fine tune هم نیازی نداره.
با این مدل میتونید بدون نیاز به مقدار زیادی از داده های برچسب خورده مدل بینایی ماشین خودتونو آموزش بدید.
از این مدل میتونید توی طبقه بندی کردن تصاویر(classification)، تقسیم بندی عکس(segmentation)، بازیابی عکس(image retrieval) و تخمین عمق(depth estimation) عکس استفاده کنید.
با این مدل میتونید مستقیما مدلتون رو با خود عکسها آموزش بدید و دیگه نیازی به توضیح متنی برای عکسها ندارید.
این مدل قابلیت یادگیری با هر مجموعه عکسی رو هم داره.
نسخه از پیش آموزش دیده Dino v2 موجوده و با مدلهای CLIP و Open CLIP توی طیف گسترده ای از کارها میتونه رقابت کنه.
لینک دموی مدل
لینک بلاگ
لینک گیت هاب
این پست رو حتما برای افرادی که فکر میکنید علاقه مندن بفرستید😎
@RoboEpics
متا امروز مدل Dino v2 رو منتشر کرد که با اون میتونید مدل های بینایی ماشین رو با کارایی بالا آموزش بدید.
این مدل خودنظارتی(self supervised) بینایی با بهره گیری از معماری ترانسفورمر ها میتونه توی تموم کارهای بینایی ماشین شما نقش مهمی رو ایفا کنه و به fine tune هم نیازی نداره.
با این مدل میتونید بدون نیاز به مقدار زیادی از داده های برچسب خورده مدل بینایی ماشین خودتونو آموزش بدید.
از این مدل میتونید توی طبقه بندی کردن تصاویر(classification)، تقسیم بندی عکس(segmentation)، بازیابی عکس(image retrieval) و تخمین عمق(depth estimation) عکس استفاده کنید.
با این مدل میتونید مستقیما مدلتون رو با خود عکسها آموزش بدید و دیگه نیازی به توضیح متنی برای عکسها ندارید.
این مدل قابلیت یادگیری با هر مجموعه عکسی رو هم داره.
نسخه از پیش آموزش دیده Dino v2 موجوده و با مدلهای CLIP و Open CLIP توی طیف گسترده ای از کارها میتونه رقابت کنه.
لینک دموی مدل
لینک بلاگ
لینک گیت هاب
این پست رو حتما برای افرادی که فکر میکنید علاقه مندن بفرستید😎
@RoboEpics
👍3🤯2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت Nvidia تحقیقات خودشو روی مدلهای تبدیل متن به ویدئو منتشر کرد 🤯
مدلهای انتشار پنهان ویدئویی (Video Latent Diffusion Models) با استفاده از مدل انتشار (diffusion model) توی یک فضای پنهان فشرده (Compressed latent space) ویدئوهایی با وضوح بالا تولید میکنن که در عین حال از منابع محسباتی کمتری هم استفاده میکنن.
نحوهی عملکرد این مدل به صورت زیر خلاصه میشه:
1. روی تموم دیتاست عکسها LDM رو پیش آموزش میدیم.
2. با اضافه کردن لایههای زمانی مثل فریم فیلم، LDM تصویر رو به LDM ویدیویی تبدیل میکنیم.
3. برای ساخت مدل تولید ویدئو، LDM ویدیویی روی دنبالهای از ویدیوهای کدگذاری شده fine-tune میکنیم.
4. به صورت موقت نمونه بردارهای مدل انتشاری (diffusion model upsamplers) رو روی تولید ویدیو با کیفیت بالا تنظیم میکنیم.
5. برای اینکه بخوایم مدلمون عملکرد خیلی خوبی پیدا کنه، LDM ویدیویی رو روی ویدیوهای واقعی 1024*512 اعتبار سنجی میکنیم.
لینک سایت
لینک مقاله
این پست رو حتما برای دوستای علاقهمندتون بفرستید😎👌
@RoboEpics
مدلهای انتشار پنهان ویدئویی (Video Latent Diffusion Models) با استفاده از مدل انتشار (diffusion model) توی یک فضای پنهان فشرده (Compressed latent space) ویدئوهایی با وضوح بالا تولید میکنن که در عین حال از منابع محسباتی کمتری هم استفاده میکنن.
نحوهی عملکرد این مدل به صورت زیر خلاصه میشه:
1. روی تموم دیتاست عکسها LDM رو پیش آموزش میدیم.
2. با اضافه کردن لایههای زمانی مثل فریم فیلم، LDM تصویر رو به LDM ویدیویی تبدیل میکنیم.
3. برای ساخت مدل تولید ویدئو، LDM ویدیویی روی دنبالهای از ویدیوهای کدگذاری شده fine-tune میکنیم.
4. به صورت موقت نمونه بردارهای مدل انتشاری (diffusion model upsamplers) رو روی تولید ویدیو با کیفیت بالا تنظیم میکنیم.
5. برای اینکه بخوایم مدلمون عملکرد خیلی خوبی پیدا کنه، LDM ویدیویی رو روی ویدیوهای واقعی 1024*512 اعتبار سنجی میکنیم.
لینک سایت
لینک مقاله
این پست رو حتما برای دوستای علاقهمندتون بفرستید😎👌
@RoboEpics
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
خودتون رو برای پارک ژوراسیک آماده کنید 😎
توی ویدئو مدلی رو میبینید که حرکات موجودات دوپا با استفاده از عضلههای سه بعدی رو شبیه سازی میکنه.
این کنترلهای حرکتی میتونه توی زمان واقعی با سرعتهای مختلف، به سمت هدف های متفاوت و در مسیرهای ناهموار حرکت کنن.
لینک مقاله
@RoboEpics
توی ویدئو مدلی رو میبینید که حرکات موجودات دوپا با استفاده از عضلههای سه بعدی رو شبیه سازی میکنه.
این کنترلهای حرکتی میتونه توی زمان واقعی با سرعتهای مختلف، به سمت هدف های متفاوت و در مسیرهای ناهموار حرکت کنن.
لینک مقاله
@RoboEpics
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
با استفاده از این سایت میتونید شبکههای عصبی پیچشی(convolutional neural network) رو بهتر درک کنید.
این سایت CNNها رو تصویر سازی میکنه و توضیح میده که توی هر لایه از این شبکههای عصبی چه اتفاقی میافته.
میتونید این سایت رو توی مرورگر خود باز کنید و با CNNها بازی کنید و یاد بگیرید.
لینک سایت
لینک مقالهی یادگیری CNNها با استفاده از تصویرسازی تعاملی
این پست رو حتما برای کسانی که توی بینایی ماشین کار میکنن بفرستید😎
@RoboEpics
این سایت CNNها رو تصویر سازی میکنه و توضیح میده که توی هر لایه از این شبکههای عصبی چه اتفاقی میافته.
میتونید این سایت رو توی مرورگر خود باز کنید و با CNNها بازی کنید و یاد بگیرید.
لینک سایت
لینک مقالهی یادگیری CNNها با استفاده از تصویرسازی تعاملی
این پست رو حتما برای کسانی که توی بینایی ماشین کار میکنن بفرستید😎
@RoboEpics
👍3
تاریخچه چتباتها و مدلهای بزرگ زبانی 📚
به مدت 30 سال از سال 1987 تا 2017، مدلهای یادگیری ماشینی که بر اساس ویژگی یاد میگرفتن ( feature based machine learning models) رو معمولا برای کارهای پردازش زبان طبیعی مثل تجزیه و تحلیل احساسات یا پیدا کردن اسم شرکتها تو متن استفاده میکردن.
درسته که این مدلها تو مثالهای بالا خوب کار میکردن اما توانایی درک زبان رو نداشتن. برای اینکه بتونیم درک بهتری از زبان با روشهای قدیمی داشته باشیم نیاز داریم که مقدار قابل توجهی کد بزنیم که ساختار و معنای جملات و مفهوم بعضی کلمات و جملات دو پهلو رو مشخص کنیم و همینطور باید خیلی دادهی دستنویس تولید کنیم که قواعد دستور زبان رو به مدل بفهمونیم. این رویکرد خیلی پرهزینه و مقیاس ناپذیر بود و همینطور به طور گسترده قابل استفاده توی کارهای مختلف نبود.
تا اینکه توی سال 2018 با توسعه نسل جدیدی از مدلهای بزرگ زبانی، درک زبان طبیعی به صورت کلی متحول شد.
مدلهایی مثل BERT و GPT-3 با استفاده از یادگیری خودنظارتی(self-supervised) روی مقادیر خیلی زیادی از دادههای متنی آموزش داده شدن تا بتونن ساختار و معنای متن رو درک کنن.
این مدلها از Transformerها استفاده کردن که یک فناوری شبکه عصبی جدید بود که توی سال 2017 معرفی شد که کلماتی که با هم در یک زمینه (context) هستند در فضای برداری هم نزدیک به هم هستند و مدل کلمات رو با استفاده از درکی که از Context داره به صورت احتمالاتی در کنار هم قرار میده و این کار به مدل این قدرت رو میداد معنی جملات رو بهتر بفهمن و همینطور با استفاده از روشهای stochastic gradient descent یا reinforcement learning میشه که این مدلها رو برای درک بهتر زبان و انجام کارهای مختلف توی حوزهی NLP آموزش داد.
برای بیشتر آشنا شدن با معماری و الگوریتمهای transformer ها میتونید به مقاله زیر مراجعه کنید.
لینک مقاله
@RoboEpics
به مدت 30 سال از سال 1987 تا 2017، مدلهای یادگیری ماشینی که بر اساس ویژگی یاد میگرفتن ( feature based machine learning models) رو معمولا برای کارهای پردازش زبان طبیعی مثل تجزیه و تحلیل احساسات یا پیدا کردن اسم شرکتها تو متن استفاده میکردن.
درسته که این مدلها تو مثالهای بالا خوب کار میکردن اما توانایی درک زبان رو نداشتن. برای اینکه بتونیم درک بهتری از زبان با روشهای قدیمی داشته باشیم نیاز داریم که مقدار قابل توجهی کد بزنیم که ساختار و معنای جملات و مفهوم بعضی کلمات و جملات دو پهلو رو مشخص کنیم و همینطور باید خیلی دادهی دستنویس تولید کنیم که قواعد دستور زبان رو به مدل بفهمونیم. این رویکرد خیلی پرهزینه و مقیاس ناپذیر بود و همینطور به طور گسترده قابل استفاده توی کارهای مختلف نبود.
تا اینکه توی سال 2018 با توسعه نسل جدیدی از مدلهای بزرگ زبانی، درک زبان طبیعی به صورت کلی متحول شد.
مدلهایی مثل BERT و GPT-3 با استفاده از یادگیری خودنظارتی(self-supervised) روی مقادیر خیلی زیادی از دادههای متنی آموزش داده شدن تا بتونن ساختار و معنای متن رو درک کنن.
این مدلها از Transformerها استفاده کردن که یک فناوری شبکه عصبی جدید بود که توی سال 2017 معرفی شد که کلماتی که با هم در یک زمینه (context) هستند در فضای برداری هم نزدیک به هم هستند و مدل کلمات رو با استفاده از درکی که از Context داره به صورت احتمالاتی در کنار هم قرار میده و این کار به مدل این قدرت رو میداد معنی جملات رو بهتر بفهمن و همینطور با استفاده از روشهای stochastic gradient descent یا reinforcement learning میشه که این مدلها رو برای درک بهتر زبان و انجام کارهای مختلف توی حوزهی NLP آموزش داد.
برای بیشتر آشنا شدن با معماری و الگوریتمهای transformer ها میتونید به مقاله زیر مراجعه کنید.
لینک مقاله
@RoboEpics
❤3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
از این به بعد ChatGPT صدا رو هم میشنوه و جواب میده 🤯
کم کم میتونیم آمادهی اومدن نسل جدید دستیارهای هوشمند باشیم که با قدرت گرفتن از ChatGPT و با استفاده از Plug-in هایی که برای ChatGPT مینویسن، میتونیم فقط با صحبت کردن با یک هوش مصنوعی تمام کارهایی که لازمه رو انجام بدیم به عنوان مثال خرید کنیم، برنامههای مختلف برای خودمون برنامه ریزی کنیم و ...
با توجه به پیشرفت و رشدی که میبینیم میتونیم توی آیندهی نزدیک شاهد این دستیارهای هوشمند باشیم.
تیمی که روی این مدل کار کردن اسمش رو AudioGPT گذاشتن و اونو به صورت open source گذاشتن تا بقیه هم بتونن ازش استفاده کنن.
لینک مقاله
لینک گیت هاب مدل
این پست رو حتما برای افراد علاقهمند بفرستید😎
@RoboEpics
کم کم میتونیم آمادهی اومدن نسل جدید دستیارهای هوشمند باشیم که با قدرت گرفتن از ChatGPT و با استفاده از Plug-in هایی که برای ChatGPT مینویسن، میتونیم فقط با صحبت کردن با یک هوش مصنوعی تمام کارهایی که لازمه رو انجام بدیم به عنوان مثال خرید کنیم، برنامههای مختلف برای خودمون برنامه ریزی کنیم و ...
با توجه به پیشرفت و رشدی که میبینیم میتونیم توی آیندهی نزدیک شاهد این دستیارهای هوشمند باشیم.
تیمی که روی این مدل کار کردن اسمش رو AudioGPT گذاشتن و اونو به صورت open source گذاشتن تا بقیه هم بتونن ازش استفاده کنن.
لینک مقاله
لینک گیت هاب مدل
این پست رو حتما برای افراد علاقهمند بفرستید😎
@RoboEpics
👍4🔥2
ترانسفورمرها کاملا صنعت یادگیری ماشین رو در اختیار خودشون قرار دادن !
چند سال پیش بود که ترانسفورمرها فقط یه نوآوری توی تحقیقات حوزه NLP بودن اما الان سخته که بخوایم حوزه ای توی یادگیری ماشین پیدا کنیم که توی اون عملکرد ترنسفورمرها از عملکرد مدلهای SOTA بهتر نباشه.
پینترست(pinterest) یکی از شبکههای اجتماعیه که توی حوزهی یادگیری ماشین همیشه به روزه و اونا به تازگی با استفاده از دیتای رفتار بلند مدت و کوتاه مدت کاربرا، سیستم پیشنهادگرشون (recommendation system) رو با استفاده از ترنسفورمرها تغییر دادن.
اصطلاحا به پستهای پینترست پین (pin) میگن. پینها ترکیبی از یک تصویر، توضیحات متن و یک لینک خارجی به محصول واقعی هستن که کاربرا میتونن با لایک کردن، ذخیره کردن و باز کردن این پینها با سایت تعامل داشته باشن.
به صورت معمول برای ساخت مدلهای پیشنهادگر، دیتاهای فعالیت کاربر و نرخ تعامل کاربرها با موارد مختلف بهمون توی ساخت مدل کمک میکنه و مواردی که به کاربر پیشنهاد میشه بر اساس یک دیتای تست مخصوصه مثلا برای یه سایتی مثل پینترست میایم دیتاهای فعالیت 30 روزهی کاربرها رو ثبت میکنیم و تمام فعالیتهایی که قبل از اون انجام داده رو فراموش میکنیم و هر گونه رفتار و علاقه ی کوتاه مدت (مثلا یک ساعت گذشته) توسط مدل قابل درک نیست.
برای ساخت همچین مدلی مسئلهی دستهبندی(calssification) باید حل کنیم و باید پیش بینی کنیم که کاربر با این مواردی که بهش پیشنهاد شده تعامل داره یا نه و ما یه سری ویژگی (features) میسازیم تا رفتار گذشته کاربرا رو ثبت کنیم و ساختار ذاتی سری زمانی این دیتاها رو نادیده میگیریم.
حالا پینترست به این مسئله به شکل دیگهای نگاه میکنه!!
اونا میان به مدل علایق کوتاه مدت و بلند مدت رو به صورت جداگونه یاد میدن. اونا میان اول PinnerFormer Transformer رو با دیتاهای سری زمانی رفتار کاربرا تا یک سال آینده آموزش میدن.حالا این ترنسفورمر یاد میگیره با استفاده از رابطهی تعاملات(engagements) کاربرا با سایت در مقاطع مختلف زمانی آینده رو پیش بینی کنه.
حالا به جای اینکه این مدل فقط آینده رو پیش بینی کنه یک تابع ضرر (loss function) ایجاد کردن که تا 14 روز آینده تمام تعاملات کاربر رو در نظر میگیره و آخرین لایه مدل برای encoding علاقههای بلند مدت کاربرا استفاده میشه و در یک database ذخیره میشه.
یک ترنسفورمر دیگه هم اینجا وجود داره که به عنوان ورودی engagementهای کاربر در کوتاه مدت( مثلا چند ساعت یا چند دقیقه پیش) و embeddingهای کاربر در بلند مدت رو میگیره و پین بعدی که قراره نمایش داده بشه و تبلیغ مناسب بعدی رو بر اساس الگوریتمهای رتبهبندی(Learning to rank) پیش بینی میکنه و روابط بین رفتارهای بلند مدت و کوتاه مدت کاربر رو یاد میگیره تا آیتمهای مورد نظر کاربر رو بهش نمایش بده.
لینک مقاله
این پست رو حتما برای کسایی که علاقهمندن بفرستید 😎👍
@RoboEpics
چند سال پیش بود که ترانسفورمرها فقط یه نوآوری توی تحقیقات حوزه NLP بودن اما الان سخته که بخوایم حوزه ای توی یادگیری ماشین پیدا کنیم که توی اون عملکرد ترنسفورمرها از عملکرد مدلهای SOTA بهتر نباشه.
پینترست(pinterest) یکی از شبکههای اجتماعیه که توی حوزهی یادگیری ماشین همیشه به روزه و اونا به تازگی با استفاده از دیتای رفتار بلند مدت و کوتاه مدت کاربرا، سیستم پیشنهادگرشون (recommendation system) رو با استفاده از ترنسفورمرها تغییر دادن.
اصطلاحا به پستهای پینترست پین (pin) میگن. پینها ترکیبی از یک تصویر، توضیحات متن و یک لینک خارجی به محصول واقعی هستن که کاربرا میتونن با لایک کردن، ذخیره کردن و باز کردن این پینها با سایت تعامل داشته باشن.
به صورت معمول برای ساخت مدلهای پیشنهادگر، دیتاهای فعالیت کاربر و نرخ تعامل کاربرها با موارد مختلف بهمون توی ساخت مدل کمک میکنه و مواردی که به کاربر پیشنهاد میشه بر اساس یک دیتای تست مخصوصه مثلا برای یه سایتی مثل پینترست میایم دیتاهای فعالیت 30 روزهی کاربرها رو ثبت میکنیم و تمام فعالیتهایی که قبل از اون انجام داده رو فراموش میکنیم و هر گونه رفتار و علاقه ی کوتاه مدت (مثلا یک ساعت گذشته) توسط مدل قابل درک نیست.
برای ساخت همچین مدلی مسئلهی دستهبندی(calssification) باید حل کنیم و باید پیش بینی کنیم که کاربر با این مواردی که بهش پیشنهاد شده تعامل داره یا نه و ما یه سری ویژگی (features) میسازیم تا رفتار گذشته کاربرا رو ثبت کنیم و ساختار ذاتی سری زمانی این دیتاها رو نادیده میگیریم.
حالا پینترست به این مسئله به شکل دیگهای نگاه میکنه!!
اونا میان به مدل علایق کوتاه مدت و بلند مدت رو به صورت جداگونه یاد میدن. اونا میان اول PinnerFormer Transformer رو با دیتاهای سری زمانی رفتار کاربرا تا یک سال آینده آموزش میدن.حالا این ترنسفورمر یاد میگیره با استفاده از رابطهی تعاملات(engagements) کاربرا با سایت در مقاطع مختلف زمانی آینده رو پیش بینی کنه.
حالا به جای اینکه این مدل فقط آینده رو پیش بینی کنه یک تابع ضرر (loss function) ایجاد کردن که تا 14 روز آینده تمام تعاملات کاربر رو در نظر میگیره و آخرین لایه مدل برای encoding علاقههای بلند مدت کاربرا استفاده میشه و در یک database ذخیره میشه.
یک ترنسفورمر دیگه هم اینجا وجود داره که به عنوان ورودی engagementهای کاربر در کوتاه مدت( مثلا چند ساعت یا چند دقیقه پیش) و embeddingهای کاربر در بلند مدت رو میگیره و پین بعدی که قراره نمایش داده بشه و تبلیغ مناسب بعدی رو بر اساس الگوریتمهای رتبهبندی(Learning to rank) پیش بینی میکنه و روابط بین رفتارهای بلند مدت و کوتاه مدت کاربر رو یاد میگیره تا آیتمهای مورد نظر کاربر رو بهش نمایش بده.
لینک مقاله
این پست رو حتما برای کسایی که علاقهمندن بفرستید 😎👍
@RoboEpics
👍4❤2
زیرک: تجربهای بهتر از ChatGPT
✅ بدون نیاز به VPN
✅ بدون نیاز به شماره خارج از کشور
✅ سرعت بالاتر
با استفاده از سرویس زیرک بدون هیچ دردسری و رایگان از ChatGPT استفاده کنید، سوالات خود را از آن بپرسید و با بازخورد دادن به جوابهای زیرک به ما در تقویت این فناوری برای زبان فارسی کمک کنید.
همین الان وارد زیرک شوید و خلاقانهترین سوالی که به ذهنتان میرسد را از آن بپرسید.
xerac.ir
برای ارتباط بیشتر با ما هم میتوانید عضو سرور دیسکورد شوید یا در تلگرام (پشتیبانی) نظرات خود را برای ما ارسال کنید.
@RoboEpics
✅ بدون نیاز به VPN
✅ بدون نیاز به شماره خارج از کشور
✅ سرعت بالاتر
با استفاده از سرویس زیرک بدون هیچ دردسری و رایگان از ChatGPT استفاده کنید، سوالات خود را از آن بپرسید و با بازخورد دادن به جوابهای زیرک به ما در تقویت این فناوری برای زبان فارسی کمک کنید.
همین الان وارد زیرک شوید و خلاقانهترین سوالی که به ذهنتان میرسد را از آن بپرسید.
xerac.ir
برای ارتباط بیشتر با ما هم میتوانید عضو سرور دیسکورد شوید یا در تلگرام (پشتیبانی) نظرات خود را برای ما ارسال کنید.
@RoboEpics
🔥10🤡6💯3🤔2👍1
با GPT-4 نحوهی عملکرد شبکه عصبی مدلهای زبانی رو میشه پیدا کرد 😱
تیم OpenAI جدیدا توی بلاگی نوشته که میشه با استفاده از GPT-4 روش کار شبکههای عصبی مدلهای بزرگ زبانی رو فهمید و این روش رو روی مدل GPT-2 امتحان کردن و نتایج نسبتا خوبی گرفتن.
برای اطلاعات بیشتر میتونید بلاگشون رو بخونید.
@RoboEpics
تیم OpenAI جدیدا توی بلاگی نوشته که میشه با استفاده از GPT-4 روش کار شبکههای عصبی مدلهای بزرگ زبانی رو فهمید و این روش رو روی مدل GPT-2 امتحان کردن و نتایج نسبتا خوبی گرفتن.
برای اطلاعات بیشتر میتونید بلاگشون رو بخونید.
@RoboEpics
🤯1