This media is not supported in your browser
VIEW IN TELEGRAM
یک قدم به رباتهای WestWorld نزدیکتر شدیم
تیم Clone بعد از 8 سال تحقیق و توسعه توانستند دستی روباتیک با الهام از ماهیچههای دست انسان درست کنند و هدف آنها ساخت رباتهایی است که کارهای یدی انسانها را انجام دهد.
برای ساخت این دست از مواد بازیافتی استفاده میشود که هزینهی آن را به شدت کاهش میدهد.
این دست تمام آزادیها و حرکات دست انسانی را دارد، 750 گرم وزن دارد و میتواند 7 کیلوگرم را بلند کند.
برای اطلاعات بیشتر میتوانید بر روی این متن کلیک کنید.
@Roboepics
تیم Clone بعد از 8 سال تحقیق و توسعه توانستند دستی روباتیک با الهام از ماهیچههای دست انسان درست کنند و هدف آنها ساخت رباتهایی است که کارهای یدی انسانها را انجام دهد.
برای ساخت این دست از مواد بازیافتی استفاده میشود که هزینهی آن را به شدت کاهش میدهد.
این دست تمام آزادیها و حرکات دست انسانی را دارد، 750 گرم وزن دارد و میتواند 7 کیلوگرم را بلند کند.
برای اطلاعات بیشتر میتوانید بر روی این متن کلیک کنید.
@Roboepics
🤔2😱2
دو گل داریم🌻🌷، دوسش داریم، منتظر سومی شیم ⚽️⚽️
هفته پیش خوشحال بودیم که یکی از دوست هامون و شرکت کننده های مسابقه جدیدمون، مجید فرزانه، که در مسابقه دیتای ترب (Torob) تا اون موقع نفر سوم بود، راه حل خودش رو با بقیه در دیسکورد روبواپیکس به اشتراک گذاشت.
و الان خیلی خوشحال تریم چون یکی دیگه از دوست هامون در روبواپیکس، محمد رضا حقیری عزیز، مدل تبدیل متن به تصویر خودش رو با نام "مانی"، به صورت open source در اختیار همه گذاشته.
برای آشنا شدن با مدل مانی میتونید پستی که قبلا راجع بهش درست کردیم رو ببینید:
https://www.linkedin.com/posts/roboepics_mann-e-image-generator-activity-6972510608785088514-zdBN
تفاوتی که نسخه جدید "مانی" با کلیپی که قبلا درست کردیم داره اینه که از دیتاهای Midjourney هم برای آموزش دادن مدل استفاده شده.
ما در روبواپیکس همیشه به دنبال اشتراک گذاری دانش بودیم و تلاش میکنیم تا ذره ذره برای ساخته شدن یک جامعه open source (متن باز) و صمیمی و پشتیبان، کارهایی که لازم هست رو انجام بدیم.
برای دسترسی به مدل میتونید به سرور دیسکوردمون مراجعه کنید و در کانال فرومی community projects روی پست مانی کلیک کنید و با محمدرضا در مورد مدل صحبت کنید.
لینک سرور دیسکورد:
https://discord.com/invite/8DMfjmn6gc
هفته پیش خوشحال بودیم که یکی از دوست هامون و شرکت کننده های مسابقه جدیدمون، مجید فرزانه، که در مسابقه دیتای ترب (Torob) تا اون موقع نفر سوم بود، راه حل خودش رو با بقیه در دیسکورد روبواپیکس به اشتراک گذاشت.
و الان خیلی خوشحال تریم چون یکی دیگه از دوست هامون در روبواپیکس، محمد رضا حقیری عزیز، مدل تبدیل متن به تصویر خودش رو با نام "مانی"، به صورت open source در اختیار همه گذاشته.
برای آشنا شدن با مدل مانی میتونید پستی که قبلا راجع بهش درست کردیم رو ببینید:
https://www.linkedin.com/posts/roboepics_mann-e-image-generator-activity-6972510608785088514-zdBN
تفاوتی که نسخه جدید "مانی" با کلیپی که قبلا درست کردیم داره اینه که از دیتاهای Midjourney هم برای آموزش دادن مدل استفاده شده.
ما در روبواپیکس همیشه به دنبال اشتراک گذاری دانش بودیم و تلاش میکنیم تا ذره ذره برای ساخته شدن یک جامعه open source (متن باز) و صمیمی و پشتیبان، کارهایی که لازم هست رو انجام بدیم.
برای دسترسی به مدل میتونید به سرور دیسکوردمون مراجعه کنید و در کانال فرومی community projects روی پست مانی کلیک کنید و با محمدرضا در مورد مدل صحبت کنید.
لینک سرور دیسکورد:
https://discord.com/invite/8DMfjmn6gc
Linkedin
RoboEpics on LinkedIn: Mann-E image generator
تا الان همه در مورد مدلهای Dall-E 2،Imagen و Parti شنیدیم.
امروز میخوایم مدلی به اسم مانی رو بهتون معرفی کنم که یکی از دوستای خوبمون به اسم Muhammadreza…
امروز میخوایم مدلی به اسم مانی رو بهتون معرفی کنم که یکی از دوستای خوبمون به اسم Muhammadreza…
👍5
Forwarded from همآوا | Hamava
🧠 مغز به گمان قوی و پیچیدهترین سامانه موجود در طبیعت است و شناخت اسرار آن دنیای پیش رو را متاثر خواهد کرد. دانش ناقص ما در مورد کارکرد مغز تاکنون منجر به نتایج شگفتانگیز در سامانههای مبتنی بر هوشمصنوعی بوده است که شواهد موجود نشان میدهد که در ترسیم دنیای حال و پیش رو بسیار تعیینکننده هستند.
🔰در هفتمین سمینار چشمانداز، دکتر علیرضا ولیزاده به صورت کلی و اجمالی در مورد ساز و کارهای ابتدایی پردازش اطلاعات و یادگیری در مغز صحبت میکنند و تحولات اخیر را در علوم و فناوریهای مربوط به مغز و اهمیت آنها در ترسیم چهره دنیای پیش رو را مرور خواهند کرد.
⏰ زمان: دوشنبه ۲۲ اسفند - ساعت ۱۴ تا ۱۶
📍مکان: کارخانه نوآوری آزادی، ورکشاپ زاویه
🔗 اطلاعات بیشتر و لینک ثبتنام:
https://evnd.co/nMICy
@hamava_if
🔰در هفتمین سمینار چشمانداز، دکتر علیرضا ولیزاده به صورت کلی و اجمالی در مورد ساز و کارهای ابتدایی پردازش اطلاعات و یادگیری در مغز صحبت میکنند و تحولات اخیر را در علوم و فناوریهای مربوط به مغز و اهمیت آنها در ترسیم چهره دنیای پیش رو را مرور خواهند کرد.
⏰ زمان: دوشنبه ۲۲ اسفند - ساعت ۱۴ تا ۱۶
📍مکان: کارخانه نوآوری آزادی، ورکشاپ زاویه
🔗 اطلاعات بیشتر و لینک ثبتنام:
https://evnd.co/nMICy
@hamava_if
👍1
مسابقهی جدید در روبواپیکس 😎
چالش هوش مصنوعی «شطرنج باز» با 45 میلیون تومان جایزه نقدی
صفحه شطرنج را تجزیه و تحلیل کنید
مهرهها را در یک صفحه شناسایی کنید
حرکت مهرهها را تشخیص دهید
و شانس پیروزی را پیشبینی کنید
دغدغهی اصلی روبواپیکس ساخت جامعهای هدفمند و پویا از متخصصان و علاقهمندان هوش مصنوعی است.
برای همین هم ما تمام تلاشمان را میکنیم و از تمام کسانی که میخواهند در این اکوسیستم قدمی بردارند حمایت میکنیم.
💥این مسابقه هم از اولین سری مسابقات هوش مصنوعی DueML است که به سفارش زیما (زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
این مسابقه از 5 چالش بینایی ماشین تشکیل شده که در یک ماه فرصت دارید تا به چالشها پاسخ دهید.
این مسابقه رو حتما برای دوستانتون و علاقه مندای هوش مصنوعی ارسال کنید
برای اطلاعات بیشتر و ثبت نام در مسابقه بر روی متن کلیک کنید.
_______________________________________
@Roboepics
چالش هوش مصنوعی «شطرنج باز» با 45 میلیون تومان جایزه نقدی
صفحه شطرنج را تجزیه و تحلیل کنید
مهرهها را در یک صفحه شناسایی کنید
حرکت مهرهها را تشخیص دهید
و شانس پیروزی را پیشبینی کنید
دغدغهی اصلی روبواپیکس ساخت جامعهای هدفمند و پویا از متخصصان و علاقهمندان هوش مصنوعی است.
برای همین هم ما تمام تلاشمان را میکنیم و از تمام کسانی که میخواهند در این اکوسیستم قدمی بردارند حمایت میکنیم.
💥این مسابقه هم از اولین سری مسابقات هوش مصنوعی DueML است که به سفارش زیما (زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
این مسابقه از 5 چالش بینایی ماشین تشکیل شده که در یک ماه فرصت دارید تا به چالشها پاسخ دهید.
این مسابقه رو حتما برای دوستانتون و علاقه مندای هوش مصنوعی ارسال کنید
برای اطلاعات بیشتر و ثبت نام در مسابقه بر روی متن کلیک کنید.
_______________________________________
@Roboepics
🔥3👌1
یادگیری ماشین به سبک مایکل شوماخر
مایکل شوماخر یه جمله داره که میگه رمز موفقیت من اینه که وقتی بقیه ترمز میکنن من بیشتر گاز میدم 🏎
حالا توی عید، بهترین فرصته که شما بیشتر از بقیه پدال گازو فشار بدید. برای همین ما در روبواپیکس براتون یه مسابقه آموزشی بینایی ماشین تحت عنوان شطرنج باز رو آماده کردیم که ۴۵ میلیون تومان جایزه نقدی داره 🤓
💥این مسابقه به سفارش زیما(زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
یکی از دوستامون در جامعه روبواپیکس هم یه ویدیو آموزشی در مورد قسمت بینایی ماشین این مسابقه درست کرده که ایده هایی رو به صورت کلی برای حل مسائل ارائه میده، اگه زیاد با بینایی ماشین کار نکردین میتونه بهتون تو مسابقه کمک کنه.
لینک ویدئو
فرصتو از دست ندید و همین الان روی متن کلیک کنید و توی مسابقه شرکت کنید.
با عضو شدن توی سرور دیسکورد روبواپیکس هم میتونید با ما و بقیه ی شرکت کننده ها در ارتباط باشید و اگر سوالی داشتید میتونید از بقیه بپرسید تا بهتون کمک کنن.
لینک سرور دیسکورد
@RoboEpics
مایکل شوماخر یه جمله داره که میگه رمز موفقیت من اینه که وقتی بقیه ترمز میکنن من بیشتر گاز میدم 🏎
حالا توی عید، بهترین فرصته که شما بیشتر از بقیه پدال گازو فشار بدید. برای همین ما در روبواپیکس براتون یه مسابقه آموزشی بینایی ماشین تحت عنوان شطرنج باز رو آماده کردیم که ۴۵ میلیون تومان جایزه نقدی داره 🤓
💥این مسابقه به سفارش زیما(زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥
یکی از دوستامون در جامعه روبواپیکس هم یه ویدیو آموزشی در مورد قسمت بینایی ماشین این مسابقه درست کرده که ایده هایی رو به صورت کلی برای حل مسائل ارائه میده، اگه زیاد با بینایی ماشین کار نکردین میتونه بهتون تو مسابقه کمک کنه.
لینک ویدئو
فرصتو از دست ندید و همین الان روی متن کلیک کنید و توی مسابقه شرکت کنید.
با عضو شدن توی سرور دیسکورد روبواپیکس هم میتونید با ما و بقیه ی شرکت کننده ها در ارتباط باشید و اگر سوالی داشتید میتونید از بقیه بپرسید تا بهتون کمک کنن.
لینک سرور دیسکورد
@RoboEpics
👏7
ایلان ماسک و تعدادی از رهبران هوش مصنوعی دنیا با امضا کردن نامهای سرگشاده خواستن که ساختن هوش مصنوعیهای بزرگتر از GPT4 رو به مدت 6 ماه متوقف کنند.
توی این نامه به مطالب مختلفی اشاره شده به عنوان مثال
◀️ سیستم های هوش مصنوعی خطرات عمیقی برای جامعه و بشریت دارن
◀️اصول هوش مصنوعی آسیلومار بر برنامه ریزی و مدیریت دقیق تاکید داره
◀️توسعه فعلی هوش مصنوعی سریع و غیرقابل پیش بینیه
◀️تصمیم گیری در مورد هوش مصنوعی نباید به رهبران فناوری غیر منتخب واگذار بشه
◀️برای آموزش سیستم های هوش مصنوعی قدرتمندتر از GPT4 به مدت 6 ماه توقف کنید.
◀️پروتکل های ایمنی مشترک را در طول بازهی توقف ایجاد کنید.
◀️تمرکز تحقیقات هوش مصنوعی رو تغییر بدید و بیشتر روی بهبود دقت، ایمنی و شفافیت کار کنید
◀️با سیاست گذارا برای توسعه سیستم های مدیریتی قوی مبتنی بر هوش مصنوعی کار کنید.
◀️به جامعه اجازه بدید تا با پیشرفت هوش مصنوعی هماهنگ بشن و با اون جامعه ای شکوفا رو هدف بگیرید
برای خوندن کامل نامه و افرادی که امضا کردند میتونید روی متن کلیک کنید.
@RoboEpics
توی این نامه به مطالب مختلفی اشاره شده به عنوان مثال
◀️ سیستم های هوش مصنوعی خطرات عمیقی برای جامعه و بشریت دارن
◀️اصول هوش مصنوعی آسیلومار بر برنامه ریزی و مدیریت دقیق تاکید داره
◀️توسعه فعلی هوش مصنوعی سریع و غیرقابل پیش بینیه
◀️تصمیم گیری در مورد هوش مصنوعی نباید به رهبران فناوری غیر منتخب واگذار بشه
◀️برای آموزش سیستم های هوش مصنوعی قدرتمندتر از GPT4 به مدت 6 ماه توقف کنید.
◀️پروتکل های ایمنی مشترک را در طول بازهی توقف ایجاد کنید.
◀️تمرکز تحقیقات هوش مصنوعی رو تغییر بدید و بیشتر روی بهبود دقت، ایمنی و شفافیت کار کنید
◀️با سیاست گذارا برای توسعه سیستم های مدیریتی قوی مبتنی بر هوش مصنوعی کار کنید.
◀️به جامعه اجازه بدید تا با پیشرفت هوش مصنوعی هماهنگ بشن و با اون جامعه ای شکوفا رو هدف بگیرید
برای خوندن کامل نامه و افرادی که امضا کردند میتونید روی متن کلیک کنید.
@RoboEpics
👎9👍7😁1
مدل بزرگ زبانی برای کارهای مالی
بلومبرگ مقالهای رو منتشر کرده که توی اون BloombergGPT رو معرفی کرده.
این مدل بزرگ زبانی 50 میلیارد پارامتر داره و روی مقدار زیادی دادههای اقتصادی آموزش دیده و میخوان که از اون برای کمک به کارهای اقتصادی استفاده کنن.
برای خوندن مقاله روی متن کلیک کنید.
@RoboEpics
بلومبرگ مقالهای رو منتشر کرده که توی اون BloombergGPT رو معرفی کرده.
این مدل بزرگ زبانی 50 میلیارد پارامتر داره و روی مقدار زیادی دادههای اقتصادی آموزش دیده و میخوان که از اون برای کمک به کارهای اقتصادی استفاده کنن.
برای خوندن مقاله روی متن کلیک کنید.
@RoboEpics
This media is not supported in your browser
VIEW IN TELEGRAM
مدلی که با یک کلیک، هر چیزی رو که بخواید از عکس و ویدئو جدا میکنه 😮
تیم متا مدلی رو به اسم SAM (Segment Anything Model) معرفی کرده که با استفاده از اون شما میتونید هر چیزی رو توی عکس و ویدئو جدا کنید.
مدل SAM قابلیت ادغام شدن با مدلهای دیگه رو هم داره به عنوان مثال شما میتونید اونو روی تکنولوژیهای AR , VR سوار کنید و باهاش محصولهای هیجان انگیزی رو درست کنید.
میتونید اونو با مدلهای تبدیل صدا به متن ادغام کنید و افراد با استفاده از صدا بتونن چیزهایی که میخوان رو جدا کنن و همینطور میتونید از خروجی هایی مدل برای ساخت مدلهای سه بعدی استفاده کنید.
برای دیدن سایت این محصول میتونید روی متن کنید.
برای خوندن کامل بلاگ میتونید روی این متن کنید.
برای دیدن گیت هاب این مدل هم میتونید روی متن کلیک کنید.
این پست رو حتما با دوستاتون و افرادی که علاقهمندن به اشتراک بذارید 😎
@RoboEpics
تیم متا مدلی رو به اسم SAM (Segment Anything Model) معرفی کرده که با استفاده از اون شما میتونید هر چیزی رو توی عکس و ویدئو جدا کنید.
مدل SAM قابلیت ادغام شدن با مدلهای دیگه رو هم داره به عنوان مثال شما میتونید اونو روی تکنولوژیهای AR , VR سوار کنید و باهاش محصولهای هیجان انگیزی رو درست کنید.
میتونید اونو با مدلهای تبدیل صدا به متن ادغام کنید و افراد با استفاده از صدا بتونن چیزهایی که میخوان رو جدا کنن و همینطور میتونید از خروجی هایی مدل برای ساخت مدلهای سه بعدی استفاده کنید.
برای دیدن سایت این محصول میتونید روی متن کنید.
برای خوندن کامل بلاگ میتونید روی این متن کنید.
برای دیدن گیت هاب این مدل هم میتونید روی متن کلیک کنید.
این پست رو حتما با دوستاتون و افرادی که علاقهمندن به اشتراک بذارید 😎
@RoboEpics
یک مقاله کلی از معماری و الگوریتمهای ترانسفورمرها (Transformer) که توسط تیم Deepmind نوشته شده.
هدف کلی این مقاله اینه که یه نمای کلی دقیق و مستقل از معماریها و الگوریتمهای ترانسفورمرها بده.(نه نتایج)
مطالب این مقاله در مورد اینه که :
⬅️ ترانسفورمرها چین؟
⬅️ چی جوری آموزش داده میشن؟
⬅️ برای چه چیزی استفاده میشن؟
⬅️ اجزای اصلی معماری اونها چیه؟
⬅️ یه توضیح کلی در مورد بهترین مدلهای موجود که با ترانسفورمرها نوشته شدن رو میده.
برای فهمیدن این مقاله لازمه که با اصطلاحات پایه ی یادگیری ماشین و معماری شبکههای عصبی ساده تر مثل MLP آشنا باشید.
برای دیدن مقاله رو متن کلیک کنید.
این پیام رو حتما برای دوستان علاقهمندتون هم بفرستید 😎
@RoboEpics
هدف کلی این مقاله اینه که یه نمای کلی دقیق و مستقل از معماریها و الگوریتمهای ترانسفورمرها بده.(نه نتایج)
مطالب این مقاله در مورد اینه که :
⬅️ ترانسفورمرها چین؟
⬅️ چی جوری آموزش داده میشن؟
⬅️ برای چه چیزی استفاده میشن؟
⬅️ اجزای اصلی معماری اونها چیه؟
⬅️ یه توضیح کلی در مورد بهترین مدلهای موجود که با ترانسفورمرها نوشته شدن رو میده.
برای فهمیدن این مقاله لازمه که با اصطلاحات پایه ی یادگیری ماشین و معماری شبکههای عصبی ساده تر مثل MLP آشنا باشید.
برای دیدن مقاله رو متن کلیک کنید.
این پیام رو حتما برای دوستان علاقهمندتون هم بفرستید 😎
@RoboEpics
👍1
کوالا، چت بات opensource دانشگاه برکلی که روی مدل LLama متا آموزش داده شده.🐨🐨
این چت بات روی مدل 13 میلیارد پارامتری LLama متا آموزش داده شده و همینطور روی داده های مکالمه ی افراد روی اینترنت fine tune شده.
بر اساس بلاگ خود دانشگاه برکلی کوالا در مقایسه با مدل Alpaca دانشگاه استنفورد و chatgpt، به خوبی میتونه به سوالات کاربرا جواب بده و جوابهایی رو تولید میکنه که بیشتر اوقات نسبت به Alpaca بیشتر ترجیح داده میشه و در نیمی از مواقع جواب ها با chatgpt برابره.
این مدل هنوز از نظر محتوایی، ایمنی و جوابهایی که میده هنوز مشکلات زیادی داره و فقط برای پروژههای تحقیقاتی اجازه استفاده از این مدل رو میدن.
برای خوندن کامل مقاله روی متن کلیک کنید.
حتما این پست رو برای دوستان علاقهمندتون هم بفرستید 😎👌
@RoboEpics
این چت بات روی مدل 13 میلیارد پارامتری LLama متا آموزش داده شده و همینطور روی داده های مکالمه ی افراد روی اینترنت fine tune شده.
بر اساس بلاگ خود دانشگاه برکلی کوالا در مقایسه با مدل Alpaca دانشگاه استنفورد و chatgpt، به خوبی میتونه به سوالات کاربرا جواب بده و جوابهایی رو تولید میکنه که بیشتر اوقات نسبت به Alpaca بیشتر ترجیح داده میشه و در نیمی از مواقع جواب ها با chatgpt برابره.
این مدل هنوز از نظر محتوایی، ایمنی و جوابهایی که میده هنوز مشکلات زیادی داره و فقط برای پروژههای تحقیقاتی اجازه استفاده از این مدل رو میدن.
برای خوندن کامل مقاله روی متن کلیک کنید.
حتما این پست رو برای دوستان علاقهمندتون هم بفرستید 😎👌
@RoboEpics
تیم Databricks به تازگی Dolly 2.0 رو منتشر کرد اولین مدل زبانی بزرگ open source که با گرفتن API میتونید به صورت رایگان از این مدل استفاده تجاری کنید.
این مدل 12 میلیارد پارامتری مدلی از خانوادهی EleutherAI pythia هست و روی دادههای کاملا با کیفیت انسانی fine tune شده.
برای خوندن کامل بلاگ روی متن کلیک کنید.
برای دیدن مدل در hugging face هم میتونید روی متن کلیک کنید.
این پست رو حتما برای دوستان علاقهمندتون بفرستید.😎👍
@RoboEpics
این مدل 12 میلیارد پارامتری مدلی از خانوادهی EleutherAI pythia هست و روی دادههای کاملا با کیفیت انسانی fine tune شده.
برای خوندن کامل بلاگ روی متن کلیک کنید.
برای دیدن مدل در hugging face هم میتونید روی متن کلیک کنید.
این پست رو حتما برای دوستان علاقهمندتون بفرستید.😎👍
@RoboEpics
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
دیگه لازم نیست برای خرید اکانت midjourney هزینه کنید! 😁
مدل Stable diffusion XL روی پلتفرم clip drop قابل استفادست.
این مدل آخرین مدل stable diffusion هست که توی ساخت تصاویر واقع گرایانه خیلی عالی عمل میکنه و حتی در بعضی حوزه ها از midjourney هم بهتر عمل میکنه.
شما با ساخت حساب کاربری توی سایت میتونید روزانه 60 تا عکس رایگان با هوش مصنوعی تولید کنید.
برای استفاده از مدل روی متن کلیک کنید.
این پست رو حتما برای کسایی که فکر میکنی به این مدل نیاز دارن بفرست. 😎
@RoboEpics
مدل Stable diffusion XL روی پلتفرم clip drop قابل استفادست.
این مدل آخرین مدل stable diffusion هست که توی ساخت تصاویر واقع گرایانه خیلی عالی عمل میکنه و حتی در بعضی حوزه ها از midjourney هم بهتر عمل میکنه.
شما با ساخت حساب کاربری توی سایت میتونید روزانه 60 تا عکس رایگان با هوش مصنوعی تولید کنید.
برای استفاده از مدل روی متن کلیک کنید.
این پست رو حتما برای کسایی که فکر میکنی به این مدل نیاز دارن بفرست. 😎
@RoboEpics
🤩1
تا حالا به این فکر کردین وقتی که به ChatGPT یا GPT-4 میگیم که چیزی رو داره اشتباه میگه میفهمه و اونو اصلاح میکنه؟
آیا براتون عجیب نیست که یه مدل با پارامترهای ثابت چرا دوباره همون جواب یکسان قبلی رو بهون نمیده؟
این قدرت مدلهای بزرگ زبانیه که این اجازه رو میده توی Context (موضوعی که دارن در موردش صحبت میکنن) یاد بگیرن.
اگر با ChatGPT صحبت طولانی کرده باشین و بهش گفته باشید که یه سری جزییات توی بحثتون رو تغییر بده و اون موضوع ها رو همیشه تو ذهنش نگه داره میبینید که به مرور یه سری چیزهایی که گفتید رو یادش میره.
به حداکثر طول کلماتی که یک مدل در یک انتشار به جلو میتونه انجام بده رو اصطلاحا Context window میگن و این معیار خیلی مهمیه و توی تمام مدلهای بزرگ زبانی اونو اندازه گیری میکنن و مقدار این معیار GPT3 هزار کلمست و در GPT4 به 25 هزار کلمه میرسه.
حالا یه مقاله ای هست که از طرف مایکروسافت منتشر شده که توی اون توضیح میده که این مدل های برزگ زبانی چی جوری میتونن توی اون زمینه ای که باهاش صحبت میکنی یاد بگیرن.
لینک مقاله
این پست رو حتما برای دوستان علاقه مندتون بفرستید😎👍
@RoboEpics
آیا براتون عجیب نیست که یه مدل با پارامترهای ثابت چرا دوباره همون جواب یکسان قبلی رو بهون نمیده؟
این قدرت مدلهای بزرگ زبانیه که این اجازه رو میده توی Context (موضوعی که دارن در موردش صحبت میکنن) یاد بگیرن.
اگر با ChatGPT صحبت طولانی کرده باشین و بهش گفته باشید که یه سری جزییات توی بحثتون رو تغییر بده و اون موضوع ها رو همیشه تو ذهنش نگه داره میبینید که به مرور یه سری چیزهایی که گفتید رو یادش میره.
به حداکثر طول کلماتی که یک مدل در یک انتشار به جلو میتونه انجام بده رو اصطلاحا Context window میگن و این معیار خیلی مهمیه و توی تمام مدلهای بزرگ زبانی اونو اندازه گیری میکنن و مقدار این معیار GPT3 هزار کلمست و در GPT4 به 25 هزار کلمه میرسه.
حالا یه مقاله ای هست که از طرف مایکروسافت منتشر شده که توی اون توضیح میده که این مدل های برزگ زبانی چی جوری میتونن توی اون زمینه ای که باهاش صحبت میکنی یاد بگیرن.
لینک مقاله
این پست رو حتما برای دوستان علاقه مندتون بفرستید😎👍
@RoboEpics
🐳3
This media is not supported in your browser
VIEW IN TELEGRAM
تیم متا به تازگی یک هوش مصنوعی برای کودکان منتشر کرد! 😃
تیم متا یک ابزار پویانمایی مبتنی بر هوش مصنوعی و 180 هزار عکس از نقاشی کودکان که با استفاده از اون تونستن این مدل رو بسازن منتشر کردن.
اسم این ابزار رو Animated Drawing گذاشتن و قابلیت تشخیص شکل، جدا کردن نقاشی از پس زمینه، اضافه کردن مفصل های حرکتی به نقاشی و حرکت دادن نقاشی رو داره.
شما همین الان میتونید از این محصول استفاده کنید و نقاشیها رو به حرکت دربیارید.
لینک بلاگ
لینک استفاده از مدل
لینک گیت هاب مدل
این پست رو برای کسایی که فکر میکنید علاقه مندن بفرستید😎👌
@RoboEpics
تیم متا یک ابزار پویانمایی مبتنی بر هوش مصنوعی و 180 هزار عکس از نقاشی کودکان که با استفاده از اون تونستن این مدل رو بسازن منتشر کردن.
اسم این ابزار رو Animated Drawing گذاشتن و قابلیت تشخیص شکل، جدا کردن نقاشی از پس زمینه، اضافه کردن مفصل های حرکتی به نقاشی و حرکت دادن نقاشی رو داره.
شما همین الان میتونید از این محصول استفاده کنید و نقاشیها رو به حرکت دربیارید.
لینک بلاگ
لینک استفاده از مدل
لینک گیت هاب مدل
این پست رو برای کسایی که فکر میکنید علاقه مندن بفرستید😎👌
@RoboEpics
🐳3
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Dino v2 به درد همه ی کسایی که بینایی ماشین کار میکنن، میخوره 😎
متا امروز مدل Dino v2 رو منتشر کرد که با اون میتونید مدل های بینایی ماشین رو با کارایی بالا آموزش بدید.
این مدل خودنظارتی(self supervised) بینایی با بهره گیری از معماری ترانسفورمر ها میتونه توی تموم کارهای بینایی ماشین شما نقش مهمی رو ایفا کنه و به fine tune هم نیازی نداره.
با این مدل میتونید بدون نیاز به مقدار زیادی از داده های برچسب خورده مدل بینایی ماشین خودتونو آموزش بدید.
از این مدل میتونید توی طبقه بندی کردن تصاویر(classification)، تقسیم بندی عکس(segmentation)، بازیابی عکس(image retrieval) و تخمین عمق(depth estimation) عکس استفاده کنید.
با این مدل میتونید مستقیما مدلتون رو با خود عکسها آموزش بدید و دیگه نیازی به توضیح متنی برای عکسها ندارید.
این مدل قابلیت یادگیری با هر مجموعه عکسی رو هم داره.
نسخه از پیش آموزش دیده Dino v2 موجوده و با مدلهای CLIP و Open CLIP توی طیف گسترده ای از کارها میتونه رقابت کنه.
لینک دموی مدل
لینک بلاگ
لینک گیت هاب
این پست رو حتما برای افرادی که فکر میکنید علاقه مندن بفرستید😎
@RoboEpics
متا امروز مدل Dino v2 رو منتشر کرد که با اون میتونید مدل های بینایی ماشین رو با کارایی بالا آموزش بدید.
این مدل خودنظارتی(self supervised) بینایی با بهره گیری از معماری ترانسفورمر ها میتونه توی تموم کارهای بینایی ماشین شما نقش مهمی رو ایفا کنه و به fine tune هم نیازی نداره.
با این مدل میتونید بدون نیاز به مقدار زیادی از داده های برچسب خورده مدل بینایی ماشین خودتونو آموزش بدید.
از این مدل میتونید توی طبقه بندی کردن تصاویر(classification)، تقسیم بندی عکس(segmentation)، بازیابی عکس(image retrieval) و تخمین عمق(depth estimation) عکس استفاده کنید.
با این مدل میتونید مستقیما مدلتون رو با خود عکسها آموزش بدید و دیگه نیازی به توضیح متنی برای عکسها ندارید.
این مدل قابلیت یادگیری با هر مجموعه عکسی رو هم داره.
نسخه از پیش آموزش دیده Dino v2 موجوده و با مدلهای CLIP و Open CLIP توی طیف گسترده ای از کارها میتونه رقابت کنه.
لینک دموی مدل
لینک بلاگ
لینک گیت هاب
این پست رو حتما برای افرادی که فکر میکنید علاقه مندن بفرستید😎
@RoboEpics
👍3🤯2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت Nvidia تحقیقات خودشو روی مدلهای تبدیل متن به ویدئو منتشر کرد 🤯
مدلهای انتشار پنهان ویدئویی (Video Latent Diffusion Models) با استفاده از مدل انتشار (diffusion model) توی یک فضای پنهان فشرده (Compressed latent space) ویدئوهایی با وضوح بالا تولید میکنن که در عین حال از منابع محسباتی کمتری هم استفاده میکنن.
نحوهی عملکرد این مدل به صورت زیر خلاصه میشه:
1. روی تموم دیتاست عکسها LDM رو پیش آموزش میدیم.
2. با اضافه کردن لایههای زمانی مثل فریم فیلم، LDM تصویر رو به LDM ویدیویی تبدیل میکنیم.
3. برای ساخت مدل تولید ویدئو، LDM ویدیویی روی دنبالهای از ویدیوهای کدگذاری شده fine-tune میکنیم.
4. به صورت موقت نمونه بردارهای مدل انتشاری (diffusion model upsamplers) رو روی تولید ویدیو با کیفیت بالا تنظیم میکنیم.
5. برای اینکه بخوایم مدلمون عملکرد خیلی خوبی پیدا کنه، LDM ویدیویی رو روی ویدیوهای واقعی 1024*512 اعتبار سنجی میکنیم.
لینک سایت
لینک مقاله
این پست رو حتما برای دوستای علاقهمندتون بفرستید😎👌
@RoboEpics
مدلهای انتشار پنهان ویدئویی (Video Latent Diffusion Models) با استفاده از مدل انتشار (diffusion model) توی یک فضای پنهان فشرده (Compressed latent space) ویدئوهایی با وضوح بالا تولید میکنن که در عین حال از منابع محسباتی کمتری هم استفاده میکنن.
نحوهی عملکرد این مدل به صورت زیر خلاصه میشه:
1. روی تموم دیتاست عکسها LDM رو پیش آموزش میدیم.
2. با اضافه کردن لایههای زمانی مثل فریم فیلم، LDM تصویر رو به LDM ویدیویی تبدیل میکنیم.
3. برای ساخت مدل تولید ویدئو، LDM ویدیویی روی دنبالهای از ویدیوهای کدگذاری شده fine-tune میکنیم.
4. به صورت موقت نمونه بردارهای مدل انتشاری (diffusion model upsamplers) رو روی تولید ویدیو با کیفیت بالا تنظیم میکنیم.
5. برای اینکه بخوایم مدلمون عملکرد خیلی خوبی پیدا کنه، LDM ویدیویی رو روی ویدیوهای واقعی 1024*512 اعتبار سنجی میکنیم.
لینک سایت
لینک مقاله
این پست رو حتما برای دوستای علاقهمندتون بفرستید😎👌
@RoboEpics
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
خودتون رو برای پارک ژوراسیک آماده کنید 😎
توی ویدئو مدلی رو میبینید که حرکات موجودات دوپا با استفاده از عضلههای سه بعدی رو شبیه سازی میکنه.
این کنترلهای حرکتی میتونه توی زمان واقعی با سرعتهای مختلف، به سمت هدف های متفاوت و در مسیرهای ناهموار حرکت کنن.
لینک مقاله
@RoboEpics
توی ویدئو مدلی رو میبینید که حرکات موجودات دوپا با استفاده از عضلههای سه بعدی رو شبیه سازی میکنه.
این کنترلهای حرکتی میتونه توی زمان واقعی با سرعتهای مختلف، به سمت هدف های متفاوت و در مسیرهای ناهموار حرکت کنن.
لینک مقاله
@RoboEpics
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
با استفاده از این سایت میتونید شبکههای عصبی پیچشی(convolutional neural network) رو بهتر درک کنید.
این سایت CNNها رو تصویر سازی میکنه و توضیح میده که توی هر لایه از این شبکههای عصبی چه اتفاقی میافته.
میتونید این سایت رو توی مرورگر خود باز کنید و با CNNها بازی کنید و یاد بگیرید.
لینک سایت
لینک مقالهی یادگیری CNNها با استفاده از تصویرسازی تعاملی
این پست رو حتما برای کسانی که توی بینایی ماشین کار میکنن بفرستید😎
@RoboEpics
این سایت CNNها رو تصویر سازی میکنه و توضیح میده که توی هر لایه از این شبکههای عصبی چه اتفاقی میافته.
میتونید این سایت رو توی مرورگر خود باز کنید و با CNNها بازی کنید و یاد بگیرید.
لینک سایت
لینک مقالهی یادگیری CNNها با استفاده از تصویرسازی تعاملی
این پست رو حتما برای کسانی که توی بینایی ماشین کار میکنن بفرستید😎
@RoboEpics
👍3
تاریخچه چتباتها و مدلهای بزرگ زبانی 📚
به مدت 30 سال از سال 1987 تا 2017، مدلهای یادگیری ماشینی که بر اساس ویژگی یاد میگرفتن ( feature based machine learning models) رو معمولا برای کارهای پردازش زبان طبیعی مثل تجزیه و تحلیل احساسات یا پیدا کردن اسم شرکتها تو متن استفاده میکردن.
درسته که این مدلها تو مثالهای بالا خوب کار میکردن اما توانایی درک زبان رو نداشتن. برای اینکه بتونیم درک بهتری از زبان با روشهای قدیمی داشته باشیم نیاز داریم که مقدار قابل توجهی کد بزنیم که ساختار و معنای جملات و مفهوم بعضی کلمات و جملات دو پهلو رو مشخص کنیم و همینطور باید خیلی دادهی دستنویس تولید کنیم که قواعد دستور زبان رو به مدل بفهمونیم. این رویکرد خیلی پرهزینه و مقیاس ناپذیر بود و همینطور به طور گسترده قابل استفاده توی کارهای مختلف نبود.
تا اینکه توی سال 2018 با توسعه نسل جدیدی از مدلهای بزرگ زبانی، درک زبان طبیعی به صورت کلی متحول شد.
مدلهایی مثل BERT و GPT-3 با استفاده از یادگیری خودنظارتی(self-supervised) روی مقادیر خیلی زیادی از دادههای متنی آموزش داده شدن تا بتونن ساختار و معنای متن رو درک کنن.
این مدلها از Transformerها استفاده کردن که یک فناوری شبکه عصبی جدید بود که توی سال 2017 معرفی شد که کلماتی که با هم در یک زمینه (context) هستند در فضای برداری هم نزدیک به هم هستند و مدل کلمات رو با استفاده از درکی که از Context داره به صورت احتمالاتی در کنار هم قرار میده و این کار به مدل این قدرت رو میداد معنی جملات رو بهتر بفهمن و همینطور با استفاده از روشهای stochastic gradient descent یا reinforcement learning میشه که این مدلها رو برای درک بهتر زبان و انجام کارهای مختلف توی حوزهی NLP آموزش داد.
برای بیشتر آشنا شدن با معماری و الگوریتمهای transformer ها میتونید به مقاله زیر مراجعه کنید.
لینک مقاله
@RoboEpics
به مدت 30 سال از سال 1987 تا 2017، مدلهای یادگیری ماشینی که بر اساس ویژگی یاد میگرفتن ( feature based machine learning models) رو معمولا برای کارهای پردازش زبان طبیعی مثل تجزیه و تحلیل احساسات یا پیدا کردن اسم شرکتها تو متن استفاده میکردن.
درسته که این مدلها تو مثالهای بالا خوب کار میکردن اما توانایی درک زبان رو نداشتن. برای اینکه بتونیم درک بهتری از زبان با روشهای قدیمی داشته باشیم نیاز داریم که مقدار قابل توجهی کد بزنیم که ساختار و معنای جملات و مفهوم بعضی کلمات و جملات دو پهلو رو مشخص کنیم و همینطور باید خیلی دادهی دستنویس تولید کنیم که قواعد دستور زبان رو به مدل بفهمونیم. این رویکرد خیلی پرهزینه و مقیاس ناپذیر بود و همینطور به طور گسترده قابل استفاده توی کارهای مختلف نبود.
تا اینکه توی سال 2018 با توسعه نسل جدیدی از مدلهای بزرگ زبانی، درک زبان طبیعی به صورت کلی متحول شد.
مدلهایی مثل BERT و GPT-3 با استفاده از یادگیری خودنظارتی(self-supervised) روی مقادیر خیلی زیادی از دادههای متنی آموزش داده شدن تا بتونن ساختار و معنای متن رو درک کنن.
این مدلها از Transformerها استفاده کردن که یک فناوری شبکه عصبی جدید بود که توی سال 2017 معرفی شد که کلماتی که با هم در یک زمینه (context) هستند در فضای برداری هم نزدیک به هم هستند و مدل کلمات رو با استفاده از درکی که از Context داره به صورت احتمالاتی در کنار هم قرار میده و این کار به مدل این قدرت رو میداد معنی جملات رو بهتر بفهمن و همینطور با استفاده از روشهای stochastic gradient descent یا reinforcement learning میشه که این مدلها رو برای درک بهتر زبان و انجام کارهای مختلف توی حوزهی NLP آموزش داد.
برای بیشتر آشنا شدن با معماری و الگوریتمهای transformer ها میتونید به مقاله زیر مراجعه کنید.
لینک مقاله
@RoboEpics
❤3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
از این به بعد ChatGPT صدا رو هم میشنوه و جواب میده 🤯
کم کم میتونیم آمادهی اومدن نسل جدید دستیارهای هوشمند باشیم که با قدرت گرفتن از ChatGPT و با استفاده از Plug-in هایی که برای ChatGPT مینویسن، میتونیم فقط با صحبت کردن با یک هوش مصنوعی تمام کارهایی که لازمه رو انجام بدیم به عنوان مثال خرید کنیم، برنامههای مختلف برای خودمون برنامه ریزی کنیم و ...
با توجه به پیشرفت و رشدی که میبینیم میتونیم توی آیندهی نزدیک شاهد این دستیارهای هوشمند باشیم.
تیمی که روی این مدل کار کردن اسمش رو AudioGPT گذاشتن و اونو به صورت open source گذاشتن تا بقیه هم بتونن ازش استفاده کنن.
لینک مقاله
لینک گیت هاب مدل
این پست رو حتما برای افراد علاقهمند بفرستید😎
@RoboEpics
کم کم میتونیم آمادهی اومدن نسل جدید دستیارهای هوشمند باشیم که با قدرت گرفتن از ChatGPT و با استفاده از Plug-in هایی که برای ChatGPT مینویسن، میتونیم فقط با صحبت کردن با یک هوش مصنوعی تمام کارهایی که لازمه رو انجام بدیم به عنوان مثال خرید کنیم، برنامههای مختلف برای خودمون برنامه ریزی کنیم و ...
با توجه به پیشرفت و رشدی که میبینیم میتونیم توی آیندهی نزدیک شاهد این دستیارهای هوشمند باشیم.
تیمی که روی این مدل کار کردن اسمش رو AudioGPT گذاشتن و اونو به صورت open source گذاشتن تا بقیه هم بتونن ازش استفاده کنن.
لینک مقاله
لینک گیت هاب مدل
این پست رو حتما برای افراد علاقهمند بفرستید😎
@RoboEpics
👍4🔥2