RoboEpics
471 subscribers
81 photos
14 videos
121 links
روبواپیکس، پلتفرم برون سپاری چالش‌های هوش مصنوعی
با هم نگاهی به آینده از دریچه هوش مصنوعی خواهیم داشت.

🔗 https://roboepics.com/
🔗 https://www.instagram.com/roboepics
🔗 https://www.linkedin.com/company/roboepics

پشتیبانی
@smehrk
@hfmasaeli
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
یک قدم به ربات‌های WestWorld نزدیک‌تر شدیم


تیم Clone بعد از 8 سال تحقیق و توسعه توانستند دستی روباتیک با الهام از ماهیچه‌های دست انسان درست کنند و هدف آن‌ها ساخت ربات‌هایی است که کار‌های یدی انسان‌ها را انجام دهد.

برای ساخت این دست از مواد بازیافتی استفاده می‌شود که هزینه‌‌ی آن را به شدت کاهش می‌دهد.
این دست تمام آزادی‌ها و حرکات دست انسانی را دارد، 750 گرم وزن دارد و می‌تواند 7 کیلوگرم را بلند کند.

برای اطلاعات بیشتر می‌توانید بر روی این متن کلیک کنید.




@Roboepics
🤔2😱2
دو گل داریم🌻🌷، دوسش داریم، منتظر سومی شیم ⚽️⚽️


هفته پیش خوشحال بودیم که یکی از دوست هامون و شرکت کننده های مسابقه جدیدمون، مجید فرزانه، که در مسابقه دیتای ترب (Torob) تا اون موقع نفر سوم بود، راه حل خودش رو با بقیه در دیسکورد روبواپیکس به اشتراک گذاشت.
و الان خیلی خوشحال تریم چون یکی دیگه از دوست هامون در روبواپیکس، محمد رضا حقیری عزیز، مدل تبدیل متن به تصویر خودش رو با نام "مانی"، به صورت open source در اختیار همه گذاشته.
برای آشنا شدن با مدل مانی می‌تونید پستی که قبلا راجع بهش درست کردیم رو ببینید:

https://www.linkedin.com/posts/roboepics_mann-e-image-generator-activity-6972510608785088514-zdBN

تفاوتی که نسخه جدید "مانی" با کلیپی که قبلا درست کردیم داره اینه که از دیتاهای Midjourney هم برای آموزش دادن مدل استفاده شده.

ما در روبواپیکس همیشه به دنبال اشتراک گذاری دانش بودیم و تلاش میکنیم تا ذره ذره برای ساخته شدن یک جامعه open source (متن باز) و صمیمی و پشتیبان، کارهایی که لازم هست رو انجام بدیم.

برای دسترسی به مدل می‌تونید به سرور دیسکوردمون مراجعه کنید و در کانال فرومی community projects روی پست مانی کلیک کنید و با محمدرضا در مورد مدل صحبت کنید.

لینک سرور دیسکورد:
https://discord.com/invite/8DMfjmn6gc
👍5
Forwarded from هم‌آوا | Hamava
🧠 مغز به گمان قوی و پیچیده­‌ترین سامانه موجود در طبیعت است و شناخت اسرار آن دنیای پیش رو را متاثر خواهد کرد. دانش ناقص ما در مورد کارکرد مغز تاکنون منجر به نتایج شگفت‌انگیز در سامانه‌های مبتنی بر  هوش‌مصنوعی بوده است که شواهد موجود نشان می­دهد که در ترسیم دنیای حال و پیش­ رو بسیار تعیین‌کننده هستند.
🔰در هفتمین سمینار چشم‌انداز، دکتر علیرضا ولیزاده به صورت کلی و اجمالی در مورد ساز و کارهای ابتدایی پردازش اطلاعات و یادگیری در مغز صحبت می‌کنند و تحولات اخیر را در علوم و فناوری­‌های مربوط به مغز و اهمیت آن­‌ها در ترسیم چهره دنیای پیش رو را مرور خواهند کرد.

زمان: دوشنبه ۲۲ اسفند - ساعت ۱۴ تا ۱۶
📍مکان: کارخانه نوآوری آزادی، ورکشاپ زاویه
🔗 اطلاعات بیشتر و لینک ثبت‌نام:

https://evnd.co/nMICy

@hamava_if
👍1
مسابقه‌‌ی جدید در روبواپیکس 😎

چالش هوش مصنوعی «شطرنج باز» با 45 میلیون تومان جایزه نقدی

صفحه شطرنج را تجزیه و تحلیل کنید
مهره‌ها را در یک صفحه شناسایی کنید
حرکت مهره‌ها را تشخیص دهید
و شانس پیروزی را پیش‌بینی کنید

دغدغه‌ی اصلی روبواپیکس ساخت جامعه‌ای هدفمند و پویا از متخصصان و علاقه‌مندان هوش مصنوعی است.

برای همین هم ما تمام تلاشمان را می‌کنیم و از تمام کسانی که می‌خواهند در این اکوسیستم قدمی بردارند حمایت می‌کنیم.

💥این مسابقه هم از اولین سری مسابقات هوش مصنوعی DueML است که به سفارش زیما (زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥

این مسابقه از 5 چالش بینایی ماشین تشکیل شده که در یک ماه فرصت دارید تا به چالش‌ها پاسخ دهید.

این مسابقه رو حتما برای دوستانتون و علاقه مندای هوش مصنوعی ارسال کنید


برای اطلاعات بیشتر و ثبت نام در مسابقه بر روی متن کلیک کنید.


_______________________________________
@Roboepics
🔥3👌1
نوروز 1402 رو با عکسی که midjourney از عید ایرانی کشیده بهتون تبریک میگیم و برای همتون آرزوی موفقیت و سلامتی می‌کنیم.
🎉15👍2🕊2
یادگیری ماشین به سبک مایکل شوماخر

مایکل شوماخر یه جمله داره که میگه رمز موفقیت من اینه که وقتی بقیه ترمز میکنن من بیشتر گاز میدم 🏎

حالا توی عید، بهترین فرصته که شما بیشتر از بقیه پدال گازو فشار بدید. برای همین ما در روبواپیکس براتون یه مسابقه آموزشی بینایی ماشین تحت عنوان شطرنج باز رو آماده کردیم که ۴۵ میلیون تومان جایزه نقدی داره 🤓

💥این مسابقه به سفارش زیما(زیست بوم ماجراجوی آینده) و با حمایت شرکت فناپ در حال برگزاری هست.💥

یکی از دوستامون در جامعه روبواپیکس هم یه ویدیو آموزشی در مورد قسمت بینایی ماشین این مسابقه درست کرده که ایده هایی رو به صورت کلی برای حل مسائل ارائه میده، اگه زیاد با بینایی ماشین کار نکردین می‌تونه بهتون تو مسابقه کمک کنه.

لینک ویدئو

فرصتو از دست ندید و همین الان روی متن کلیک کنید و توی مسابقه شرکت کنید.


با عضو شدن توی سرور دیسکورد روبواپیکس هم میتونید با ما و بقیه ی شرکت کننده ها در ارتباط باشید و اگر سوالی داشتید میتونید از بقیه بپرسید تا بهتون کمک کنن.

لینک سرور دیسکورد

@RoboEpics
👏7
ایلان ماسک و تعدادی از رهبران هوش مصنوعی دنیا با امضا کردن نامه‌ای سرگشاده خواستن که ساختن هوش مصنوعی‌های بزرگتر از GPT4 رو به مدت 6 ماه متوقف کنند.

توی این نامه به مطالب مختلفی اشاره شده به عنوان مثال
◀️ سیستم های هوش مصنوعی خطرات عمیقی برای جامعه و بشریت دارن
◀️اصول هوش مصنوعی آسیلومار بر برنامه ریزی و مدیریت دقیق تاکید داره
◀️توسعه فعلی هوش مصنوعی سریع و غیرقابل پیش بینیه
◀️تصمیم گیری در مورد هوش مصنوعی نباید به رهبران فناوری غیر منتخب واگذار بشه
◀️برای آموزش سیستم های هوش مصنوعی قدرتمندتر از GPT4 به مدت 6 ماه توقف کنید.
◀️پروتکل های ایمنی مشترک را در طول بازه‌ی توقف ایجاد کنید.
◀️تمرکز تحقیقات هوش مصنوعی رو تغییر بدید و بیشتر روی بهبود دقت، ایمنی و شفافیت کار کنید
◀️با سیاست گذارا برای توسعه سیستم های مدیریتی قوی مبتنی بر هوش مصنوعی کار کنید.
◀️به جامعه اجازه بدید تا با پیشرفت هوش مصنوعی هماهنگ بشن و با اون جامعه ای شکوفا رو هدف بگیرید


برای خوندن کامل نامه و افرادی که امضا کردند میتونید روی متن کلیک کنید.



@RoboEpics
👎9👍7😁1
مدل بزرگ زبانی برای کار‌های مالی

بلومبرگ مقاله‌ای رو منتشر کرده که توی اون BloombergGPT رو معرفی کرده.
این مدل بزرگ زبانی 50 میلیارد پارامتر داره و روی مقدار زیادی داده‌های اقتصادی آموزش دیده و میخوان که از اون برای کمک به کار‌های اقتصادی استفاده کنن.

برای خوندن مقاله روی متن کلیک کنید.


@RoboEpics
This media is not supported in your browser
VIEW IN TELEGRAM
مدلی که با یک کلیک، هر چیزی رو که بخواید از عکس و ویدئو جدا می‌کنه 😮

تیم متا مدلی رو به اسم SAM (Segment Anything Model) معرفی کرده که با استفاده از اون شما می‌تونید هر چیزی رو توی عکس و ویدئو جدا کنید.

مدل SAM قابلیت ادغام شدن با مدل‌های دیگه رو هم داره به عنوان مثال شما می‌تونید اونو روی تکنولوژی‌های AR , VR سوار کنید و باهاش محصول‌های هیجان انگیزی رو درست کنید.

می‌تونید اونو با مدل‌های تبدیل صدا به متن ادغام کنید و افراد با استفاده از صدا بتونن چیزهایی که میخوان رو جدا کنن و همینطور می‌تونید از خروجی هایی مدل برای ساخت مدل‌های سه بعدی استفاده کنید.



برای دیدن سایت این محصول می‌تونید روی متن کنید.

برای خوندن کامل بلاگ می‌تونید روی این متن کنید.

برای دیدن گیت هاب این مدل هم می‌تونید روی متن کلیک کنید.

این پست رو حتما با دوستاتون و افرادی که علاقه‌مندن به اشتراک بذارید 😎

@RoboEpics
یک مقاله کلی از معماری و الگوریتم‌های ترانسفورمر‌ها (Transformer) که توسط تیم Deepmind نوشته شده.

هدف کلی این مقاله اینه که یه نمای کلی دقیق و مستقل از معماری‌ها و الگوریتم‌های ترانسفورمر‌ها بده.(نه نتایج)
مطالب این مقاله در مورد اینه که :
⬅️ ترانسفورمر‌ها چین؟
⬅️ چی جوری آموزش داده میشن؟
⬅️ برای چه چیزی استفاده میشن؟
⬅️ اجزای اصلی معماری اون‌ها چیه؟
⬅️ یه توضیح کلی در مورد بهترین مدل‌های موجود که با ترانسفورمر‌ها نوشته شدن رو میده.

برای فهمیدن این مقاله لازمه که با اصطلاحات پایه ی یادگیری ماشین و معماری شبکه‌های عصبی ساده تر مثل MLP آشنا باشید.

برای دیدن مقاله رو متن کلیک کنید.

این پیام رو حتما برای دوستان علاقه‌مندتون هم بفرستید 😎


@RoboEpics
👍1
کوالا، چت بات opensource دانشگاه برکلی که روی مدل LLama متا آموزش داده شده.🐨🐨

این چت بات روی مدل 13 میلیارد پارامتری LLama متا آموزش داده شده و همینطور روی داده های مکالمه ی افراد روی اینترنت fine tune شده.
بر اساس بلاگ خود دانشگاه برکلی کوالا در مقایسه با مدل Alpaca دانشگاه استنفورد و chatgpt، به خوبی میتونه به سوالات کاربرا جواب بده و جواب‌هایی رو تولید می‌کنه که بیشتر اوقات نسبت به Alpaca بیشتر ترجیح داده می‌شه و در نیمی از مواقع جواب ها با chatgpt برابره.
این مدل هنوز از نظر محتوایی، ایمنی و جواب‌هایی که میده هنوز مشکلات زیادی داره و فقط برای پروژه‌های تحقیقاتی اجازه استفاده از این مدل رو میدن.

برای خوندن کامل مقاله روی متن کلیک کنید.

حتما این پست رو برای دوستان علاقه‌مندتون هم بفرستید 😎👌


@RoboEpics
تیم Databricks به تازگی Dolly 2.0 رو منتشر کرد اولین مدل زبانی بزرگ open source که با گرفتن API می‌تونید به صورت رایگان از این مدل استفاده تجاری کنید.
این مدل 12 میلیارد پارامتری مدلی از خانواده‌ی EleutherAI pythia هست و روی داده‌های کاملا با کیفیت انسانی fine tune شده.

برای خوندن کامل بلاگ روی متن کلیک کنید.
برای دیدن مدل در hugging face هم میتونید روی متن کلیک کنید.

این پست رو حتما برای دوستان علاقه‌مندتون بفرستید.😎👍
@RoboEpics
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
دیگه لازم نیست برای خرید اکانت midjourney هزینه کنید! 😁

مدل Stable diffusion XL روی پلتفرم clip drop قابل استفادست.
این مدل آخرین مدل stable diffusion هست که توی ساخت تصاویر واقع گرایانه خیلی عالی عمل میکنه و حتی در بعضی حوزه ها از midjourney هم بهتر عمل میکنه.
شما با ساخت حساب کاربری توی سایت میتونید روزانه 60 تا عکس رایگان با هوش مصنوعی تولید کنید.

برای استفاده از مدل روی متن کلیک کنید.

این پست رو حتما برای کسایی که فکر میکنی به این مدل نیاز دارن بفرست. 😎


@RoboEpics
🤩1
تا حالا به این فکر کردین وقتی که به ChatGPT یا GPT-4 میگیم که چیزی رو داره اشتباه میگه میفهمه و اونو اصلاح میکنه؟
آیا براتون عجیب نیست که یه مدل با پارامتر‌های ثابت چرا دوباره همون جواب یکسان قبلی رو بهون نمیده؟

این قدرت مدل‌های بزرگ زبانیه که این اجازه رو میده توی Context (موضوعی که دارن در موردش صحبت میکنن) یاد بگیرن.

اگر با ChatGPT صحبت طولانی کرده باشین و بهش گفته باشید که یه سری جزییات توی بحثتون رو تغییر بده و اون موضوع ها رو همیشه تو ذهنش نگه داره میبینید که به مرور یه سری چیزهایی که گفتید رو یادش میره.
به حداکثر طول کلماتی که یک مدل در یک انتشار به جلو میتونه انجام بده رو اصطلاحا Context window میگن و این معیار خیلی مهمیه و توی تمام مدل‌های بزرگ زبانی اونو اندازه گیری میکنن و مقدار این معیار GPT3 هزار کلمست و در GPT4 به 25 هزار کلمه میرسه.

حالا یه مقاله ای هست که از طرف مایکروسافت منتشر شده که توی اون توضیح میده که این مدل های برزگ زبانی چی جوری میتونن توی اون زمینه ای که باهاش صحبت میکنی یاد بگیرن.

لینک مقاله

این پست رو حتما برای دوستان علاقه مندتون بفرستید😎👍

@RoboEpics
🐳3
This media is not supported in your browser
VIEW IN TELEGRAM
تیم متا به تازگی یک هوش مصنوعی برای کودکان منتشر کرد! 😃



تیم متا یک ابزار پویانمایی مبتنی بر هوش مصنوعی و 180 هزار عکس از نقاشی کودکان که با استفاده از اون تونستن این مدل رو بسازن منتشر کردن.

اسم این ابزار رو Animated Drawing گذاشتن و قابلیت تشخیص شکل، جدا کردن نقاشی از پس زمینه، اضافه کردن مفصل های حرکتی به نقاشی و حرکت دادن نقاشی رو داره.

شما همین الان می‌تونید از این محصول استفاده کنید و نقاشی‌ها رو به حرکت دربیارید.



لینک بلاگ

لینک استفاده از مدل

لینک گیت هاب مدل

این پست رو برای کسایی که فکر میکنید علاقه مندن بفرستید😎👌

@RoboEpics
🐳3
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Dino v2 به درد همه ی کسایی که بینایی ماشین کار میکنن، میخوره 😎



متا امروز مدل Dino v2 رو منتشر کرد که با اون می‌تونید مدل های بینایی ماشین رو با کارایی بالا آموزش بدید.

این مدل خودنظارتی(self supervised) بینایی با بهره گیری از معماری ترانسفورمر ها میتونه توی تموم کار‌های بینایی ماشین شما نقش مهمی رو ایفا کنه و به fine tune هم نیازی نداره.



با این مدل میتونید بدون نیاز به مقدار زیادی از داده های برچسب خورده مدل بینایی ماشین خودتونو آموزش بدید.

از این مدل میتونید توی طبقه بندی کردن تصاویر(classification)، تقسیم بندی عکس(segmentation)، بازیابی عکس(image retrieval) و تخمین عمق(depth estimation) عکس استفاده کنید.

با این مدل میتونید مستقیما مدلتون رو با خود عکس‌ها آموزش بدید و دیگه نیازی به توضیح متنی برای عکس‌ها ندارید.

این مدل قابلیت یادگیری با هر مجموعه عکسی رو هم داره.



نسخه از پیش آموزش دیده Dino v2 موجوده و با مدل‌های CLIP و Open CLIP توی طیف گسترده ای از کار‌ها میتونه رقابت کنه.


لینک دموی مدل
لینک بلاگ
لینک گیت هاب

این پست رو حتما برای افرادی که فکر میکنید علاقه مندن بفرستید😎

@RoboEpics
👍3🤯2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت Nvidia تحقیقات خودشو روی مدل‌های تبدیل متن به ویدئو منتشر کرد 🤯

مدل‌های انتشار پنهان ویدئویی (Video Latent Diffusion Models) با استفاده از مدل‌ انتشار (diffusion model) توی یک فضای پنهان فشرده (Compressed latent space) ویدئو‌هایی با وضوح بالا تولید می‌کنن که در عین حال از منابع محسباتی کمتری هم استفاده می‌کنن.


نحوه‌ی عملکرد این مدل به صورت زیر خلاصه میشه:
1. روی تموم دیتاست عکس‌ها LDM رو پیش آموزش میدیم.

2. با اضافه کردن لایه‌های زمانی مثل فریم فیلم، LDM تصویر رو به LDM ویدیویی تبدیل میکنیم.

3. برای ساخت مدل تولید ویدئو، LDM ویدیویی روی دنباله‌ای از ویدیو‌های کدگذاری شده fine-tune می‌کنیم.

4. به صورت موقت نمونه بردار‌های مدل انتشاری (diffusion model upsamplers) رو روی تولید ویدیو با کیفیت بالا تنظیم می‌کنیم.

5. برای اینکه بخوایم مدلمون عملکرد خیلی خوبی پیدا کنه، LDM ویدیویی رو روی ویدیو‌های واقعی 1024*512 اعتبار سنجی می‌کنیم.


لینک سایت
لینک مقاله

این پست رو حتما برای دوستای علاقه‌مندتون بفرستید😎👌


@RoboEpics
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
خودتون رو برای پارک ژوراسیک آماده کنید 😎

توی ویدئو مدلی رو میبینید که حرکات موجودات دوپا با استفاده از عضله‌های سه بعدی رو شبیه سازی می‌کنه.

این کنترل‌های حرکتی میتونه توی زمان واقعی با سرعت‌های مختلف، به سمت هدف های متفاوت و در مسیر‌های ناهموار حرکت کنن.

لینک مقاله


@RoboEpics
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
با استفاده از این سایت می‌تونید شبکه‌های عصبی پیچشی(convolutional neural network) رو بهتر درک کنید.
این سایت CNN‌ها رو تصویر سازی میکنه و توضیح می‌ده که توی هر لایه از این شبکه‌های عصبی چه اتفاقی می‌افته.
می‌تونید این سایت رو توی مرورگر خود باز کنید و با CNN‌ها بازی کنید و یاد بگیرید.

لینک سایت
لینک مقاله‌ی یادگیری CNNها با استفاده از تصویرسازی تعاملی



این پست رو حتما برای کسانی که توی بینایی ماشین کار میکنن بفرستید😎

@RoboEpics
👍3
تاریخچه چت‌بات‌ها و مدل‌های بزرگ زبانی 📚

به مدت 30 سال از سال 1987 تا 2017، مدل‌های یادگیری ماشینی که بر اساس ویژگی‌ یاد می‌گرفتن ( feature based machine learning models) رو معمولا برای کار‌های پردازش زبان طبیعی مثل تجزیه و تحلیل احساسات یا پیدا کردن اسم شرکت‌ها تو متن استفاده می‌کردن.

درسته که این مدل‌ها تو مثال‌های بالا خوب کار می‌کردن اما توانایی درک زبان رو نداشتن. برای اینکه بتونیم درک بهتری از زبان با روش‌های قدیمی داشته باشیم نیاز داریم که مقدار قابل توجهی کد بزنیم که ساختار و معنای جملات و مفهوم بعضی کلمات و جملات دو پهلو رو مشخص کنیم و همینطور باید خیلی داده‌ی دستنویس تولید کنیم که قواعد دستور زبان رو به مدل بفهمونیم. این رویکرد خیلی پرهزینه و مقیاس ناپذیر بود و همینطور به طور گسترده قابل استفاده توی کار‌های مختلف نبود.

تا اینکه توی سال 2018 با توسعه نسل جدیدی از مدل‌های بزرگ زبانی، درک زبان طبیعی به صورت کلی متحول شد.

مدل‌هایی مثل BERT و GPT-3 با استفاده از یادگیری خودنظارتی(self-supervised) روی مقادیر خیلی زیادی از داده‌های متنی آموزش داده‌ شدن تا بتونن ساختار و معنای متن رو درک کنن.
این مدل‌ها از Transformer‌ها استفاده کردن که یک فناوری شبکه عصبی جدید بود که توی سال 2017 معرفی شد که کلماتی که با هم در یک زمینه (context) هستند در فضای برداری هم نزدیک به هم هستند و مدل کلمات رو با استفاده از درکی که از Context داره به صورت احتمالاتی در کنار هم قرار میده و این کار به مدل این قدرت رو می‌داد معنی جملات رو بهتر بفهمن و همینطور با استفاده از روش‌های stochastic gradient descent یا reinforcement learning می‌شه که این مدل‌ها رو برای درک بهتر زبان و انجام کار‌های مختلف توی حوزه‌ی NLP آموزش داد.

برای بیشتر آشنا شدن با معماری و الگوریتم‌های transformer ها میتونید به مقاله زیر مراجعه کنید.
لینک مقاله

@RoboEpics
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
از این به بعد ChatGPT صدا رو هم می‌شنوه و جواب می‌ده 🤯



کم کم میتونیم آماده‌ی اومدن نسل جدید دستیار‌های هوشمند باشیم که با قدرت گرفتن از ChatGPT و با استفاده از Plug-in هایی که برای ChatGPT می‌نویسن، می‌تونیم فقط با صحبت کردن با یک هوش مصنوعی تمام کارهایی که لازمه رو انجام بدیم به عنوان مثال خرید کنیم، برنامه‌های مختلف برای خودمون برنامه ریزی کنیم و ...



با توجه به پیشرفت و رشدی که میبینیم میتونیم توی آینده‌ی نزدیک شاهد این دستیار‌های هوشمند باشیم.

تیمی که روی این مدل کار کردن اسمش رو AudioGPT گذاشتن و اونو به صورت open source گذاشتن تا بقیه هم بتونن ازش استفاده کنن.

لینک مقاله
لینک گیت هاب مدل





این پست رو حتما برای افراد علاقه‌مند بفرستید😎


@RoboEpics
👍4🔥2