Data world with Mina
4.17K subscribers
371 photos
62 videos
169 files
389 links
minarabti32@gmail.com
منبع مطالب يادگيري ماشين،پايتون ،داده كاوي ،هوش مصنوعي، دانلود داده، فيلم هاي آموزشي رايگان، داده
ارتباط با ادمین
@Datalook_mina
اینستاگرام:mina.rabti
Download Telegram
آموزش مفاهیم
#یادگیری_عمیق #یادگیری_عمیق

🔶 مفهوم Quantization یک تکنیک بهینه سازی حیاتی است که در یادگیری ماشین برای کاهش نیازهای محاسباتی و حافظه شبکه های عصبی عمیق استفاده می شود.

این شامل تبدیل وزن و فعال سازی شبکه های عصبی از اعداد ممیز شناور به اعداد صحیح با عرض بیت پایین تر است. این فرآیند دقت مقادیر را کاهش می دهد، اما
می تواند محاسبات را به طور قابل توجهی سرعت بخشد و استفاده از حافظه را کاهش دهد، و به ویژه برای استقرار در شتاب دهنده های سخت افزاری مانند TPU ها مفید است.

در مورد TPU ها، کوانتیزاسیون معمولاً در سطح سخت افزار اجرا می شود تا از واحدهای ضرب ماتریس تخصصی و سایر بهینه سازی های طراحی شده برای عملیات اعداد صحیح استفاده شود.

این کوانتیزه‌سازی مبتنی بر سخت‌افزار، اجرای کارآمد محاسبات شبکه‌های عصبی را بر روی TPUها تضمین می‌کند، که برای پردازش با سرعت بالا و تأخیر کم بارهای کاری یادگیری ماشین بهینه شده‌اند.

پایتورچ PyTorch از کوانتیزاسیون INT8 در مقایسه با مدل های معمولی FP32 پشتیبانی می کند که امکان کاهش 4 برابری اندازه مدل و کاهش 4 برابری در پهنای باند حافظه مورد نیاز را فراهم می کند. پشتیبانی سخت افزاری برای محاسبات INT8 معمولاً 2 تا 4 برابر سریعتر از محاسبات FP32 است.

کوانتیزاسیون برای یک LLM، بدان معناست که دقت وزن‌ها و فعال‌سازی‌های آن‌ها را اصلاح می‌کند که باعث می‌شود حافظه کمتری مصرف شود. این مطمئناً روی قابلیت های مدل از جمله دقت تأثیر دارد.

اطلاعات بیشتر

https://huggingface.co/docs/optimum/concept_guides/quantization
🔥7👍5
کسانی که به هوش مصنوعی و علوم مرتبط با آن علاقه دارند، معمولاً سینوسکی را می‌شناسند. ترنس سینوسکی (Terrence Sejnowski) محققی عمیق، صاحب‌نظری پیشرو و نویسنده‌ای خوش‌قلم است که الان هشتمین دههٔ‌ زندگی خودش را می‌گذراند و اغلب کسانی که به شبیه‌سازی مغز علاقه‌مند هستند و عصب‌شناسی محاسباتی (Computational Neuroscience) را دنبال می‌کنند، آثار او را در این حوزه خوانده‌اند

https://mrshabanali.com/%d8%b3%da%af-%d8%b3%db%8c%d9%86%d9%88%d8%b3%da%a9%db%8c/.
🔥63
سلام امیدوارم خوب باشید . یکی از سوالهایی که اینجا و یا در اینستاگرام یکسری دوستان از من پرسیدند در خصوص
دوره های رایگان کورسرا است.

اینکه در اکثر دوره ها حتی رایگان زمان ثبت نام از شما شماره کارت درخواست میکنند و برای ما در ایران با توجه به محدودیتها چالش وجود دارد. در ادامه چند نکته رو در این مورد مطرح میکنم:

۱_ داخل کورسرا میشه بدون گرفتن مدرک دوره هارو به اصطلاح audit کرد و دید.

۲_مورد دیگر گرفتن کمک مالی یا Financial aid است.در واقع شما به سایت درخواست کمک مالی یا Financial aid available می‌فرستید. البته این قابلیت برای بعضی از دوره‌ها فعال بوده و شما زمان انتخاب دوره، آنهایی را انتخاب می‌کنید که توانایی پرداخت هزینه آن را ندارید.
نکته: متاسفانه انگار به تازگی کورسرا امکان کمک مالی ۱۰۰ درصد را برداشته و تا ۷۵ درصد این کمک مالی را امکان پذیر میکند. پس در هر صورت نیاز به شماره کارت دارید .

۳_ یکسری سایت ها مثل ایرانی کارت امکان پرداخت تا یک دلار و یا ۴ دلار رو فراهم میکنند . و شما با این هزینه کم میتونید از یک شماره کارت مجازی و مشخصات مجازی استفاده کنید.

البته ناگفته نمونه برای مدرک دوره معمولا درخواست کمک مالی را داریم . که اگر موافقت بشه امکان ارسال است.
🔥9🙏5👍3
* مجموعه وبینار های و گپ و گفتگوهای گروه DataEngineerGuys *


خیلی وقت ها برای ما سوال پیش میاد وقتی ما به عنوان یک DataEngineer یک زیر ساخت دیتا رو فراهم میکنیم بعدش تحلیلگران داده چه مدل استفاده هایی از زیر ساخت ما میکنند؟ قراره با مینا گفت و گو کنیم و به ما از نمونه کارهایی که به عنوان یک data scientist انجام میده برای ما بگه.

- پلتفرم : Google Meet


- لینک وبینار :

https://meet.google.com/heu-xasq-erc

- لینک گروه تلگرام :
https://lnkd.in/djVzv2Qg

- وبینار رکورد و در کانال یوتیوب قرار میگیرد:
https://lnkd.in/dUSTZFBi?

روز برگزاری وبینار:چهارشنبه ۱۷ مرداد
ساعت ۱۹ تا ۲۰
👏12👍32👌1
راهنما شروع کار در علم داده .pdf
3.1 MB
همه چیز در مورد دیتاساینس، کاربردها
مهارت ها
👍7🙏6
Forwarded from Data world with Mina (Mina Ra)
یه چارت برای انتخاب روشهای انتخاب ویژگی
Feature selection
براساس نوع ویژگی ها(گسسته یا عددی)
هم در ویژگی هدف هم در ویژگی های ورودی

این مقاله دقیق تر کمکتون می‌کنه. حتما مطالعه کنید.

https://machinelearningmastery.com/feature-selection-with-real-and-categorical-data/
🤩6👌52🙏2👍1
LLm scientist Roadmap
🔥13👍2👎1
⚠️خبری دیگر از شکایت‌های Open Ai⚠️

یوتیوبرها علیه OpenAI  : که گویای خسارتی بیش از ۵ میلیون دلار است

یوتیوبرها علیه OpenAI: اتهام استفاده غیرمجاز از محتوای ویدئوها برای آموزش هوش مصنوعی!

▪️یوتیوبر معروف، دیوید میلت، یک دادخواست گروهی علیه OpenAI به ثبت رسانده است. او مدعی است که این شرکت بدون کسب اجازه از یوتیوبرها، از محتوای ویدئوهایشان برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده و حقوق کپی رایت را نادیده گرفته است.

▪️این پرونده در دادگاه ناحیه کالیفرنیا مطرح شده و دیوید میلت امیدوار است که بتواند بیش از ۵ میلیون دلار خسارت از OpenAI دریافت کند!
🔥4😁21👏1
بهترین و درست ترین توصیف برای وظایف یک دیتا ساینتیست و تفاوتش با دیتا آنالیز
بدون دنگ و فنگ و قاطی شدنش با مهندس نرم افزار و مهندس داده

We are looking for Data Scientists to help us create innovative machine learning solutions. Data Scientist responsibilities include understanding the business problem and experimenting with different modelling architectures to create the best possible setup from model performance as well as computational performance. To do this job successfully, you need exceptional skills in Machine Learning and Programming. Your goal will be to find the best data-based solution for the problem at hand.
👍8🔥4
اولین سمعک مجهز به هوش مصنوعی جهان، درک گفتار را تا 53 برابر بهبود می‌بخشد.

یک سمعک جدید و پیشرفته مجهز به هوش مصنوعی، به نام Phonak Audéo Sphere Infinio با کمک به 50 درصد از شرکت‌کنندگان در کارآزمایی بالینی خود، گفتار واضح را از اختلال‌های پس‌زمینه جدا می‌کند.

آرند کالدوسکی»، عضو تیم سونووا، بر اهمیت مشکل نویز در گفتار برای توسعه سمعک تأکید کرد. همچنین اشاره کرد که بهبود این جنبه برای ارتقای کیفیت زندگی میلیون‌ها نفر از افراد کم‌شنوا بسیار مهم است.

ونلانتن گفت که پلتفرم Phonak Audéo Infinio سال‌ها طول کشید تا با سرمایه‌گذاری قابل توجهی در فناوری توسعه یابد و به چنین نتایج چشمگیری دست یابد. همانطور که قبلاً گفته شد، تولید سمعک در ده سال گذشته پیشرفت نشان داده است، اما هنوز نتوانسته‌ است محصولی تولید کند که اساسی‌ترین نیاز مصرف‌کننده را برطرف کند.

ونلانتن ادامه داد: «شما باید برای این هدف، یک شبکه عصبی عمیق (DNN) و قدرتمند را در سمعک پیاده‌سازی کنید، که آنها را ملزم به طراحی DEEPSONIC می‌کرد. DEEPSONIC یک تراشه ویژه است که از هوش مصنوعی برای تشخیص صداهای ناخواسته از گفتار دلخواه استفاده می‌کند.»

پلتفرم Phonak به‌طور کلی متکی به تراشه جدید Phonak ERA است و خط تولید را به‌عنوان اولین محصولی که از فناوری دو تراشه استفاده می‌کند، تقویت می‌کند.
👍14
۱۰ کانال یوتیوب برای آموزش دیتا ساینس و دیتا آنالیز
👍11🤩7🙏4
- خوش بحالت که برنامه نویسی، میشینی تو خونه چهارتا خط کد می‌نویسی کلی پول درمیاری
یه روز عادی برنامه نویسا:

حق😄😄😄؟
😁30👌5👍1
خالق ChatGPT: لطفاً عاشق چت‌بات‌های ما نشوید.

شرکت OpenAI درمورد ایجاد روابط عاطفی کاربران با چت‌بات‌های هوش مصنوعی خود نگران است.

این شرکت تلاش زیادی انجام داده است تا کاربران هنگام مکالمه با GPT-4o، احساس کنند با یک انسان حرف می‌زنند. این تلاش‌ها شامل ویژگی صوتی جدید برای تقلید گفتار انسان به‌همراه سرعت بالاتر پاسخگویی می‌شود و می‌توانید با چت‌بات، گفت‌وگویی صوتی شبیه به مکالمه‌ با یک انسان واقعی داشته باشید.

اکنون OpenAI متوجه شده است کاربران با ChatGPT-4o مانند انسان واقعی رفتار می‌کنند. این شرکت می‌گوید: «در مراحل اولیه‌ی تست، ازجمله آزمایش‌های داخلی و شبیه‌سازی حملات سایبری، متوجه شدیم کاربران از عباراتی استفاده می‌کنند که برقراری ارتباط با مدل را نشان می‌دهد. درحالی‌که موارد ذکرشده بی‌ضرر به‌نظر می‌رسند، اما بررسی اثرات بلندمدت آن‌ها نیاز به بررسی بیشتر دارد.»

OpenAI
به دو دلیل موضوع انسان‌‌پنداری چت‌بات‌ها را خبر بدی می‌داند. اول اینکه، وقتی هوش مصنوعی شبیه انسان به‌نظر برسد، ما بیشتر مستعد باورکردن حرف‌های آن به‌عنوان واقعیت هستیم. این یعنی مردم درمقایسه‌با زمانی که هوش مصنوعی شبیه ربات رفتار می‌کند، بسیار بیشتر در معرض توهمات و اطلاعات اشتباه آن قرار می‌گیرند.

منبع
https://openai.com/index/gpt-4o-system-card/
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
این قطعه تماماً با هوش مصنوعی ساخته شده
کامنتی که زیر این پست تو اینستاگرام خیلی لایک گرفته:
"مدت یک دهه و نیم، سولیست تمام وقت اپرا بودم و با بزرگترین خوانندگان جهان، سمفونی‌ها و گروه های کر خواندم.
اما نمی‌توانم تشخیص بدهم که این هوش مصنوعیه! دها بار این را گوش دادم. خواننده‌های این آهنگ حتی «خطاهای» و ایرادات انسانی دارند! صداهای درشت روی نت‌ها، ویبراتوی اجباری، مصوت‌های عجیب و غریب ناشی از «تغییر واکه» (تکنیک اصلی آواز کلاسیک) و تمام این‌ها این قطعه را شبیه صدای ضبط شده واقعی می‌کند که بارها شنیده‌ام.
و باید بگویم... من واقعاً این موسیقی را دوست دارم! بدترین چیزی که می توانم بگویم این است که کلیشه‌ای و قدیمیه و هیچ کس دیگه علاقه ای به نوشتن قطعه ای مانند موتزارت ندارد!
چیزی که من نمی‌شنوم این است که "اکنون چه؟" ما انسان ها نمی‌دانیم آینده چه خواهد بود، ذهن و فرهنگ بشر به موسیقی سال گذشته چگونه پاسخ خواهد داد و سال آینده به کجا خواهد رفت.
اینجاست که خلاقیت واقعی نهفته است.
👏9👍1
Data world with Mina
این قطعه تماماً با هوش مصنوعی ساخته شده کامنتی که زیر این پست تو اینستاگرام خیلی لایک گرفته: "مدت یک دهه و نیم، سولیست تمام وقت اپرا بودم و با بزرگترین خوانندگان جهان، سمفونی‌ها و گروه های کر خواندم. اما نمی‌توانم تشخیص بدهم که این هوش مصنوعیه! دها بار این…
هنر دهه‌هاست که راکد بوده و به جای ساختن موضوعات جدید، مضامین قدیمی را بازخوانی می‌کند، زیرا سرمایه‌داری به این سمت می‌رود. شاید هنر هوش مصنوعی، انسان ها را مجبور کند تا بار دیگر در مسیر جدیدی قدم بگذارند و چیزی بدیع و غیرقابل پیش بینی خلق کنند."
👍14👎6
🔶لینک دوره های رایگان هوش مصنوعی

دوره حرفه ای دیتا آنالیز: Meta Data analyst
https://bit.ly/4d5MtR5

دوره مقدماتی مدلهای زبانی
https://bit.ly/3QbvbZ9

دوره جامع هوش مصنوعی مولد GenAi
https://bit.ly/3U9KsuR

دوره مقدماتی هوش مصنوعی
https://bit.ly/3w4b8oD

دوره دیتا ساینس IBM
https://bit.ly/446cQT6


https://xn--r1a.website/datalook_ir
🔥112👏2👍1🙏1
پلتفرم لیندکین . موقعیت شغلی مهندس داده
👍11
معرفی یک ریپوی خوب ماشین لرنینگ

https://github.com/whatsinfinitum?tab=repositories

در این ریپو علیرضا گودرزی سینور دیتا ساینتیست چند پروژه خوب در خصوص LLM را قرار داده که می تونید استفاده کنید.
خودم خیلی استفاده کردم.
12🤩4