Data world with Mina
4.17K subscribers
371 photos
62 videos
169 files
389 links
minarabti32@gmail.com
منبع مطالب يادگيري ماشين،پايتون ،داده كاوي ،هوش مصنوعي، دانلود داده، فيلم هاي آموزشي رايگان، داده
ارتباط با ادمین
@Datalook_mina
اینستاگرام:mina.rabti
Download Telegram
Forwarded from Data world with Mina (Mina Ra)
یه چارت برای انتخاب روشهای انتخاب ویژگی
Feature selection
براساس نوع ویژگی ها(گسسته یا عددی)
هم در ویژگی هدف هم در ویژگی های ورودی

این مقاله دقیق تر کمکتون می‌کنه. حتما مطالعه کنید.

https://machinelearningmastery.com/feature-selection-with-real-and-categorical-data/
🤩6👌52🙏2👍1
LLm scientist Roadmap
🔥13👍2👎1
⚠️خبری دیگر از شکایت‌های Open Ai⚠️

یوتیوبرها علیه OpenAI  : که گویای خسارتی بیش از ۵ میلیون دلار است

یوتیوبرها علیه OpenAI: اتهام استفاده غیرمجاز از محتوای ویدئوها برای آموزش هوش مصنوعی!

▪️یوتیوبر معروف، دیوید میلت، یک دادخواست گروهی علیه OpenAI به ثبت رسانده است. او مدعی است که این شرکت بدون کسب اجازه از یوتیوبرها، از محتوای ویدئوهایشان برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده و حقوق کپی رایت را نادیده گرفته است.

▪️این پرونده در دادگاه ناحیه کالیفرنیا مطرح شده و دیوید میلت امیدوار است که بتواند بیش از ۵ میلیون دلار خسارت از OpenAI دریافت کند!
🔥4😁21👏1
بهترین و درست ترین توصیف برای وظایف یک دیتا ساینتیست و تفاوتش با دیتا آنالیز
بدون دنگ و فنگ و قاطی شدنش با مهندس نرم افزار و مهندس داده

We are looking for Data Scientists to help us create innovative machine learning solutions. Data Scientist responsibilities include understanding the business problem and experimenting with different modelling architectures to create the best possible setup from model performance as well as computational performance. To do this job successfully, you need exceptional skills in Machine Learning and Programming. Your goal will be to find the best data-based solution for the problem at hand.
👍8🔥4
اولین سمعک مجهز به هوش مصنوعی جهان، درک گفتار را تا 53 برابر بهبود می‌بخشد.

یک سمعک جدید و پیشرفته مجهز به هوش مصنوعی، به نام Phonak Audéo Sphere Infinio با کمک به 50 درصد از شرکت‌کنندگان در کارآزمایی بالینی خود، گفتار واضح را از اختلال‌های پس‌زمینه جدا می‌کند.

آرند کالدوسکی»، عضو تیم سونووا، بر اهمیت مشکل نویز در گفتار برای توسعه سمعک تأکید کرد. همچنین اشاره کرد که بهبود این جنبه برای ارتقای کیفیت زندگی میلیون‌ها نفر از افراد کم‌شنوا بسیار مهم است.

ونلانتن گفت که پلتفرم Phonak Audéo Infinio سال‌ها طول کشید تا با سرمایه‌گذاری قابل توجهی در فناوری توسعه یابد و به چنین نتایج چشمگیری دست یابد. همانطور که قبلاً گفته شد، تولید سمعک در ده سال گذشته پیشرفت نشان داده است، اما هنوز نتوانسته‌ است محصولی تولید کند که اساسی‌ترین نیاز مصرف‌کننده را برطرف کند.

ونلانتن ادامه داد: «شما باید برای این هدف، یک شبکه عصبی عمیق (DNN) و قدرتمند را در سمعک پیاده‌سازی کنید، که آنها را ملزم به طراحی DEEPSONIC می‌کرد. DEEPSONIC یک تراشه ویژه است که از هوش مصنوعی برای تشخیص صداهای ناخواسته از گفتار دلخواه استفاده می‌کند.»

پلتفرم Phonak به‌طور کلی متکی به تراشه جدید Phonak ERA است و خط تولید را به‌عنوان اولین محصولی که از فناوری دو تراشه استفاده می‌کند، تقویت می‌کند.
👍14
۱۰ کانال یوتیوب برای آموزش دیتا ساینس و دیتا آنالیز
👍11🤩7🙏4
- خوش بحالت که برنامه نویسی، میشینی تو خونه چهارتا خط کد می‌نویسی کلی پول درمیاری
یه روز عادی برنامه نویسا:

حق😄😄😄؟
😁30👌5👍1
خالق ChatGPT: لطفاً عاشق چت‌بات‌های ما نشوید.

شرکت OpenAI درمورد ایجاد روابط عاطفی کاربران با چت‌بات‌های هوش مصنوعی خود نگران است.

این شرکت تلاش زیادی انجام داده است تا کاربران هنگام مکالمه با GPT-4o، احساس کنند با یک انسان حرف می‌زنند. این تلاش‌ها شامل ویژگی صوتی جدید برای تقلید گفتار انسان به‌همراه سرعت بالاتر پاسخگویی می‌شود و می‌توانید با چت‌بات، گفت‌وگویی صوتی شبیه به مکالمه‌ با یک انسان واقعی داشته باشید.

اکنون OpenAI متوجه شده است کاربران با ChatGPT-4o مانند انسان واقعی رفتار می‌کنند. این شرکت می‌گوید: «در مراحل اولیه‌ی تست، ازجمله آزمایش‌های داخلی و شبیه‌سازی حملات سایبری، متوجه شدیم کاربران از عباراتی استفاده می‌کنند که برقراری ارتباط با مدل را نشان می‌دهد. درحالی‌که موارد ذکرشده بی‌ضرر به‌نظر می‌رسند، اما بررسی اثرات بلندمدت آن‌ها نیاز به بررسی بیشتر دارد.»

OpenAI
به دو دلیل موضوع انسان‌‌پنداری چت‌بات‌ها را خبر بدی می‌داند. اول اینکه، وقتی هوش مصنوعی شبیه انسان به‌نظر برسد، ما بیشتر مستعد باورکردن حرف‌های آن به‌عنوان واقعیت هستیم. این یعنی مردم درمقایسه‌با زمانی که هوش مصنوعی شبیه ربات رفتار می‌کند، بسیار بیشتر در معرض توهمات و اطلاعات اشتباه آن قرار می‌گیرند.

منبع
https://openai.com/index/gpt-4o-system-card/
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
این قطعه تماماً با هوش مصنوعی ساخته شده
کامنتی که زیر این پست تو اینستاگرام خیلی لایک گرفته:
"مدت یک دهه و نیم، سولیست تمام وقت اپرا بودم و با بزرگترین خوانندگان جهان، سمفونی‌ها و گروه های کر خواندم.
اما نمی‌توانم تشخیص بدهم که این هوش مصنوعیه! دها بار این را گوش دادم. خواننده‌های این آهنگ حتی «خطاهای» و ایرادات انسانی دارند! صداهای درشت روی نت‌ها، ویبراتوی اجباری، مصوت‌های عجیب و غریب ناشی از «تغییر واکه» (تکنیک اصلی آواز کلاسیک) و تمام این‌ها این قطعه را شبیه صدای ضبط شده واقعی می‌کند که بارها شنیده‌ام.
و باید بگویم... من واقعاً این موسیقی را دوست دارم! بدترین چیزی که می توانم بگویم این است که کلیشه‌ای و قدیمیه و هیچ کس دیگه علاقه ای به نوشتن قطعه ای مانند موتزارت ندارد!
چیزی که من نمی‌شنوم این است که "اکنون چه؟" ما انسان ها نمی‌دانیم آینده چه خواهد بود، ذهن و فرهنگ بشر به موسیقی سال گذشته چگونه پاسخ خواهد داد و سال آینده به کجا خواهد رفت.
اینجاست که خلاقیت واقعی نهفته است.
👏9👍1
Data world with Mina
این قطعه تماماً با هوش مصنوعی ساخته شده کامنتی که زیر این پست تو اینستاگرام خیلی لایک گرفته: "مدت یک دهه و نیم، سولیست تمام وقت اپرا بودم و با بزرگترین خوانندگان جهان، سمفونی‌ها و گروه های کر خواندم. اما نمی‌توانم تشخیص بدهم که این هوش مصنوعیه! دها بار این…
هنر دهه‌هاست که راکد بوده و به جای ساختن موضوعات جدید، مضامین قدیمی را بازخوانی می‌کند، زیرا سرمایه‌داری به این سمت می‌رود. شاید هنر هوش مصنوعی، انسان ها را مجبور کند تا بار دیگر در مسیر جدیدی قدم بگذارند و چیزی بدیع و غیرقابل پیش بینی خلق کنند."
👍14👎6
🔶لینک دوره های رایگان هوش مصنوعی

دوره حرفه ای دیتا آنالیز: Meta Data analyst
https://bit.ly/4d5MtR5

دوره مقدماتی مدلهای زبانی
https://bit.ly/3QbvbZ9

دوره جامع هوش مصنوعی مولد GenAi
https://bit.ly/3U9KsuR

دوره مقدماتی هوش مصنوعی
https://bit.ly/3w4b8oD

دوره دیتا ساینس IBM
https://bit.ly/446cQT6


https://xn--r1a.website/datalook_ir
🔥112👏2👍1🙏1
پلتفرم لیندکین . موقعیت شغلی مهندس داده
👍11
معرفی یک ریپوی خوب ماشین لرنینگ

https://github.com/whatsinfinitum?tab=repositories

در این ریپو علیرضا گودرزی سینور دیتا ساینتیست چند پروژه خوب در خصوص LLM را قرار داده که می تونید استفاده کنید.
خودم خیلی استفاده کردم.
12🤩4
AI Scientist
معرفی شد؛ هوش مصنوعی متن‌باز برای انجام تحقیقات علمی

شرکت Sakana AI مستقر در توکیو با همکاری محققان دانشگاه آکسفورد و دانشگاه بریتیش کلمبیا، یک سیستم هوش مصنوعی متن‌باز معرفی کرده است که می‌تواند تحقیقات علمی را به‌طور مستقل انجام دهد. این سیستم که «دانشمند هوش مصنوعی» (The AI Scientist) نام دارد، نوید تغییر کامل روند اکتشافات علمی را می‌دهد.

براساس اعلام Sakana AI، این هوش مصنوعی جدید از مدل‌های زبانی بزرگ (LLM) برای تعامل با کاربر، ارائه پیشنهاد و اجرای دستورالعمل‌های تحقیقاتی، به‌ویژه در زمینه یادگیری ماشینی، استفاده می‌کند. AI Scientist کاملاً متن‌باز است و اکنون تحت مجوز Apache 2.0 در GitHub منتشر شده و استفاده، اصلاح و تجاری‌سازی آن قانونی است.

این شرکت همچنین چند مدل مولد تصویر در Hugging Face منتشر کرده است که با یکی از آن‌ها می‌توان تصاویری هنری ژاپنی موسوم به «اوکی‌یو» (Ukiyo) ایجاد کرد.

سیستم The AI Scientist فرایند علمی نوشتن یک مقاله را تقلید می‌کند. این هوش مصنوعی همانند یک انسان پس از مطرح‌کردن یک ایده‌ پژوهشی، آزمایش‌ها را طراحی و اجرا می‌کند و سپس نتایج نهایی را ارائه می‌دهد. این سیستم برای ارزیابی مقالات خود نیز همان روش سنتی همتاداوری مقالات علمی را شبیه‌سازی می‌کند.

بااین‌حال، اتوماسیون‌کردن تحقیقات علمی مسائل مهمی را درباره نقش دانشمندان انسانی پیش می‌کشد. درحالی که هوش مصنوعی ممکن است در پردازش حجم وسیعی از داده‌ها و شناسایی الگوها برتر باشد، شهود انسانی، خلاقیت و قضاوت اخلاقی همچنان در هدایت تحقیقات علمی به سمت نتایج معنادار و سودمند حیاتی است. درواقع مسئله اصلی این خواهد بود که باید بتوان بین کارایی هوش مصنوعی و مسائل انسانی تعادل برقرار کرد.
👍8🤔3🥴1
Forwarded from Data world with Mina (Mina Ra)
فایل npy یک فرمت باینری مخصوص برای ذخیره‌سازی آرایه‌ها در کتابخانه numpy در پایتون است. این فرمت توسط numpy توسعه داده شده و بهینه‌سازی شده است تا آرایه‌ها را به شکلی فشرده و سریع ذخیره و بازیابی کند. این فرمت بسیار مناسب برای ذخیره‌سازی داده‌های عددی و علمی بزرگ است که در پروژه‌های محاسباتی و یادگیری ماشین استفاده می‌شوند.

ویژگی‌های فایل‌های npy:
فشرده‌سازی و کارایی: فایل‌های npy داده‌ها را به صورت باینری ذخیره می‌کنند، که این باعث می‌شود ذخیره و بارگذاری داده‌ها سریع‌تر و کارآمدتر باشد نسبت به فرمت‌های متنی مثل CSV.

ذخیره‌سازی اطلاعات متادیتا: این فایل‌ها اطلاعاتی در مورد نوع داده‌ها، شکل آرایه و دیگر متادیتاهای مرتبط را ذخیره می‌کنند.

سازگاری با numpy: این فرمت به طور خاص با numpy سازگار است و به راحتی می‌تواند با استفاده از توابع numpy ذخیره و بارگذاری شود.

اگر جایی واقعا حجم داده میلیونی بالا دارید. حتما با pickle و npy زیاد کار کنید.
👍4
Forwarded from Data world with Mina (Mina Ra)
مدل های (LAM) چیست؟ و تفاوت بین LLM و LAM چیست؟

یک موضوع داغ در قلمرو هوش مصنوعی (AI) مدل‌های LAM است .

ابن مدلها گستره ای از مدل های زبان بزرگ (LLM) هستند که همه ما با آن آشنا هستیم. LLM ها می توانند متن را با پیش بینی کلمه یا نشانه بعدی بر اساس ورودی تولید کنند. LAM ها با تقویت این LLM ها برای تبدیل شدن به "عامل" این مرحله را به جلو می برند. Agent ها واحدهای نرم افزاری هستند که قادر به اجرای وظایف به تنهایی هستند، بنابراین به جای پاسخگویی ساده به پرسش های کاربر انسانی، در نهایت به رسیدن به یک هدف کمک می کنند.

در تعریف ساده تر LAM مدل هوش مصنوعی است که می تواند وظایف پیچیده را با تبدیل نیات انسان به عمل درک و اجرا کند. در LAMها، چنین سطوحی از استقلال و درک، هوش مصنوعی مولد را به دستیار فعالی تبدیل می‌کند که می‌تواند وظایف مختلفی را انجام دهد، از رزرو اتاق گرفته تا تصمیم‌گیری پیچیده بر اساس تجزیه و تحلیل داده‌های گذشته و حال.


آنها از طریق یکپارچه سازی با سیستم های خارجی، مانند دستگاه های IoT و ...، با دنیای واقعی تعامل دارند. با اتصال به این سیستم ها، LAM ها می توانند اقدامات فیزیکی انجام دهند، دستگاه ها را کنترل کنند، داده ها را بازیابی کنند یا اطلاعات را دستکاری کنند. این به LAM ها اجازه می دهد تا فرآیندهای کامل را مکانیزه کنند و هوشمندانه با جهان تعامل داشته باشند، با مردم گفتگو کنند، با شرایط متفاوت تنظیم شوند و حتی با سایر LAM ها همکاری کنند.


موارد استفاده بالقوه از مدل اکشن بزرگ را می توان در حوزه های مختلف اعمال کرد.

در مراقبت های بهداشتی، LAM می تواند مراقبت از بیمار را از طریق تشخیص های مدرن و استراتژی درمان مناسب تغییر دهد.

در بخش مالی، LAM می تواند در اندازه گیری ریسک، کشف تقلب و معاملات الگوریتمی کمک کند. در بخش خودرو، LAM می تواند به تولید خودروهای خودگردان و بهبود سیستم های ایمنی خودرو کمک کند


اگرچه مدل‌های اکشن بزرگ LAMهنوز نمایی تأثیرگذار در دنیای هوش مصنوعی پیدا نکرده‌اند، اما پذیرش سریع هوش مصنوعی، رویاپردازان و ذهن‌های خلاق را بر آن می‌دارد تا به دنبال راه‌های جدیدی برای استفاده از این فناوری باشند و فراتر از آنچه راه‌حل‌های فعلی ارائه می‌دهند، بروند.
🙏52
Model performance. Before you customize your LLM using techniques like fine-tuning and in-context learning evaluate how well and fast—and how consistently—the model generates your desired output. To measure model performance, you can use offline evaluations.

What are offline evaluations?

They’re tests that assess the model and ensure it meets a performance standard before advancing it to the next step of interacting with a human. These tests measure latency, accuracy, and contextual relevance of a model’s outputs by asking it questions, to which there are either correct or incorrect answers that the human knows.

There’s also a subset of tests that account for ambiguous answers, called incremental scoring. This type of offline evaluation allows you to score a model’s output as incrementally correct (for example, 80% correct) rather than just either right or wrong.
4
🧠وبینار AI meets Bio
💊با موضوع:
«کاربرد هوش مصنوعی در طراحی دارو، پیش دارو (Prodrug) و آنتی‌بادی های متصل به دارو (ADCs)»

👤با حضور: دکتر سعید اکبری
پژوهشگر پسادکترای دانشگاه Arizona State آمریکا
دکترای علوم و مهندسی ماکرومولکولی از دانشگاه Case Western Reserve آمریکا

📝محورها:
کاربرد شبکه عصبی گراف (GNN) در مطالعه برهمکنش دارو-پروتئین
کاربرد مدل زبانی (Language Model) در جدایش فازی پروتئین‌ها
ماهیت پیش‌ داروها و آنتی‌بادی های متصل به دارو و کاربرد آنها در زمینه Estrogen receptors

زمان: سه‌شنبه ۶ شهریور، ساعت ۱۸:۳۰
⌨️به صورت مجازی در اسکای‌روم

💠لینک شرکت در جلسه در کانال انجمن علمی بیوتکنولوژی شبکه نخبگان ایران منتشر خواهد شد. برای شرکت در وبینار، در کانال عضو شوید.

📌افزودن رویداد به گوگل کلندر

💰شرکت برای عموم علاقمندان آزاد و رایگان است.

در کانال انجمن علمی بیوتکنولوژی شبکه نخبگان ایران با ما‌ همراه باشید🌱
| @BioTech_Association |
9👍4