Brodetskyi. Tech, VC, Startups
20.8K subscribers
839 photos
208 videos
42 files
3.16K links
Tech, VC, Business, Startups, AI and more.
👤 linkedin.com/in/andrii-brodetskyi
✉️ @politehnik
Download Telegram
🗂 В епоху, коли LLMs стають доступними і дешевими, однією з конкурентних переваг для AI-продукту стає наявність унікальних даних, на яких можна навчати чи файнтюнити модель.

Тому я з великим інтересом прочитав, як в Bloomberg натренували мовну модель на фінансових даних і текстах.

Половина тренувальних даних — загальнодоступні датасети, на яких зараз навчаються всі мовні моделі. Інша половина — фінансові звіти компаній, ділові прес-релізи, новини і аналітика Bloomberg.

Результат — модель BloombergGPT з 50 млрд параметрів показує на звичайних тестах результати на рівні з GPT-3, а на фінансових — значно обганяє всі неспеціалізовані моделі такого ж розміру. До фінансових тестів тут відносять sentiment analysis (позитивна чи негативна новина для компанії та інвесторів), аналіз новин та заголовків, пошук та аналіз сутностей в текстах.

Найцікавіше — фінансовий аналіз: given input from S&P 500 earnings reports that includes text and at least one table with financial data, the task is to answer conversational questions that require numerical reasoning over the input. Я використовував для подібних задач Bing AI, що допомогло мені зекономити немало часу при написанні проекту з Financial Reporting and Analysis. Більшість часу пішло на написання промптів і упаковку цифр, а з таким інструментом як BloombergGPT це було б ще швидше.

Ще один приклад в коментарях — автоматична генерація заголовків для новин.

Було лише питанням часу, коли саме Bloomberg, компанія з найбільшим масивом фінансових даних, створить такий інструмент. Можна уявити, скільки процесів там оптимізують з його допомогою і скільки нових фіч додадуть для клієнтів.

Фінансовим аналітикам теж пора потроху освоювати prompt engineering.
Brodetskyi. Tech, VC, Startups
100 most cited AI papers in 2022 з цікавою статистикою за три роки по країнам (лідери: США з великим відривом, Китай, UK) і організаціям: Google, Meta Microsoft. І власне списком пейперів. Класний зріз по галузі, що зараз найгарячіше: LLMs, diffusion models…
AI Index Report 2023 від Стенфорда [PDF]

400 сторінок статистики про індустрію AI. Багато графіків, буде корисно при підготовці тематичних звітів та презентацій.

Найцікавіші розділи — про R&D та економіку, про бенчмарки і етику теж цікаві, про policy та education занадто US-центричні.

Можна проглянути хайлайти на початку кожного з розділів, зручно.

Новини 2023 року (наприклад, GPT-4) в цей звіт не потрапили.

Читайте також: 100 most cited AI papers in 2022
Знайомі фаундери проходили цю програму за моєю рекомендацією і давали потім позитивні відгуки. Подавайтесь, для кого це релевантно, тут дають круті знання і можливості.

====

🟡StartUp Academy 3.0 — це онлайн-програма для фаундерів та С-level керівників стартапів про те, як управляти та масштабувати технологічні бізнеси. Учасники отримають:

▫️лекції та менторські сесії від засновників та топменеджерів глобальних бізнесів;
▫️до $110K негрошової підтримки у вигляді кредитів на користування хмарними сервісами, безоплатного доступу до продуктів, послуг та консультацій;
▫️можливість залучити інвестиції від найкращих венчурних фондів CEE

Минулого року п’ять бізнесів залучили інвестиції на суму від $100K до $1M.

🔖 Подати заявку можуть стартапи seed+ стадії розвитку із CEE. Для учасників з України зарезервовано 15% місць.

РЕЄСТРАЦІЯ
Новини chip race.

Japan is expected to spend $7 billion on fab equipment next year, which would mark a 82% jump from this year — the largest in the world

В той час як США одним тільки Chips Act виділяють $280 млрд на розвиток chip manufacturing всередині країни на наступні роки.

До речі, саме про глобальну гонку чіпів ми записали подкаст, скоро вийде. Поки що переслухайте попередній випуск про LLMs.
Сміявсь: SMMниця українського телеканалу нагенерувала купу фейкових фактів до дня народження Олеся Гончара і гарненько їх оформила. Контент-план виконано! От що буває, якщо не розбиратись як працюють LLM.
А ось на противагу класний юзкейс: майстер з Канева генерує в ChatGPT тексти для епітафій на пам'ятниках. Графічні референси робить в Midjourney, старі фото покращує через Remini.

«Звісно, щоб отримати бажаний результат, потрібно зробити три-чотири запити з уточненнями, але навіть у такому випадку часто виходять кращі епітафії, ніж ті, з якими приходять замовники, – продовжує Станіслав. – Здебільшого люди не паряться з цього приводу. У нас 99% запитів дуже примітивні, на кшталт «Пам'ятаємо, любимо, сумуємо…» . Чомусь люди думають, що так потрібно, хоча ми кожному говоримо, що людина – це індивідуальність і не варто робити все під копірку».
Brodetskyi. Tech, VC, Startups
🎈 Неймовірна історія: засновниця продала стартап банку JP Morgan за $175 млн, домалювавши йому x10 фейкових користувачів (Forbes, WSJ) Спочатку все виглядало круто. 2016 рік, випускниця топової бізнес-школи Wharton Чарлі Джавіс засновує сервіс для допомоги…
В січні писав тут про неймовірну історію підприємниці, яка продала свій стартап банку JPMorgan, сфабрикувавши його кількість підписників в 10 разів. Фактично продала за $175 млн email-лист з фейковими адресами.

Логічне продовження історії: The young founder was arrested Monday night in New Jersey, facing fraud charges from the SEC and Justice Department, where a criminal investigation is underway.

У зв'язку з цим поділюсь гарним критичним профайлом Джавіс від американського Forbes, який читав в січні. Вона не тільки перебільшувала досягнення компанії, але і прямо брехала інвесторам та потенційним партнерам. Розповідала про тисячі користувачів сервісу, коли продукту не існувало, а у відповідь на зауваження пояснювала: ‘Listen, these old people don't understand, this is how it works, you fake it 'til you make it.' Розкидалась іменами, малювала занадто оптимістичні прогнози і так далі, по класиці.

Буде корисно прочитати всім, хто має справу з такими продавцями. Ми читали багато подібних історій — Theranos, FTX, менш відомі імена. Постфактум це легко складається в наратив про засновника-фродстера. Складніше побачити red flags в реальному часі.
Ситуація в індустрії AI: провайдери хмарних сервісів не справляються з попитом. Стільки стартапів бажають тренувати власні ML-моделі, що серверних потужностей не вистачає на всіх.

Стартапи стоять в черзі за серверами GPU або орендують їх у когось, хто забронював раніше. Хмарні провайдери стоять в черзі за GPU від Nvidia, щоб наростити потужності, на закриття потреби піде 2-3 місяці.

Open AI не може продавати користувачам виділені сервери для AI, тому що все це працює на Azure і потужностей не вистачає. Oracle відмовляється від нових клієнтів через нестачу GPU, і так далі.

P.S. Вартість акцій Nvidia зараз на максимумі з початку 2022 року. Правду кажуть, під час золотої лихоманки треба не купувати ділянки, а продавати лопати.
Хороший пост про AI value chain: як саме створюється цінність на кожному з етапів технологічного стека AI, від серверного заліза Nvidia до "фонового" AI в consumer продуктах. Непоганий аналіз з тверезим прогнозом.

https://every.to/napkin-math/who-wins-the-ai-value-chain
Brodetskyi. Tech, VC, Startups
Хороший пост про AI value chain: як саме створюється цінність на кожному з етапів технологічного стека AI, від серверного заліза Nvidia до "фонового" AI в consumer продуктах. Непоганий аналіз з тверезим прогнозом. https://every.to/napkin-math/who-wins-the…
І більш детальний аналіз від a16z на цю ж тему.

> What we don’t know, and what has now become the critical question, is: Where in this market will value accrue?

Over the last year, we’ve met with dozens of startup founders and operators in large companies who deal directly with generative AI. We’ve observed that infrastructure vendors are likely the biggest winners in this market so far, capturing the majority of dollars flowing through the stack. Application companies are growing topline revenues very quickly but often struggle with retention, product differentiation, and gross margins. And most model providers, though responsible for the very existence of this market, haven’t yet achieved large commercial scale.

In other words, the companies creating the most value — i.e. training generative AI models and applying them in new apps — haven’t captured most of it.

> it’s reasonable to guess that 10-20% of total revenue in generative AI today goes to cloud providers.

Most of it is spent at the Big 3 clouds: Amazon Web Services (AWS), Google Cloud Platform (GCP), and Microsoft Azure.

> There don’t appear, today, to be any systemic moats in generative AI. As a first-order approximation, applications lack strong product differentiation because they use similar models; models face unclear long-term differentiation because they are trained on similar datasets with similar architectures; cloud providers lack deep technical differentiation because they run the same GPUs; and even the hardware companies manufacture their chips at the same fabs.

Рекомендую!

Зараз детально досліджую цю тему, буду шерити багато матеріалів. Все більше людських і економічних ресурсів вливається в сферу Gen AI. Не стоїть питання "як технічно все зробити", з цим все більш-менш ясно. Ключове питання — як створити цінність і як її захопити (= змусити когось платити за продукт).
Продовжуємо досліджувати нову економіку AI.

В попередніх постах ми розглянули, як формується AI value chain — від заліза і хмарних потужностей, через моделі і до кінцевого продукту.

На кожному з етапів спрощується поріг входження: будь-хто може створити writing tool, використовуючи Open AI API, але навряд чи хтось може створити з нуля конкуренцію для Nvidia. А що з проміжним етапом — моделей?

TechCrunch описує пітчдек AI-research стартапа Anthropic, створеного виходцями з Open AI. Вони піднімають раунд для створення нової AI-моделі, в 10 раз потужнішої за наявні зараз. На це витратять $1 млрд за півтора роки. Всього за наступні два роки планують підняти $5 млрд. Трохи цікавих деталей:

> Anthropic describes the frontier model as a “next-gen algorithm for AI self-teaching,” making reference to an AI training technique it developed called “constitutional AI.” At a high level, constitutional AI seeks to provide a way to align AI with human intentions — letting systems respond to questions and perform tasks using a simple set of guiding principles.

Anthropic estimates its frontier model will require on the order of 10^25 FLOPs, or floating point operations — several orders of magnitude larger than even the biggest models today. Of course, how this translates to computation time depends on the speed and scale of the system doing the computation; Anthropic implies (in the deck) it relies on clusters with “tens of thousands of GPUs.”

> This frontier model could be used to build virtual assistants that can answer emails, perform research and generate art, books and more, some of which we have already gotten a taste of with the likes of GPT-4 and other large language models.

“These models could begin to automate large portions of the economy,” the pitch deck reads. “We believe that companies that train the best 2025/26 models will be too far ahead for anyone to catch up in subsequent cycles.”

> Dario Amodei, the former VP of research at OpenAI, launched Anthropic in 2021 as a public benefit corporation, taking with him a number of OpenAI employees, including OpenAI’s former policy lead Jack Clark. Amodei split from OpenAI after a disagreement over the company’s direction, namely the startup’s increasingly commercial focus.

> Google is also among Anthropic’s investors, having pledged $300 million in Anthropic for a 10% stake in the startup. Under the terms of the deal, Anthropic agreed to make Google Cloud its “preferred cloud provider” with the companies “co-develop[ing] AI computing systems.”

👆🏻Стратегічний хід Google — вони інвестують в перспективного гравця на рівні моделей і водночас гарантують масштабного клієнта для своїх хмарних сервісів, тобто захоплюють цінність відразу на кількох рівнях AI value chain.
What a telling story.

EU allocated hundreds of millions of euros for equity-free funding for Polish startups. That created an opportunity for corruption. €12M went to a 10-day-old company founded by a 27 yo bartender; another €27M went to a company connected to the advisory board of the govt body that distributed the grants. Now all the payments are suspended because of an anti-corruption investigation. Legit startups which rely on this financing are facing huge trouble, cutting spending and firing people.

I heard from colleagues within the Ukrainian VC industry that the Polish VC market was overfilled with accessible money in the last few years, creating unrealistic valuations, etc. Now this story... One more proof that too much money is a problem, not a solution.

P.S. Can't stop thinking about the expected inflow of EU grants for Ukrainian startups in the following years.
Завтра буду тут.

Як завжди: tech, VC, стартапи — підходьте, буде гарний нетворкінг 🤝
Завжди радий поділитись своїми думками про тренди tech-індустрії з провідними медіа. Поговорив в ефірі Радіо НВ про штучний інтелект, його загрози та регулювання. Глибоко не занурювались через особливості формату, але загалом вийшло динамічно!

https://youtu.be/ov-t9orS7b4
Цікавий виступ Грега Брокмена, кофаундера Open AI. Він показує нові можливості ChatGPT — плагіни для інтеграції з інтернет-сервісами, фактчекінгу, роботи з зображеннями і електронними таблицями. Glimpse into the future. Буквально за півроку такі фічі будуть доступними в багатьох аналогічних продуктах.

https://youtu.be/C_78DM8fG6E
📈 Трохи технічного аналізу AI-хайпу.

За оцінками equity-аналітиків JPMorgan, хайп навколо AI пояснює 53% зростання індексу S&P 500 з початку року.

Лише 6 тех-компаній, які є лідерами в AI, — Microsoft, Alphabet, Amazon, Meta, Nvidia, Salesforce — сумарно зросли в ринковій вартості на $1,4 трлн.

Аналітики JPM відзначають, що це рекордна концентрація індексів (narrow stock leadership) на зростаючому ринку з початку 90-х і вбачають в цьому один з індикаторів можливої рецесії.
Стільки цікавого зараз відбувається в сфері AI. Щодня дивлюсь відео, проглядаю новини, розсилки, нові продукти, і не встигаю ділитись навіть частиною всього цього.

Одне з джерел, які подобаються — канал AI Explained, автор доступно переказує новини AI: https://youtu.be/E2aZiejw-8A
А цього хлопця ви пам'ятаєте — Трістан Харріс, один з головних спікерів руху за людяні технології, консультант фільму Social Dilemma. Разом з колегою зробили презентацію про ризики AI, як органічне продовження історії з соціальними медіа. Трохи провокацій, трохи спекуляцій, в цілому варто переглянути, щоб задуматись про те, про що не задумуєшся в потоці щоденних оптимістичних новин про AI.

https://youtu.be/xoVJKj8lcNQ