Применение диаграмм Вороного в геоаналитике и урбанистике
Диаграммы Вороного, также известные как полигоны Тиссена, представляют собой геометрический инструмент, который делит плоскость на регионы на основе близости к данным набором точек. Каждый регион (или ячейка) соответствует определенной исходной точке, и любое местоположение внутри региона ближе к соответствующей точке, чем к любой другой.
В областях геоаналитики и урбанистики диаграммы Вороного выполняют несколько важных функций:
1. Распределение ресурсов: Диаграммы Вороного помогают в оптимизации расположения и распределения ресурсов, таких как общественные услуги (больницы, пожарные станции, школы), торговые точки и коммунальные услуги. Минимизируя расстояние до ближайшей точки обслуживания, планировщики могут повысить эффективность и доступность сервиса.
2. Анализ сетей: Они используются для анализа и проектирования сетей, включая транспортные, телекоммуникационные и коммунальные сети, обеспечивая максимизацию покрытия и минимизацию избыточности.
3. Пространственный анализ: Диаграммы Вороного помогают в анализе пространственных данных, способствуя пониманию распределения различных географических явлений, таких как уровни преступности, трафик или экологические измерения.
4. Градостроительство: В городских условиях эти диаграммы могут быть использованы для планирования и оценки городского развития, анализа жилой плотности, использования земли и воздействия новых разработок на существующие объекты.
5. Анализ рынка: Компании используют диаграммы Вороного для анализа рынка с целью определения торговых зон, на которые влияют конкуренты, и выявления потенциальных мест для новых магазинов на основе близости к существующим клиентам.
https://github.com/m-erts/voronoi
@urban_mash
Диаграммы Вороного, также известные как полигоны Тиссена, представляют собой геометрический инструмент, который делит плоскость на регионы на основе близости к данным набором точек. Каждый регион (или ячейка) соответствует определенной исходной точке, и любое местоположение внутри региона ближе к соответствующей точке, чем к любой другой.
В областях геоаналитики и урбанистики диаграммы Вороного выполняют несколько важных функций:
1. Распределение ресурсов: Диаграммы Вороного помогают в оптимизации расположения и распределения ресурсов, таких как общественные услуги (больницы, пожарные станции, школы), торговые точки и коммунальные услуги. Минимизируя расстояние до ближайшей точки обслуживания, планировщики могут повысить эффективность и доступность сервиса.
2. Анализ сетей: Они используются для анализа и проектирования сетей, включая транспортные, телекоммуникационные и коммунальные сети, обеспечивая максимизацию покрытия и минимизацию избыточности.
3. Пространственный анализ: Диаграммы Вороного помогают в анализе пространственных данных, способствуя пониманию распределения различных географических явлений, таких как уровни преступности, трафик или экологические измерения.
4. Градостроительство: В городских условиях эти диаграммы могут быть использованы для планирования и оценки городского развития, анализа жилой плотности, использования земли и воздействия новых разработок на существующие объекты.
5. Анализ рынка: Компании используют диаграммы Вороного для анализа рынка с целью определения торговых зон, на которые влияют конкуренты, и выявления потенциальных мест для новых магазинов на основе близости к существующим клиентам.
https://github.com/m-erts/voronoi
Это ссылка на мой скрипт. Я показала, как делать диаграммы Вороного с помощью 2х библиотек: geovoronoi, scipy.
@urban_mash
👍25❤12🔥8🥰1
Forwarded from GIS AND PEACE (Bella)
(НЕ)КУРС: Python для геоаналитики 🐍🌐
Python открывает невероятные возможности для анализа и визуалиации пространственных данных и помогает автоматизировать многие рутинные процессы⭐️
Когда я начала использовать Python в своей работе, то с удивлением обнаружила, что открытой и структурированной информации о Python для пространственного анализа совсем немного, а на русском языке я не нашла вовсе☹️
Поэтому я решила сама собрать небольшое интерактивное пособие, которое расскажет о том, как можно применять Python в работе с городскими данными. Разделы будут дополняться постепенно. К каждому из них будет доступно видео на Youtube канале Основы программирования для географов😍
Этот проект – экcперимент. Я его буду вести в режиме реального времени, и вы тоже можете на него повлиять. Ваши отзывы помогут мне двигаться дальше и выкладывать больше материалов, а конструктивная критика – становиться лучше✏️
Первые два видео уже на YouTube💙
P.S
🔵 основы Python разбирать не будем, но вот тут есть небольшая подборка ресурсов, где можно с ним познакомиться
-----
GEO-PY Пособие📕
GEO-PY Плейлист📱
#geo_py
🌎🕊️ GIS_AND_PEACE
Python открывает невероятные возможности для анализа и визуалиации пространственных данных и помогает автоматизировать многие рутинные процессы
Когда я начала использовать Python в своей работе, то с удивлением обнаружила, что открытой и структурированной информации о Python для пространственного анализа совсем немного, а на русском языке я не нашла вовсе
Поэтому я решила сама собрать небольшое интерактивное пособие, которое расскажет о том, как можно применять Python в работе с городскими данными. Разделы будут дополняться постепенно. К каждому из них будет доступно видео на Youtube канале Основы программирования для географов
Этот проект – экcперимент. Я его буду вести в режиме реального времени, и вы тоже можете на него повлиять. Ваши отзывы помогут мне двигаться дальше и выкладывать больше материалов, а конструктивная критика – становиться лучше
Первые два видео уже на YouTube
P.S
-----
GEO-PY Пособие
GEO-PY Плейлист
#geo_py
🌎🕊️ GIS_AND_PEACE
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35❤9👍5❤🔥1
Folium
Библиотека
Нашла отличный плейлист, в котором медленно и пошагово разбирают функционал библиотеки.
@urban_mash
Библиотека
folium является мощным инструментом для визуализации геоданных в Python. Она позволяет пользователям создавать различные типы карт и визуализировать данные в интерактивном формате, используя возможности JavaScript-библиотеки Leaflet.js. Сохраняйте 😊Нашла отличный плейлист, в котором медленно и пошагово разбирают функционал библиотеки.
@urban_mash
YouTube
Introduction to Folium for interactive maps in python
In video we will get to know about folium python library for creating interactive maps in python
Blog post for this video - https://nagasudhir.blogspot.com/2021/07/introduction-to-folium-for-interactive.html
External map tile providers for folium - http://leaflet…
Blog post for this video - https://nagasudhir.blogspot.com/2021/07/introduction-to-folium-for-interactive.html
External map tile providers for folium - http://leaflet…
🔥11👍3
index.html
2.6 MB
👍12🔥4🤩3
Градорегулирование. Основы.pdf
6.5 MB
👍30❤10🤔8🔥4💯2
НРА_Рэнкинг_устойчивости_развития_туризма_и_индустрии_гостепри.pdf
19.8 MB
Классная сравнительная статистика по туризму субъектов РФ от ESG-лаборатории ЭФ МГУ (2023 год).
Сразу вспомнила проект КБ Стрелки по индексу туристической привлекательности регионов России.
@urban_mash
Сразу вспомнила проект КБ Стрелки по индексу туристической привлекательности регионов России.
@urban_mash
🔥16❤3👏1
Следующие несколько дней проведу на Geospatial world forum в Роттердаме!
Первое удивление - ровно никто ничего не знает о Яндексе :)
@urban_mash
Первое удивление - ровно никто ничего не знает о Яндексе :)
@urban_mash
🔥38❤6🤔4👏2👍1
Сегодня я закончила университет! 6 лет. Я могла его не закончить по Х причинам. 3 основных: ковид, война и рассеянный склероз. Но я рада, что справилась. Речь на вручении дипломов мне запретили говорить. Цензура вещь такая. 2024 год. К слову, она коснулась не только меня. У Арины вместо цитаты были звёздочки.
Но теперь точно можно сказать, что я дипломированный урбанист :) А что такое город я до сих пор не знаю 😁
P.S. Очень много вопросов получаю про магистратуру ВШУ. Но я закончила ФГРР, 5 летний бакалавриат. Если есть вопросы по баку - пишите. А по магистратуре я не компетентна(
@urban_mash
Но теперь точно можно сказать, что я дипломированный урбанист :) А что такое город я до сих пор не знаю 😁
P.S. Очень много вопросов получаю про магистратуру ВШУ. Но я закончила ФГРР, 5 летний бакалавриат. Если есть вопросы по баку - пишите. А по магистратуре я не компетентна(
@urban_mash
👏91❤44🔥21👍2🥰2😢2🕊2
Не могу не поделиться здесь радостной новостью! Получила третье гражданство! Теперь я официально гражданин Сербии 🇷🇸🇷🇸🇷🇸
По такому поводу скоро выложу подборку статей по Балканам :)
@urban_mash
По такому поводу скоро выложу подборку статей по Балканам :)
@urban_mash
🔥56🤯11❤🔥7❤5👍2
FAIL
Я не прошла на магистерскую программу по геоаналитике в Вышке. У меня 83 балла) Я подавала апелляцию на 12 баллов, подняли на 4 только, к сожалению.
Не знаю, как принималось решение, что именно с меня люди не проходят, но вот так. Моего опыта и знаний не хватило для этой магистратуры.
Если кто-то прошел на эту программу из моих подписчиков - поздравляю! Напишите в лс, хочу вас захантить ахах)
@urban_mash
Я не прошла на магистерскую программу по геоаналитике в Вышке. У меня 83 балла) Я подавала апелляцию на 12 баллов, подняли на 4 только, к сожалению.
Не знаю, как принималось решение, что именно с меня люди не проходят, но вот так. Моего опыта и знаний не хватило для этой магистратуры.
Если кто-то прошел на эту программу из моих подписчиков - поздравляю! Напишите в лс, хочу вас захантить ахах)
@urban_mash
😢64🤯10👍7❤6👏4🦄3🤔1🤩1
Ассоциативные правила в геоаналитике
Обычно метод ассоциативных правил используется в классических текстовых задачах (LLM) или в продуктовой аналитике (аля определить схожесть продуктов в корзине пользователя). Но есть также интересное применение в геоаналитике.
Association Rule Mining — это метод анализа данных для выявления интересных ассоциаций между различными элементами в наборе данных.
В геоаналитике ассоциативные правила могут помочь найти связи между существующими местоположениями объектов (например, магазинов или складов) и использовать эти связи для планирования новых объектов.
1. Анализ существующих точек: Исследуйте текущие данные о местоположении, чтобы определить, какие точки часто встречаются вместе.
2. Метрики поддержки и lift: Используйте поддержку и lift для выявления взаимосвязей между местоположениями. Высокий lift указывает на высокую вероятность совместного расположения объектов.
3. Планирование новых объектов: Используйте выявленные ассоциации для прогнозирования выгодных местоположений новых объектов. Например, если данные показывают, что супермаркеты часто расположены рядом с жилыми комплексами, это может быть полезным индикатором.
Пример в бизнесе:
Задача: определить новые местоположения для магазинов. Правила ассоциации помогают прогнозировать, какие магазины будут располагаться поблизости друг от друга.
Практическая польза очевидна при адаптации маркетинговых кампаний и стратегий ценообразования. Это позволяет количественно оценить вероятных конкурентов и партнеров, что важно для стратегического планирования. Например, если данные показывают, что двум конкретным сетевым магазинам часто выгодно находиться рядом, это знание может быть использовано для разработки более эффективных конкурентных стратегий против других брендов.
В статье ниже были определены ассоциативные правила для сетей магазинов шаговой доступности в районе Токио :)
@urban_mash
Обычно метод ассоциативных правил используется в классических текстовых задачах (LLM) или в продуктовой аналитике (аля определить схожесть продуктов в корзине пользователя). Но есть также интересное применение в геоаналитике.
Association Rule Mining — это метод анализа данных для выявления интересных ассоциаций между различными элементами в наборе данных.
В геоаналитике ассоциативные правила могут помочь найти связи между существующими местоположениями объектов (например, магазинов или складов) и использовать эти связи для планирования новых объектов.
1. Анализ существующих точек: Исследуйте текущие данные о местоположении, чтобы определить, какие точки часто встречаются вместе.
2. Метрики поддержки и lift: Используйте поддержку и lift для выявления взаимосвязей между местоположениями. Высокий lift указывает на высокую вероятность совместного расположения объектов.
3. Планирование новых объектов: Используйте выявленные ассоциации для прогнозирования выгодных местоположений новых объектов. Например, если данные показывают, что супермаркеты часто расположены рядом с жилыми комплексами, это может быть полезным индикатором.
Пример в бизнесе:
Задача: определить новые местоположения для магазинов. Правила ассоциации помогают прогнозировать, какие магазины будут располагаться поблизости друг от друга.
Практическая польза очевидна при адаптации маркетинговых кампаний и стратегий ценообразования. Это позволяет количественно оценить вероятных конкурентов и партнеров, что важно для стратегического планирования. Например, если данные показывают, что двум конкретным сетевым магазинам часто выгодно находиться рядом, это знание может быть использовано для разработки более эффективных конкурентных стратегий против других брендов.
В статье ниже были определены ассоциативные правила для сетей магазинов шаговой доступности в районе Токио :)
@urban_mash
Medium
Finding Patterns in Convenience Store Locations with Geospatial Association Rule Mining
Understanding spatial trends in the location of Tokyo convenience stores
❤🔥14❤1👍1👏1
Одиночество и блазированность в городе
В университете я очень любила социологию/антропологию города, особенно с этих т.з. исследовать фильмы. Тут отрывок из моей работы по фильму Стива Маккуина "Стыд".
P.S. Отдельно рекомендую всем урбанистам поисследовать фильм Джармуша "Ночь на Земле".
@urban_mash
В университете я очень любила социологию/антропологию города, особенно с этих т.з. исследовать фильмы. Тут отрывок из моей работы по фильму Стива Маккуина "Стыд".
P.S. Отдельно рекомендую всем урбанистам поисследовать фильм Джармуша "Ночь на Земле".
@urban_mash
Teletype
Проблема городской маргинализации в фильме “Стыд”
Георг Зиммель в очерке «Большие города и духовная жизнь» описывает городскую жизнь и городскую культуру в рамках компенсаторных реакций...
❤17👍5
Аудит_внутриквартальных_территорий_постсоветского_периода_Йошкар.pdf
2.8 MB
"ДВОРУЛИЦА" в городском планировании
Концепция "дворулица" была предложена Юрием Григоряном в исследовании "Археология периферии" в 2013 году. Дворулицы представляют собой пространства между жилыми домами, которые не принадлежат конкретным зданиям, но выступают дворами для целого квартала и улицами для отдельно стоящих домов. Эти пространства обладают огромным потенциалом для превращения в удобные и функциональные зоны, но часто остаются неухоженными.
Вытекающие проблемы
Основа проблем "дворулиц" лежит в размытии понятия ответственности за их состояние между местными жителями, бизнесом и городскими властями. Это ведет к ряду негативных последствий:
1. Ухудшенное состояние среды: Низкий уровень освещенности, плохое качество дорожного покрытия, отсутствие тротуаров и другие недостатки инфраструктуры приводят к тому, что территории остаются неухоженными. На таких пространствах редко играют дети, не общаются соседи, нет комфортных условий для собеседований или прогулок.
2. Потеря проницаемости и связности: Из-за недостаточной связности пешеходных сетей снижаются пешеходные потоки. Это создает неблагоприятные условия для офлайн-бизнесов на первых этажах зданий (ground floor), поскольку снижается количество точек притяжения.
3. Трудности для онлайн-бизнесов и сервисов такси: Неоптимальная транспортная связность затрудняет доставку и снижает эффективность сервисов такси, так как необустроенные дворулицы сложны для навигации для велосипедных курьеров, пешеходов и автомобилей.
Чтобы решить эти проблемы, нужно изучать потенциала фрагментации городской ткани...
Основная задача заключается в исследовании потенциала улучшения локальной связности через анализ и планирование городских пространств. Это включает в себя понимание существующих паттернов использования и поиск способов для их оптимизации.
А один из способов этого решения - протаивание...
Метод "протаивания" предлагает бесконфликтное обновление жилой среды через мягкие и экономичные преобразования. Этот подход позволяет создавать новые городские пространства, адаптированные к нуждам конкретных районов, формируя их уникальный характер и функциональность. Протаивание базируется на идее второй дорожной сети, которая состоит из внутриквартальных общественных и полу-общественных пространств, пешеходных, велосипедных и парковочных маршрутов. Эти маршруты формируются на основе сложившихся паттернов использования и обеспечивают более детализированную структуру, отличную от официальной сети автомобильных дорог.
Бесшовная интеграция для улучшения среды
Объединение официальной и второй дорожной сетей повышает проницаемость и пешеходную связность территории, улучшая качество жизни. Это включает концепции бесшовности, мелких лотов и коллективной собственности, способствующие раскрытию потенциала открытого пространства.
🏙 P.S. Для примера можно рассмотреть аудит внутриквартальных территорий в Йошкар-Оле, который мы с напарницей выполнили летом 2021 года.
@urban_mash
Концепция "дворулица" была предложена Юрием Григоряном в исследовании "Археология периферии" в 2013 году. Дворулицы представляют собой пространства между жилыми домами, которые не принадлежат конкретным зданиям, но выступают дворами для целого квартала и улицами для отдельно стоящих домов. Эти пространства обладают огромным потенциалом для превращения в удобные и функциональные зоны, но часто остаются неухоженными.
Вытекающие проблемы
Основа проблем "дворулиц" лежит в размытии понятия ответственности за их состояние между местными жителями, бизнесом и городскими властями. Это ведет к ряду негативных последствий:
1. Ухудшенное состояние среды: Низкий уровень освещенности, плохое качество дорожного покрытия, отсутствие тротуаров и другие недостатки инфраструктуры приводят к тому, что территории остаются неухоженными. На таких пространствах редко играют дети, не общаются соседи, нет комфортных условий для собеседований или прогулок.
2. Потеря проницаемости и связности: Из-за недостаточной связности пешеходных сетей снижаются пешеходные потоки. Это создает неблагоприятные условия для офлайн-бизнесов на первых этажах зданий (ground floor), поскольку снижается количество точек притяжения.
3. Трудности для онлайн-бизнесов и сервисов такси: Неоптимальная транспортная связность затрудняет доставку и снижает эффективность сервисов такси, так как необустроенные дворулицы сложны для навигации для велосипедных курьеров, пешеходов и автомобилей.
Чтобы решить эти проблемы, нужно изучать потенциала фрагментации городской ткани...
Основная задача заключается в исследовании потенциала улучшения локальной связности через анализ и планирование городских пространств. Это включает в себя понимание существующих паттернов использования и поиск способов для их оптимизации.
А один из способов этого решения - протаивание...
Метод "протаивания" предлагает бесконфликтное обновление жилой среды через мягкие и экономичные преобразования. Этот подход позволяет создавать новые городские пространства, адаптированные к нуждам конкретных районов, формируя их уникальный характер и функциональность. Протаивание базируется на идее второй дорожной сети, которая состоит из внутриквартальных общественных и полу-общественных пространств, пешеходных, велосипедных и парковочных маршрутов. Эти маршруты формируются на основе сложившихся паттернов использования и обеспечивают более детализированную структуру, отличную от официальной сети автомобильных дорог.
Бесшовная интеграция для улучшения среды
Объединение официальной и второй дорожной сетей повышает проницаемость и пешеходную связность территории, улучшая качество жизни. Это включает концепции бесшовности, мелких лотов и коллективной собственности, способствующие раскрытию потенциала открытого пространства.
🏙 P.S. Для примера можно рассмотреть аудит внутриквартальных территорий в Йошкар-Оле, который мы с напарницей выполнили летом 2021 года.
@urban_mash
🔥12👍8👏3❤1
В прошлом году в мае я впервые была на гео-форуме в Роттердаме. В этом году цель быть не только слушателем, но и выступающим. Сейчас дорабатываю свой диплом по Transit Oriented Development до публикации, а также начинаю работать над исследованием по методам определения оптимального местоположения (location problems).
Пока ресерчила тему конференций нашла отличную подборку geospatial conferences, которую в том числе дополнял мой бывший научный руководитель Егор Котов. Сохраняйте и принимайте участие! Профильные конференции и форумы - это отличная возможность почерпнуть профессиональное вдохновение!
Если кто-то также заинтересован в location problems, как и я сейчас, то велком в лс для обсуждение совместного академического сотрудничества :)
@urban_mash
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - Nowosad/conferences_2025: A list of geospatial conferences for 2025
A list of geospatial conferences for 2025. Contribute to Nowosad/conferences_2025 development by creating an account on GitHub.
❤18🔥7
LSCP vs MCLP vs P-median tg.pdf
1.1 MB
Локационные задачи: где размещать объекты с умом?
Выбор мест для магазинов, складов, больниц или станций — это локационные проблемы. Их цель — найти оптимальные точки, чтобы минимизировать затраты или максимизировать охват. Три ключевые модели:
1. LSCP — когда нужно гарантированно покрыть всех клиентов (например, пожарные станции в городе).
2. MCLP — когда ресурсов мало, а охват нужно максимизировать (например, аптеки в районе).
3. P-median — когда важно сократить среднее расстояние (например, логистические хабы для доставки).
Где применить?
- Ритейл — где открыть магазин?
- Логистика — где разместить склады?
- Госуслуги — как распределить больницы?
- Телеком — куда ставить вышки (тут также помогают диаграммы Вороного, о которых писала выше)?
Все эти модели уже реализованы в библиотеке
@urban_mash
Выбор мест для магазинов, складов, больниц или станций — это локационные проблемы. Их цель — найти оптимальные точки, чтобы минимизировать затраты или максимизировать охват. Три ключевые модели:
1. LSCP — когда нужно гарантированно покрыть всех клиентов (например, пожарные станции в городе).
2. MCLP — когда ресурсов мало, а охват нужно максимизировать (например, аптеки в районе).
3. P-median — когда важно сократить среднее расстояние (например, логистические хабы для доставки).
Где применить?
- Ритейл — где открыть магазин?
- Логистика — где разместить склады?
- Госуслуги — как распределить больницы?
- Телеком — куда ставить вышки (тут также помогают диаграммы Вороного, о которых писала выше)?
Все эти модели уже реализованы в библиотеке
spopt из PySAL — просто подставьте свои данные. Я поделюсь нашей черновой теоретической презентацией по принципу работы этих "моделек". @urban_mash
❤28👍9🔥9
Трудоустройство в большие и маленькие фирмы
Часто слышу от друзей и знакомых рассуждения о найме. Два главных тейка:
1. Яндекс оборзели, платят меньше рынка.
2. Урбан бюро оборзели, мало платят.
С одним из тейков я более, чем согласна, с другим нет) Любое трудоустройство - это заключение договора, это сделка между работником и работодателем. Работники, коих большинство, часто находятся в позиции прошения, особенно на российском рынке. Но давайте представим, что работодатели тоже за нас конкурируют, точно так же, как мы конкурируем за место в Амазон. Чем круче сотрудник, тем выше за него конкуренция. Когда говорят "дефицит кадров", это не значит, что нет рабочей силы. Рабочая сила есть, но не каждый человек, находящийся в поиске работы - нужный крутой кадр.
И когда на рынок труда выходит тот самый кадр, предлагая свои профессиональные услуги, компании начинают за него конкурировать. Яндекс (подставьте название любой корпорации), очевидно, предложить может нефинансовых плюшек (т.е. помимо зарплаты) гораздо больше, чем любая маленькая компания. Давайте перечислим:
1. ДМС
2. Классные френдли офисы со спортзалами, едой, библиотеками
3. Скидочные системы с партнерами
4. Мероприятия и разного рода развлечения
5. Репутация (такая строчка в резюме - маркер качества)
6. Профессиональный карьерный рост: много супер умных коллег, у которых ты учишься
7. Понятный карьерный рост: есть четкие регламенты и сроки грейдапов
8. Выстроенные стабильные процессы
... и т.д.
Именно поэтому в Яндекс все еще непросто попасть, несмотря на относительно низкие зарплаты. Однако когда вы маленькая компания, маленькое бюро или стартап, единственное преимущество, которое вы можете дать работнику - это деньги. И когда маленькие компании не предлагают те самые деньги (а зарплаты должны быть не просто на 5% выше рынка, а прям значительно выше), я задаюсь вопросом: а как вы вообще собираетесь расти компанию? Без кадров, без классной экспертизы сотрудников вы просто не выживите на рынке, молчу про увеличение прибыли.
Есть много исследований, которые подтверждают, что маленькие компании часто вынуждены предлагать более высокую заработную плату, чтобы конкурировать с крупными корпорациями. Собрала и прикрепила все ссылочки.
1. Компенсация нематериальных выгод деньгами
- Исследование Turban & Cable (2003) показывает, что кандидаты готовы соглашаться на меньшую зарплату в крупных компаниях из-за их репутации и дополнительных льгот.
- Теория трансакционных издержек (Williamson, 1985).
2. "Премия за риск" в малом бизнесе
Предприниматели и сотрудники малых фирм получают в среднем больше (почасовая оплата), чем в крупных компаниях – это компенсация за нестабильность и отсутствие гарантий (Hamilton, 2000).
3. Эмпирические данные о зарплатах
- В работе Oi & Idson (1999) собрана инфа о зарплатах, вывод: крупные фирмы платят меньше за аналогичные позиции, но компенсируют это стабильностью и бонусами.
- А тут Brown & Medoff (1989) показано, что размер компании отрицательно коррелирует с зарплатой (чем больше компания, тем ниже ставки при прочих равных).
4. Современные исследования (стартапы)
- Lehdonvirta (2018) отмечает, что фрилансеры и сотрудники стартапов требуют надбавку за отсутствие соцпакета.
Из чего у меня 2 вывода:
1) Если вы маленький стартап, не готовый платить сотрудникам, если нет готовности брать кредиты на зарплаты, если не получается "продать" идею или просто найти внешних инвесторов, мб ну нафиг эту деятельность?)
2) Если вы кадр, но вам не предлагают работу крупные корпорации или вообще есть сложности с поиском работы, то скорее всего вы не кадр) Лучшее, что можно сделать, это уйти в минус по деньгам, но проапгрейдив свои скилы. Никто не отменил образовательные кредиты, помощь фондов, родительские деньги (если имеются возможности) и т.д.
P.S. совершенно иначе стоит вопрос, когда крупные компании конкурируют за кадры. Условные Сбер, WB, Ozon, Яндекс и т.д.
@urban_mash
Часто слышу от друзей и знакомых рассуждения о найме. Два главных тейка:
1. Яндекс оборзели, платят меньше рынка.
2. Урбан бюро оборзели, мало платят.
С одним из тейков я более, чем согласна, с другим нет) Любое трудоустройство - это заключение договора, это сделка между работником и работодателем. Работники, коих большинство, часто находятся в позиции прошения, особенно на российском рынке. Но давайте представим, что работодатели тоже за нас конкурируют, точно так же, как мы конкурируем за место в Амазон. Чем круче сотрудник, тем выше за него конкуренция. Когда говорят "дефицит кадров", это не значит, что нет рабочей силы. Рабочая сила есть, но не каждый человек, находящийся в поиске работы - нужный крутой кадр.
И когда на рынок труда выходит тот самый кадр, предлагая свои профессиональные услуги, компании начинают за него конкурировать. Яндекс (подставьте название любой корпорации), очевидно, предложить может нефинансовых плюшек (т.е. помимо зарплаты) гораздо больше, чем любая маленькая компания. Давайте перечислим:
1. ДМС
2. Классные френдли офисы со спортзалами, едой, библиотеками
3. Скидочные системы с партнерами
4. Мероприятия и разного рода развлечения
5. Репутация (такая строчка в резюме - маркер качества)
6. Профессиональный карьерный рост: много супер умных коллег, у которых ты учишься
7. Понятный карьерный рост: есть четкие регламенты и сроки грейдапов
8. Выстроенные стабильные процессы
... и т.д.
Именно поэтому в Яндекс все еще непросто попасть, несмотря на относительно низкие зарплаты. Однако когда вы маленькая компания, маленькое бюро или стартап, единственное преимущество, которое вы можете дать работнику - это деньги. И когда маленькие компании не предлагают те самые деньги (а зарплаты должны быть не просто на 5% выше рынка, а прям значительно выше), я задаюсь вопросом: а как вы вообще собираетесь расти компанию? Без кадров, без классной экспертизы сотрудников вы просто не выживите на рынке, молчу про увеличение прибыли.
Есть много исследований, которые подтверждают, что маленькие компании часто вынуждены предлагать более высокую заработную плату, чтобы конкурировать с крупными корпорациями. Собрала и прикрепила все ссылочки.
1. Компенсация нематериальных выгод деньгами
- Исследование Turban & Cable (2003) показывает, что кандидаты готовы соглашаться на меньшую зарплату в крупных компаниях из-за их репутации и дополнительных льгот.
- Теория трансакционных издержек (Williamson, 1985).
2. "Премия за риск" в малом бизнесе
Предприниматели и сотрудники малых фирм получают в среднем больше (почасовая оплата), чем в крупных компаниях – это компенсация за нестабильность и отсутствие гарантий (Hamilton, 2000).
3. Эмпирические данные о зарплатах
- В работе Oi & Idson (1999) собрана инфа о зарплатах, вывод: крупные фирмы платят меньше за аналогичные позиции, но компенсируют это стабильностью и бонусами.
- А тут Brown & Medoff (1989) показано, что размер компании отрицательно коррелирует с зарплатой (чем больше компания, тем ниже ставки при прочих равных).
4. Современные исследования (стартапы)
- Lehdonvirta (2018) отмечает, что фрилансеры и сотрудники стартапов требуют надбавку за отсутствие соцпакета.
Из чего у меня 2 вывода:
1) Если вы маленький стартап, не готовый платить сотрудникам, если нет готовности брать кредиты на зарплаты, если не получается "продать" идею или просто найти внешних инвесторов, мб ну нафиг эту деятельность?)
2) Если вы кадр, но вам не предлагают работу крупные корпорации или вообще есть сложности с поиском работы, то скорее всего вы не кадр) Лучшее, что можно сделать, это уйти в минус по деньгам, но проапгрейдив свои скилы. Никто не отменил образовательные кредиты, помощь фондов, родительские деньги (если имеются возможности) и т.д.
P.S. совершенно иначе стоит вопрос, когда крупные компании конкурируют за кадры. Условные Сбер, WB, Ozon, Яндекс и т.д.
@urban_mash
👍25🤔6🔥2👏1
Зачем геоаналитикам ML и зачем ML-щикам Geo?
Часто слышу от "трушных" программистов, что геоаналитика — это просто добавить столбцы
Почему геоаналитику недостаточно классического ML?
Когда я делала любую геомодель, которая по пространственным признакам предсказывает таргет, то я сталкивалась с несколькими проблемами:
- Пространственные данные автокоррелированы (значение в точке зависит от соседей) → обычные ML-модели дают смещённые предсказания.
- Координаты — это не просто два признака, а пространственная структура → нужны специальные методы (геостатистика, пространственные графы).
- В геоданных много шума (GPS-прыжки, ошибки картографирования) → без предобработки модели учатся на артефактах.
Почему ML-специалистам нужно понимание гео?
Когда мы с командой прогнозировали заказы в ПВЗ на хакатоне, мы увидели, что:
- Рядом с метро спрос выше в 1.5–3 раза → но если просто добавить
- Традиционные метрики (RMSE) не отражают географическую ошибку (промах на 500 м в центре Москвы ≠ 500 м в промзоне).
- Без понимания пространственных процессов (например, сезонной миграции) модель выдаёт "среднюю температуру по больнице".
Курсы, которые реально прокачали мои навыки
1. Working with Geospatial Data in Python (Datacamp) – лучший старт для работы с
2. Spatial Data Science and Applications (Coursera) – более общий курс, где есть QGIS, PostGIS, R и инструменты Hadoop.
3. Курс Инессы Трегубовой – разбор реальных практических кейсов. Это курс, где я была на 1 потоке и который стал для меня вдохновением пойти работать геоаналитиком в Я.Лавку, т.к. на тот момент Инесса там работала.
P.S. Если хотите глубже разобрать какой-то кейс – пишите, расскажу про подводные камни (например, почему kNN для геоданных — плохая идея).
@urban_mash
Часто слышу от "трушных" программистов, что геоаналитика — это просто добавить столбцы
latitude и longitude в датасет и прогнать через sklearn. Но на практике всё чуть сложнее. Почему геоаналитику недостаточно классического ML?
Когда я делала любую геомодель, которая по пространственным признакам предсказывает таргет, то я сталкивалась с несколькими проблемами:
- Пространственные данные автокоррелированы (значение в точке зависит от соседей) → обычные ML-модели дают смещённые предсказания.
- Координаты — это не просто два признака, а пространственная структура → нужны специальные методы (геостатистика, пространственные графы).
- В геоданных много шума (GPS-прыжки, ошибки картографирования) → без предобработки модели учатся на артефактах.
Почему ML-специалистам нужно понимание гео?
Когда мы с командой прогнозировали заказы в ПВЗ на хакатоне, мы увидели, что:
- Рядом с метро спрос выше в 1.5–3 раза → но если просто добавить
distance_to_subway, модель не учтёт нелинейность (например, пешеходные маршруты через парки).- Традиционные метрики (RMSE) не отражают географическую ошибку (промах на 500 м в центре Москвы ≠ 500 м в промзоне).
- Без понимания пространственных процессов (например, сезонной миграции) модель выдаёт "среднюю температуру по больнице".
Курсы, которые реально прокачали мои навыки
1. Working with Geospatial Data in Python (Datacamp) – лучший старт для работы с
geopandas и shapely.2. Spatial Data Science and Applications (Coursera) – более общий курс, где есть QGIS, PostGIS, R и инструменты Hadoop.
3. Курс Инессы Трегубовой – разбор реальных практических кейсов. Это курс, где я была на 1 потоке и который стал для меня вдохновением пойти работать геоаналитиком в Я.Лавку, т.к. на тот момент Инесса там работала.
P.S. Если хотите глубже разобрать какой-то кейс – пишите, расскажу про подводные камни (например, почему kNN для геоданных — плохая идея).
@urban_mash
❤36👍9🔥3🤔1
Введение бесплатного проезда в Белграде
В декабре 2021 года мэр Белграда Александр Шапич из Сербской прогрессивной партии SNS, объявил, что с 1 января 2022 года общественный транспорт в городе станет бесплатным для всех жителей. В действительности бесплатный городской транспорт (трамваи, автобусы, троллейбусы) вступил в силу с 2025 года. Официальная причина - поддержка граждан в условиях роста цен. Инфляция в Сербии в 2022 году достигала 15%.
ПОЧЕМУ ЭТО НЕРАЗУМНЫЙ ШАГ?
1. Финансовая нагрузка на бюджет
До реформы городской транспортный оператор GSP ежегодно получал 10–12 млрд динаров (≈85–100 млн евро) от продажи билетов. После введения бесплатного проезда, этот доход исчез, и убытки теперь покрываются из бюджета Белграда. В 2023 году на субсидии транспорта выделили более 20 млрд динаров (≈170 млн евро) — почти вдвое больше, чем раньше. Средства берутся из городского бюджета, который и так имеет долги (в 2023 году — около 1,5 млрд евро). Оппозиция, например, партия «Двери српске», утверждает, что это приводит к сокращению других важных программ — ремонта дорог, финансирования школ и больниц.
2. Ухудшение качества транспорта
Автопарк устарел: Шапич обещал закупить 500 новых автобусов, но к 2024 году поставлено лишь около 200, в основном китайские Yutong. Водители и профсоюзы жалуются на нехватку персонала и переработки, что приводит к сбоям в расписании (это мы еще не берем перекрытые дороги из-за протестов). А бюджет мощнее не становится, персонула надо платить деньги, подвижной состав надо закупать или ремонтировать текущий. И так были большие проблемы с наземным общественным транспортом, проблема никуда не делась.
3. Эластичность спроса на ОТ не зависит от цены
Если Шапич считает, что это хоть как-то повлияет на пробки, вынуждена огорчить. Местные жители и так не сильно желали платить за транспорт, можно сравнить эмпирически пассажиропотоки и кол-во проданных билетов на любом маршруте в час-пик. У Белграда не было проблем в недозагруженности, наоборот. Автобусы переполнены. На спрос цена не повлияла (что мб к счастью) в положительную сторону, т.к. условная половина и так не платила. Но зато город потерял половину поступлений от людей, которые платили. А автомобилисты в любой стране автомобилисты. Пока ОТ не удовлетворяет трем критериям: скорость, комфорт и предсказуемость, автомобилисты на него не пересядут. Но справедливости ради им и некуда пересаживаться, зайдите на любой маршрут в час-пик.
Мое мнение
Если мы заботимся о горожанах, мол инфляция высокая, логичнее ввести льготные тарифы для социально уязвимых групп (как идея посмотреть еще на причины инфляции, но это не точно). Если мы заботимся о пробках - это можно решить негативными стимулами по индивидуальному авто и позитивными по общественному (и цена билета автобуса не стимул). Реформа Шапича — классический пример популизма, отличающийся красивым обещанием перед выборами. Пока что реформа выглядит как политический пиар за счёт городского бюджета.
P.S. фотография - пример активного гражданского общества, которые борются за отмененные маршруты. Подробнее о кейсе можно почитать тут: Vratimo trolu 28.
P.P.S. как насчет возобновления строительства метро?) вот что действительно подняло бы рейтинги любого градоначальника 😁
@urban_mash
В декабре 2021 года мэр Белграда Александр Шапич из Сербской прогрессивной партии SNS, объявил, что с 1 января 2022 года общественный транспорт в городе станет бесплатным для всех жителей. В действительности бесплатный городской транспорт (трамваи, автобусы, троллейбусы) вступил в силу с 2025 года. Официальная причина - поддержка граждан в условиях роста цен. Инфляция в Сербии в 2022 году достигала 15%.
ПОЧЕМУ ЭТО НЕРАЗУМНЫЙ ШАГ?
1. Финансовая нагрузка на бюджет
До реформы городской транспортный оператор GSP ежегодно получал 10–12 млрд динаров (≈85–100 млн евро) от продажи билетов. После введения бесплатного проезда, этот доход исчез, и убытки теперь покрываются из бюджета Белграда. В 2023 году на субсидии транспорта выделили более 20 млрд динаров (≈170 млн евро) — почти вдвое больше, чем раньше. Средства берутся из городского бюджета, который и так имеет долги (в 2023 году — около 1,5 млрд евро). Оппозиция, например, партия «Двери српске», утверждает, что это приводит к сокращению других важных программ — ремонта дорог, финансирования школ и больниц.
2. Ухудшение качества транспорта
Автопарк устарел: Шапич обещал закупить 500 новых автобусов, но к 2024 году поставлено лишь около 200, в основном китайские Yutong. Водители и профсоюзы жалуются на нехватку персонала и переработки, что приводит к сбоям в расписании (это мы еще не берем перекрытые дороги из-за протестов). А бюджет мощнее не становится, персонула надо платить деньги, подвижной состав надо закупать или ремонтировать текущий. И так были большие проблемы с наземным общественным транспортом, проблема никуда не делась.
3. Эластичность спроса на ОТ не зависит от цены
Если Шапич считает, что это хоть как-то повлияет на пробки, вынуждена огорчить. Местные жители и так не сильно желали платить за транспорт, можно сравнить эмпирически пассажиропотоки и кол-во проданных билетов на любом маршруте в час-пик. У Белграда не было проблем в недозагруженности, наоборот. Автобусы переполнены. На спрос цена не повлияла (что мб к счастью) в положительную сторону, т.к. условная половина и так не платила. Но зато город потерял половину поступлений от людей, которые платили. А автомобилисты в любой стране автомобилисты. Пока ОТ не удовлетворяет трем критериям: скорость, комфорт и предсказуемость, автомобилисты на него не пересядут. Но справедливости ради им и некуда пересаживаться, зайдите на любой маршрут в час-пик.
Мое мнение
Если мы заботимся о горожанах, мол инфляция высокая, логичнее ввести льготные тарифы для социально уязвимых групп (как идея посмотреть еще на причины инфляции, но это не точно). Если мы заботимся о пробках - это можно решить негативными стимулами по индивидуальному авто и позитивными по общественному (и цена билета автобуса не стимул). Реформа Шапича — классический пример популизма, отличающийся красивым обещанием перед выборами. Пока что реформа выглядит как политический пиар за счёт городского бюджета.
P.S. фотография - пример активного гражданского общества, которые борются за отмененные маршруты. Подробнее о кейсе можно почитать тут: Vratimo trolu 28.
P.P.S. как насчет возобновления строительства метро?) вот что действительно подняло бы рейтинги любого градоначальника 😁
@urban_mash
👍23🔥9💯8❤4🤔1🦄1
kNN для геоданных
В одном из последних постов упомянула, что классический knn не оч хорош для геоданных, полетели вопросы в лс) Поэтому решила сделать отдельный пост!
📍 ПРОБЛЕМЫ
1. Масштабирование признаков
Геоданные обычно представлены в виде координат (широта, долгота), которые могут иметь разный масштаб (например, градусы vs. метры). Если не нормализовать данные, расстояние между точками будет искажаться.
Пример:
- В градусах:
- В метрах:
2. Расстояние на сфере (Земля не плоская)
Евклидово расстояние (
Пример:
- Вблизи экватора
3. Неравномерная плотность данных
В городах точек может быть много, а в сельской местности — мало. Это приводит к:
- Смещению предсказаний (kNN будет давать больше веса густонаселённым регионам).
- Проблемам с выбором
4. Вычислительная сложность
kNN требует хранения всех данных и вычисления расстояний для каждого нового объекта → O(N) на запрос. Для больших геодатасетов (миллионы точек) это неэффективно.
5. Категориальные признаки
Если в данных есть категории (например, тип местности), их сложно учесть в стандартной метрике расстояния.
📍 КАК УЛУЧШИТЬ kNN ДЛЯ ГЕОДАННЫХ?
1. Использовать метрики, которые учитывают кривизну Земли.
- самая популярная Haversine distance
- Vincenty distance более точный, но более медленный
2. Нормализация и масштабирование
- Если используете евклидово расстояние, приведите координаты к метрам (например, через
- Можно применить
Спойлер: в конце будет про UTM
3. Учет пространственной автокорреляции
- Взвешенный kNN – давать больше веса ближайшим соседям (например,
- KD-деревья или Ball Trees – ускоряют поиск соседей в пространственных данных (
*** кстати соседей в своей работе в Яндексе я ищу через роутеры по улично-дорожной сети, т.к. в моих задачах мне важна транспортная доступность
4. Оптимизация выбора k
- Использовать кросс-валидацию с учетом пространственного разделения (например,
- Методы вроде LOOCV (Leave-One-Out Cross-Validation) для маленьких датасетов.
📍 А КАК ЖЕ UTM???
UTM действительно помогают работать с геоданными в локальных координатах, но у них есть свои нюансы. За этими проекции следуюдет признать:
✅ Евклидово расстояние работает лучше – в метрах, а не в градусах.
✅ Меньше искажений на небольших территориях (город, область).
✅ Быстрые вычисления – не нужно считать Haversine.
Но есть ограничения...
1. Границы зон
Точки из разных зон UTM нельзя сравнивать напрямую (
2. Большие расстояния
UTM искажает расстояния за пределами зоны (~1000 км), для континентальных данных лучше подходит Haversine/Vincenty.
3. Высота не учитывается
UTM работает только с 2D-координатами. Если нужен рельеф, нужно добавлять
4. Неравномерная плотность
В городах точек больше, чем в сельской местности, тут нужен адаптивный
P.S. как быстро определить зону UTM
UTM хорош для локальных данных в одной зоне, но для сложных случаев имхо лучше использовать другие подходы. Про них напишу как-нибудь потом)
@urban_mash
В одном из последних постов упомянула, что классический knn не оч хорош для геоданных, полетели вопросы в лс) Поэтому решила сделать отдельный пост!
1. Масштабирование признаков
Геоданные обычно представлены в виде координат (широта, долгота), которые могут иметь разный масштаб (например, градусы vs. метры). Если не нормализовать данные, расстояние между точками будет искажаться.
Пример:
- В градусах:
lat ∈ [-90, 90], lon ∈ [-180, 180] → долгота влияет сильнее. - В метрах:
1° широты ≈ 111 км, 1° долготы ≈ 111 км × cos(lat) → зависимость от широты. 2. Расстояние на сфере (Земля не плоская)
Евклидово расстояние (
sqrt(Δlat² + Δlon²)) плохо работает на больших дистанциях, так как искажает реальные расстояния на сфере. Пример:
- Вблизи экватора
1° ≈ 111 км, но ближе к полюсам 1° долготы → 0 км. 3. Неравномерная плотность данных
В городах точек может быть много, а в сельской местности — мало. Это приводит к:
- Смещению предсказаний (kNN будет давать больше веса густонаселённым регионам).
- Проблемам с выбором
k (в плотных районах нужно маленькое k, в разреженных — большое). 4. Вычислительная сложность
kNN требует хранения всех данных и вычисления расстояний для каждого нового объекта → O(N) на запрос. Для больших геодатасетов (миллионы точек) это неэффективно.
5. Категориальные признаки
Если в данных есть категории (например, тип местности), их сложно учесть в стандартной метрике расстояния.
1. Использовать метрики, которые учитывают кривизну Земли.
- самая популярная Haversine distance
from sklearn.metrics.pairwise import haversine_distances
distances = haversine_distances([[lat1, lon1], [lat2, lon2]])
- Vincenty distance более точный, но более медленный
2. Нормализация и масштабирование
- Если используете евклидово расстояние, приведите координаты к метрам (например, через
pyproj). - Можно применить
StandardScaler или MinMaxScaler.3. Учет пространственной автокорреляции
- Взвешенный kNN – давать больше веса ближайшим соседям (например,
weight = 1 / distance). - KD-деревья или Ball Trees – ускоряют поиск соседей в пространственных данных (
sklearn.neighbors.BallTree)*** кстати соседей в своей работе в Яндексе я ищу через роутеры по улично-дорожной сети, т.к. в моих задачах мне важна транспортная доступность
4. Оптимизация выбора k
- Использовать кросс-валидацию с учетом пространственного разделения (например,
sklearn.model_selection.KFold с учетом координат). - Методы вроде LOOCV (Leave-One-Out Cross-Validation) для маленьких датасетов.
UTM действительно помогают работать с геоданными в локальных координатах, но у них есть свои нюансы. За этими проекции следуюдет признать:
✅ Евклидово расстояние работает лучше – в метрах, а не в градусах.
✅ Меньше искажений на небольших территориях (город, область).
✅ Быстрые вычисления – не нужно считать Haversine.
Но есть ограничения...
1. Границы зон
Точки из разных зон UTM нельзя сравнивать напрямую (
easting повторяется), нужно разбивать данные по зонам или использовать Haversine. 2. Большие расстояния
UTM искажает расстояния за пределами зоны (~1000 км), для континентальных данных лучше подходит Haversine/Vincenty.
3. Высота не учитывается
UTM работает только с 2D-координатами. Если нужен рельеф, нужно добавлять
altitude в метрику расстояния. 4. Неравномерная плотность
В городах точек больше, чем в сельской местности, тут нужен адаптивный
k или взвешенный kNN. P.S. как быстро определить зону UTM
import math
utm_zone = math.floor((lon+180)/6)+1
UTM хорош для локальных данных в одной зоне, но для сложных случаев имхо лучше использовать другие подходы. Про них напишу как-нибудь потом)
@urban_mash
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤4👍3🤔2