Share

Data Coffee

Подкаст о данных в современном мире

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных.
Latest Episode8/7/2021

Хранилище данных Яндекс.Go (гостевой)

Season 1, Ep. 11
Тема выпуска “Хранилище данных Яндекс.Go” В гостях у подкаста `Data Coffee` руководитель DWH Яндекс.Go - Евгений Ермаков (Сайт) Shownotes: 01:35 Традиционно про кофе 03:29 Отличия Яндекс от других компаний 06:49 Что "своё” Евгений сделал в Яндексе 12:18 Экономия места или скорости 14:25 Факторы влияющие на оптимизацию 16:54 На чём построена кодогенерация 17:44 Анализ существующих решений 26:13 Бизнес-глоссарий для данных 29:02 “Под капотом” — кластеры YT и Greenplum 31:41 Эксклюзив для Data Coffee: тизер будущего доклада про трудности в оптимизации Greenplum 38:02 Батчинг, стриминг, вот это всё 39:43 Переходим от технического к более общему 40:02 Как выдвигаются идеи и как потом внедряются 43:02 Ревью, встречи 1:1 и хуралы 45:28 Как оценить затраты на новый проект и искать потом на него людей 51:22 Масштабирование хранилища при переходе от Такси к Go 56:22 Можно ли подкрутить рейтинг в Такси и Драйве Обложка - smallcurio, CC BY 2.0, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
8/7/2021

Хранилище данных Яндекс.Go (гостевой)

Season 1, Ep. 11
Тема выпуска “Хранилище данных Яндекс.Go” В гостях у подкаста `Data Coffee` руководитель DWH Яндекс.Go - Евгений Ермаков (Сайт) Shownotes: 01:35 Традиционно про кофе 03:29 Отличия Яндекс от других компаний 06:49 Что "своё” Евгений сделал в Яндексе 12:18 Экономия места или скорости 14:25 Факторы влияющие на оптимизацию 16:54 На чём построена кодогенерация 17:44 Анализ существующих решений 26:13 Бизнес-глоссарий для данных 29:02 “Под капотом” — кластеры YT и Greenplum 31:41 Эксклюзив для Data Coffee: тизер будущего доклада про трудности в оптимизации Greenplum 38:02 Батчинг, стриминг, вот это всё 39:43 Переходим от технического к более общему 40:02 Как выдвигаются идеи и как потом внедряются 43:02 Ревью, встречи 1:1 и хуралы 45:28 Как оценить затраты на новый проект и искать потом на него людей 51:22 Масштабирование хранилища при переходе от Такси к Go 56:22 Можно ли подкрутить рейтинг в Такси и Драйве Обложка - smallcurio, CC BY 2.0, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
7/24/2021

IT-системы на автомагистралях (гостевой)

Season 1, Ep. 9
Тема выпуска “IT-системы на автомагистралях” В гостях у подкаста `Data Coffee` product owner компании Глосав - Алексей Мелёхин (Хабр) Shownotes: 01:03 Как обычно, про кофе 04:15 Чем занимается гость? 06:37 Что включает в себя проект "автоматизации" дороги? 08:28 Как работает взимание платы 12:36 Что делать с любителями скрыть номер? 13:46 Системы на дорогах: управление движением и взимания платы 15:30 Система фиксации нарушений и доказательства в суде 18:52 Инородные предметы и непредвиденные ситуации 22:43 Какая информация выводится на панели и знаки 26:12 Другая автоматизация: метеостанции, вода и лёд на покрытии, коэффициент сцепления 28:18 Как работают автоматические сценарии 28:47 Знаки на табло не являются знаками дорожного движения 30:18 Как происходит обмен данными с датчиками на дороге 33:51 Как обеспечить качество распознавания (классификация)? 36:02 Протоколы передачи "обстановки" от дорожных систем в автомобиль? 38:47 Ограничения Carplay / Android Auto 40:43 Далеко ли от дороги ЦОД? 41:33 GPU в серверах ЦОД 42:21 Как устроена система автоматического распознавания инцидентов 44:25 Alex чуть не уехал на встречку из Кипрского аэропорта 45:53 Подбивается ли статистика постфактум? 47:58 Про мост Golden Gate и оптимизацию трафика 50:16 Количество данных, которое генерируется в системах 52:01 Как организован доступ аналитиков к данным 54:26 Пользуются ли Data Scientists этими данными? 58:22 Контроль выезда на встречную полосу с помощью квадрокоптеров 1:00:47 Пролемы беспилотных автомобилей на дорогах 1:04:34 Системы моделирования трафика 1:07:29 Сложность системы и конкуренция на рынке в РФ Обложка - Rob Croes / Anefo, CC0, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
7/10/2021

Визуализация данных: бизнес или искусство (гостевой)

Season 1, Ep. 7
Тема выпуска “Визуализация данных: бизнес или искусство” В гостях у подкаста `Data Coffee` основатель сообщества DataYoga, некоммерческой организации ВИЗСТАНДАРТ, а также нескольких компаний в области изучения языков, лечения от технологических зависимостей и соцмедиа мониторинга - Андрей Демидов (Facebook, LinkedIn, Instagram) Shownotes: 01:52 Кипрский кофе тонкого помола 06:14 Обучение визуализации 07:30 Зачем учиться визуализации, Marketing Technology Landscape 14:39 Стандартные метрики и создание новых 19:10 Научиться расчёту метрик самостоятельно 21:27 Язык визуализации как искусство 27:26 Отвлекает ли искусство в BI от сути 31:38 Самые интересные работы 35:39 Марафоны по работе с данными 44:23 Запрос на финансистов со знанием SQL и художественным образованием 46:11 Разнообразие BI-инструментов 54:00 Open source и бесплатные инструменты 57:00 Community специалистов Обложка - Gregory Burdin, Public domain, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat