Share

cover art for Microsoft, Google, DataEng и хакеры

Data Coffee

Microsoft, Google, DataEng и хакеры

Season 1, Ep. 6

Новостной эпизод подкаста "Data Coffee" с вашими любимыми ведущими!


Shownotes:

00:30 Поддержка 3rd party cookies от Google и методика подсчёта ТВ-рейтинга

11:21 Data Engineering Manifesto

24:49 Контролируемая утечка из LinkedIn

30:40 Microsoft показывает Windows 11 пока ведущие поют оды Linux

40:57 GitHub Issues и фантазии насчёт виртуальных помощников

47:24 “Добрые” люди опустошают ваши старые NAS от WD

52:28 Социализм Евросоюза лезет в ваш контракт

58:56 Экомониторинг Байкала — имиджевый проект или польза?


Обложка - Hacker behind PC, Public Domain

Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_

Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

More episodes

View all episodes

  • 11. Хранилище данных Яндекс.Go (гостевой)

    01:00:34
    Тема выпуска “Хранилище данных Яндекс.Go” В гостях у подкаста `Data Coffee` руководитель DWH Яндекс.Go - Евгений Ермаков (Сайт) Shownotes: 01:35 Традиционно про кофе 03:29 Отличия Яндекс от других компаний 06:49 Что "своё” Евгений сделал в Яндексе 12:18 Экономия места или скорости 14:25 Факторы влияющие на оптимизацию 16:54 На чём построена кодогенерация 17:44 Анализ существующих решений 26:13 Бизнес-глоссарий для данных 29:02 “Под капотом” — кластеры YT и Greenplum 31:41 Эксклюзив для Data Coffee: тизер будущего доклада про трудности в оптимизации Greenplum 38:02 Батчинг, стриминг, вот это всё 39:43 Переходим от технического к более общему 40:02 Как выдвигаются идеи и как потом внедряются 43:02 Ревью, встречи 1:1 и хуралы 45:28 Как оценить затраты на новый проект и искать потом на него людей 51:22 Масштабирование хранилища при переходе от Такси к Go 56:22 Можно ли подкрутить рейтинг в Такси и Драйве Обложка - smallcurio, CC BY 2.0, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 10. Gentoo, доработки человека и многое другое

    01:24:33
    Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:04 “Не сможешь поставить Gentoo за 10 дней — нечего тебе делать в IT” и другие тезисы 25:23 Синхронный перевод видео в Яндекс.Браузере 36:49 Необычные плейлисты Spotify 41:38 Яндекс.Драйв будет повышать тарифы за неаккуратное вождение 48:33 Открытые датасеты для беспилотников, прогноза погоды и переводчика 52:43 Мозг подстраивается под новые органы и обстоятельства 1:07:25 Имплантация в тело чипов и не только 1:15:06 Восстановление телескопа Hubble 1:18:45 Схожесть между emoji Обложка - WCusr2019, CC0, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 9. IT-системы на автомагистралях (гостевой)

    01:14:10
    Тема выпуска “IT-системы на автомагистралях” В гостях у подкаста `Data Coffee` product owner компании Глосав - Алексей Мелёхин (Хабр) Shownotes: 01:03 Как обычно, про кофе 04:15 Чем занимается гость? 06:37 Что включает в себя проект "автоматизации" дороги? 08:28 Как работает взимание платы 12:36 Что делать с любителями скрыть номер? 13:46 Системы на дорогах: управление движением и взимания платы 15:30 Система фиксации нарушений и доказательства в суде 18:52 Инородные предметы и непредвиденные ситуации 22:43 Какая информация выводится на панели и знаки 26:12 Другая автоматизация: метеостанции, вода и лёд на покрытии, коэффициент сцепления 28:18 Как работают автоматические сценарии 28:47 Знаки на табло не являются знаками дорожного движения 30:18 Как происходит обмен данными с датчиками на дороге 33:51 Как обеспечить качество распознавания (классификация)? 36:02 Протоколы передачи "обстановки" от дорожных систем в автомобиль? 38:47 Ограничения Carplay / Android Auto 40:43 Далеко ли от дороги ЦОД? 41:33 GPU в серверах ЦОД 42:21 Как устроена система автоматического распознавания инцидентов 44:25 Alex чуть не уехал на встречку из Кипрского аэропорта 45:53 Подбивается ли статистика постфактум? 47:58 Про мост Golden Gate и оптимизацию трафика 50:16 Количество данных, которое генерируется в системах 52:01 Как организован доступ аналитиков к данным 54:26 Пользуются ли Data Scientists этими данными? 58:22 Контроль выезда на встречную полосу с помощью квадрокоптеров 1:00:47 Пролемы беспилотных автомобилей на дорогах 1:04:34 Системы моделирования трафика 1:07:29 Сложность системы и конкуренция на рынке в РФ Обложка - Rob Croes / Anefo, CC0, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 8. Цифровые следы, посёлок программистов, Excel и другое

    01:06:27
    Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 01:05 Новая версия Snoop - за каждым нашим шагом следят 16:12 Нужно ли сегодня уметь аккуратно писать рукой 19:40 Норвежский закон об обозначении обработанных фото 28:10 Посёлок программистов - почему всё рушится? 44:37 В Excel можно сделать всё, но зачем 56:41 Twitter через полгода закрывает Fleets 1:03:00 Новые подкаст-платформы Обложка - Sherlock Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 7. Визуализация данных: бизнес или искусство (гостевой)

    01:10:50
    Тема выпуска “Визуализация данных: бизнес или искусство” В гостях у подкаста `Data Coffee` основатель сообщества DataYoga, некоммерческой организации ВИЗСТАНДАРТ, а также нескольких компаний в области изучения языков, лечения от технологических зависимостей и соцмедиа мониторинга - Андрей Демидов (Facebook, LinkedIn, Instagram) Shownotes: 01:52 Кипрский кофе тонкого помола 06:14 Обучение визуализации 07:30 Зачем учиться визуализации, Marketing Technology Landscape 14:39 Стандартные метрики и создание новых 19:10 Научиться расчёту метрик самостоятельно 21:27 Язык визуализации как искусство 27:26 Отвлекает ли искусство в BI от сути 31:38 Самые интересные работы 35:39 Марафоны по работе с данными 44:23 Запрос на финансистов со знанием SQL и художественным образованием 46:11 Разнообразие BI-инструментов 54:00 Open source и бесплатные инструменты 57:00 Community специалистов Обложка - Gregory Burdin, Public domain, via Wikimedia Commons Сайт: https://datacoffee.site, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 5. Обсудим новости

    01:23:31
    Темы нет или наоборот тем много? Сегодня мы обсудим новости! Shownotes: 04:20 Яндекс запустил нейросеть Балабоба 09:28 Голосовые помощники и их возможности 18:22 Модель проникновения мух в жилище 24:04 Low Code не заменит программистов 32:20 Детская книжка про Apache Kafka 42:14 SQLite в мире приложений 49:02 Влияние манипуляций над данными на стоимость акций 56:40 Факап (или нет?) от стажёра HBO и истории из жизни 1:04:37 На что положительно повлиял карантин Обложка - Tokyoship Talk icon, WTF license Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 4. ETL-инструменты (гостевой)

    42:02
    Тема выпуска “ETL-инструменты” В гостях у подкаста `Data Coffee` ведущий разработчик игрового хранилища mail.ru и сооснователь русскоязычного сообщества airflow - Дина Сафина (Facebook, Telegram) Shownotes: 02:05 Два пути IT — либо кофе, либо алкоголь 04:09 Что такое ETL 08:20 Зачем мне ETL, если я — программист 09:25 Как выбрать ETL-инструмент 11:40 Airflow и другие инструментыы 18:57 Внутреннее устройство Airflow 27:49 Airflow-as-a-Service 33:57 Другие open-source решения 36:06 Dagster — убийца Airflow Обложка - https://airflow.apache.org Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat
  • 3. Данные в журналистике (гостевой)

    53:59
    Тема выпуска "Данные в журналистике" В гостях у подкаста ‘Data Coffee’ журналист "Медиазоны" - Максим Литаврин (Twitter, Telegram) Shownotes: 01:00 Журналист и кофе 04:00 Зачем журналисту данные 05:41 Где он их берёт 07:08 Инструменты журналиста 11:20 Как проверять информацию 20:00 Доверие читателя к журналисту 27:17 Кто владеет информацией - владеет миром? 29:38 Манипуляции vs. Open Government 41:06 Какие данные должны быть открытыми 44:24 Россия держится хорошо! 48:26 Начало пути в журналистику Обложка - Open Government Partnership, CC BY-SA 3.0, via Wikimedia Commons Канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat