AWS на русском cover art

AWS на русском

AWS на русском

By: Viktor Vedmich
Listen for free

About this listen

Подкаст ”AWS на русском”. Говорим про использование облачных технологий, построение serverless приложений, развертывание kubernetes и внедрение ML/AI и не только. Лучшие практики и свежие новости из мира AWS в формате интервью на русском языке. Смотрите и слушайте #awsнарусскомViktor Vedmich
Episodes
  • 063. Расширяем контекст LLM: от RAG до агентов — как победить ограничения AI?
    Jul 8 2025

    Думаете, увеличение контекстного окна до миллионов токенов решает все проблемы? На самом деле модели всё равно теряют фокус, упускают важные детали в середине и страдают от информационной перегрузки!

    В этом выпуске обсуждаем:

    • 🔹 Retrieval-Augmented Generation (RAG): как эта технология борется с "галлюцинациями" и устаревшими данными, обогащая ответы AI.

    • 💡 GraphRAG: почему семантические графы — это следующий шаг в понимании сложных связей в данных, и как это меняет игру.

    • 🎧 Tools и Function Calling: как научить модель взаимодействовать с внешним миром, получать актуальную информацию и выполнять действия через API.

    • 💬 AI-агенты: как мы переходим от простых диалоговых сценариев к автономным системам, способным самостоятельно планировать и выполнять задачи.

    Этот выпуск будет особенно полезен разработчикам и архитекторам, которые хотят создавать более умные и автономные AI-решения, используя такие инструменты, как Amazon Bedrock.

    💡 Узнаете, почему Nova Micro в 27 раз дешевле популярных моделей и как правильно декомпозировать документы для векторного поиска с учётом прав доступа.

    Навигация для Podbean: (0:00) Introduction (3:15) Проблема ограниченного контекста в LLM (8:40) Что такое RAG и как он обогащает запросы? (15:20) GraphRAG: новый уровень работы с данными через графы (22:10) Tools и Function Calling: как научить LLM действовать? (28:55) От диалоговых флоу к автономным AI-агентам (35:30) Анонс следующего эпизода: что такое MCP?

    Навигация для YouTube: 00:00:00 - Начало 00:03:15 - Проблема ограниченного контекста в LLM 00:08:40 - Что такое RAG и как он обогащает запросы? 00:15:20 - GraphRAG: новый уровень работы с данными через графы 00:22:10 - Tools и Function Calling: как научить LLM действовать? 00:28:55 - От диалоговых флоу к автономным AI-агентам 00:35:30 - Анонс следующего эпизода: что такое MCP?

    🎧 Слушайте на любимой платформе:

    • YouTube

    • Podbean

    • Apple Podcast

    • Яндекс.Музыка

    • Spotify

    • 💬 Какие подходы к расширению контекста используете вы? Пробовали Graph RAG в продакшене?

    #AWS #AI #RAG #GraphRAG #LLM

    Show More Show Less
    41 mins
  • 062. Масштабирование ML в AWS: От Исследований до Миллионов Предсказаний
    Apr 10 2025

    Как построить ML-систему, которая обрабатывает десятки миллионов предсказаний в месяц? Особенно когда речь идет о критически важном производственном процессе!

    В новом выпуске подкаста "AWS на русском" мы говорим с AWS ML Hero Рустемом (Rustem Feyzkhanov) о том, как масштабировать ML-системы в облаке от этапа исследований до промышленного внедрения:

    🔹 Как построить эффективный ML-пайплайн для автоматического обучения моделей

    🔹 Почему SageMaker Training Jobs и AWS Lambda — идеальная комбинация для масштабирования

    🔹 Как оптимизировать расходы на ML-инфраструктуру с помощью spot-инстансов

    🔹 Секреты мониторинга и отладки ML-систем в продакшене

    Этот выпуск будет особенно полезен ML-инженерам, DevOps-специалистам и техническим лидам, которые работают над масштабированием ML-решений в облаке.

    💡 Узнаете, как сократить время итерации ML-экспериментов с дней до часов и автоматизировать процесс вывода моделей в продакшен.

    Навигация для Podbean:

    • (0:00) Введение и представление гостя

    • (5:30) Особенности AutoML платформы

    • (15:45) ML-пайплайны и инфраструктура

    • (25:20) Масштабирование и оптимизация

    • (35:10) Мониторинг и поддержка

    • (45:30) Рекомендации и выводы

    Навигация для YouTube:

    00:00:00 - Начало

    00:05:30 - Особенности AutoML платформы

    00:15:45 - ML-пайплайны и инфраструктура

    00:25:20 - Масштабирование и оптимизация

    00:35:10 - Мониторинг и поддержка

    00:45:30 - Рекомендации и выводы

    🎧 Слушайте на любимой платформе:

    • YouTube

    • Podbean

    • Apple Podcast

    • Яндекс.Музыка

    • Spotify

    • RSS

    💬 А как вы решаете задачи масштабирования ML-систем? Делитесь опытом в комментариях!

    #AWS #MachineLearning #SageMaker #MLOps

    Show More Show Less
    34 mins
  • 061. Prompt Engineering: Как заставить AI работать на максимум?
    Mar 20 2025

    Думаете, достаточно просто задать вопрос искусственному интеллекту и получить идеальный ответ? На самом деле всё гораздо интереснее!

    В новом выпуске подкаста "AWS на русском" мы с Федором Павловым погружаемся в мир prompt engineering и раскрываем секреты эффективного взаимодействия с LLM:

    🔹 Почему простой вопрос — это часто ошибочная стратегия 🔹 Как правильно задавать контекст и роли для AI 🔹 Few-shot learning: магия примеров в действии 🔹 Продвинутые техники для улучшения качества ответов

    Особенно интересно будет разработчикам, которые хотят повысить свою продуктивность с помощью AI-инструментов, таких как Amazon Q Developer.

    💡 Узнаете, почему фраза "думай пошагово" творит чудеса с AI и как избежать типичных ошибок при составлении промптов.

    🎧 Слушайте на любимой платформе:

    • YouTube • Podbean • Apple Podcast • Яндекс.Музыка • Spotify • RSS

    💬 А как вы используете AI в своей работе? Делитесь опытом в комментариях!

    #AWS #AI #PromptEngineering #LLM #разработка #подкаст

    Навигация для Podbean:

    • (0:00) Введение • (0:25) Приглашенный гость Федор Павлов • (0:29) Обсуждение General TFI и промпт-инжиниринг • (2:08) Почему простой вопрос — это часто ошибочная стратегия • (2:29) Сравнение промпт-инжиниринга с SQL

    • (4:05) Как правильно задавать контекст и роли для AI • (6:51) Зачем нужен prompt engineering • (12:25) Few-shot learning: магия примеров в действии • (18:36) Продвинутые техники для улучшения качества ответов • (38:48) Борьба с галлюцинациями в моделях

    Навигация для YouTube:

    • 00:00:00 - Начало • 00:00:25 - Приглашенный гость Федор Павлов • 00:00:29 - Обсуждение General TFI и промпт-инжиниринг • 00:02:08 - Почему простой вопрос — это часто ошибочная стратегия • 00:02:29 - Сравнение промпт-инжиниринга с SQL

    • 00:04:05 - Как правильно задавать контекст и роли для AI • 00:06:51 - Зачем нужен prompt engineering • 00:12:25 - Few-shot learning: магия примеров в действии • 00:18:36 - Продвинутые техники для улучшения качества ответов • 00:38:48 - Борьба с галлюцинациями в моделях

    Show More Show Less
    43 mins

What listeners say about AWS на русском

Average Customer Ratings

Reviews - Please select the tabs below to change the source of reviews.

In the spirit of reconciliation, Audible acknowledges the Traditional Custodians of country throughout Australia and their connections to land, sea and community. We pay our respect to their elders past and present and extend that respect to all Aboriginal and Torres Strait Islander peoples today.