Spark. Błyskawiczna analiza danych. Wydanie II
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 1
Оплачивая «Spark. Błyskawiczna analiza danych. Wydanie II», вы можете быть уверены, что данное изделие из каталога «Базы данных» будет доставлено из Польши и проверено на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.
Искра. Мгновенный анализ данных. 2-е издание
Гелион Гливице
Еан: 9788328399143
- ISBN: 9788328399143
- Автор: Жюль С. Дамджи, Брук Вениг, Татхагата Дас, Денни Ли
- Обложка: мягкая
- Год издания: 2023
- Формат: b5 li >
- Страниц: 360
Apache Spark — это программное обеспечение с открытым исходным кодом, предназначенное для кластерной обработки данных, поставляемых в различных форматах. Он позволяет добиться беспрецедентной производительности и позволяет работать в пакетном и потоковом режиме. Эта платформа также хорошо подготовлена для запуска сложных приложений, включая алгоритмы машинного обучения и прогнозного анализа. Все это делает Apache Spark отличным выбором для разработчиков, работающих с большими данными, а также их интеллектуальным анализом и анализом.
Эта книга предназначена для инженеров и разработчиков данных, которые хотят выполнять сложный анализ данных и алгоритмы машинного обучения с помощью Spark, даже если данные поступают из разных источников. В нем объясняется, как читать и объединять большие объемы информации с помощью Apache Spark для создания надежных озер данных, как выполнять интерактивные запросы SQL, как создавать конвейеры с помощью MLlib и развертывать модели с помощью MLflow. Также обсуждается совместимость приложения Spark с его распределенными компонентами и режимы его реализации в отдельных средах.
В книге:
- Структурированный API для Python, SQL, Scala и Java
- Операции Spark и SQL
- Конфигурации Spark и пользовательский интерфейс Spark
- подключение к источникам данных: JSON, Parquet, CSV, Avro, ORC, Hive, S3 и Kafka.
- аналитические операции с пакетными и потоковыми данными
- Надежные конвейеры данных и конвейеры машинного обучения.
Spark: создавайте масштабируемые и надежные приложения для обработки больших данных!