Zaawansowana analiza danych w PySpark. Metody
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 8
Оплачивая «Zaawansowana analiza danych w PySpark. Metody», вы можете быть уверены, что данное изделие из каталога «E-бизнес» будет доставлено из Польши и проверено на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.
Расширенный анализ данных в PySpark. Методы крупномасштабной обработки информации с использованием Python и Spark
Авторы: Акаш Тандон, Сэнди Риза, Ури Лазерсон, Шон Оуэн, Джош Уиллс
Издатель: Гелион
Год выпуска: 2023
Перевод: Анджей Ватрак
ISBN: 978-83-8322-069-7
Формат: 165x235
Обложка: мягкая обложка
Страниц: 192
Книга новая
Цена обложки книги: 69,00 PLN > Акционную цену можно найти на нашем аукционе!
Потребности в анализе больших наборов данных и извлечении из них полезной информации постоянно растут. Среди инструментов, доступных для этих приложений, особенно полезен PySpark, Spark API для Python. Apache Spark отлично подходит для анализа больших наборов данных, а PySpark упрощает интеграцию Spark со специализированными инструментами PyData. Но чтобы в полной мере воспользоваться этими возможностями, вам необходимо понимать взаимодействие между алгоритмами, наборами данных и шаблонами, используемыми при анализе данных.
Вот практическое руководство по Spark 3.0, статистическим методам и реальным -мировые наборы данных. В нем обсуждаются принципы решения аналитических задач с использованием интерфейса PySpark, с использованием передовых практик программирования Spark. После прочтения вы сможете легко углубиться в аналитические закономерности, основанные на популярных методах обработки данных, таких как классификация, кластеризация, фильтрация и обнаружение аномалий, используемых в геномике, ИТ-безопасности и финансах. Дополнительным преимуществом являются описания использования обработки изображений и естественного языка. Еще одним преимуществом является ряд реальных примеров больших наборов данных и их расширенный анализ.
Благодаря книге вы узнаете:
- модель программирования в экосистеме Spark< /li>
- основные методы, используемые в науке о данных
- полная реализация анализа больших наборов общедоступных данных
- конкретные варианты использования инструментов машинного обучения
- код который вы можете легко адаптировать к своим потребностям.
PySpark: системный ответ на проблемы инженеров обработки данных!