Іскра. Миттєвий аналіз даних
- Час доставки: 7-10 днів
- Стан товару: новий
- Доступна кількість: 15
Просматривая «Искра. Мгновенный анализ данных», вы можете быть уверены, что данное изделие из каталога «Базы данных» вы получите через 5-7 дней после оплаты. Товар будет доставлен из Европы, проверен на целостность, иметь европейское качество.
Іскра. Миттєвий аналіз даних. Видання II
Автори: Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee
Видавець: Helion
Рік видання: 2023
Перекладач: Роберт Górczyński
ISBN: 9788328399143
Формат: 165x235
Серія: O'Reilly
Палітурка: м'яка
Сторінок: 360
The книга нова
Ціна обкладинки книги: 89,00 злотих > ви знайдете акційну ціну на нашому аукціоні!
Apache Spark — це програмне забезпечення з відкритим вихідним кодом, розроблене для кластерної обробки даних, що надаються в різних форматах. Це дозволяє досягти безпрецедентної продуктивності та дозволяє працювати в пакетному та потоковому режимах. Цей фреймворк також добре підготовлений для запуску складних програм, включаючи машинне навчання та алгоритми прогнозного аналізу. Усе це робить Apache Spark чудовим вибором для розробників, які займаються великими даними, інтелектуальним аналізом даних.
Ця книга призначена для інженерів із обробки даних і розробників, які хочуть використовувати Spark для аналізу складних даних і використання алгоритмів машинного навчання, навіть якщо дані надходять із різних джерел. Тут пояснюється, як зчитувати й уніфікувати великі набори інформації за допомогою Apache Spark для створення надійних озер даних, як виконувати інтерактивні запити SQL, як створювати конвеєри за допомогою MLlib і розгортати моделі за допомогою MLflow. Також обговорюється сумісність програми Spark з її розподіленими компонентами та режими її реалізації в окремих середовищах.
У книзі:
- Структурований API для Python, SQL, Scala та Java
- Операції Spark і механізм SQL
- Конфігурації Spark та інтерфейс Spark UI
- підключення до джерел даних: JSON, Parquet, CSV, Avro, ORC, Hive, S3 і Kafka
- аналітичні операції над пакетними та потоковими даними
- надійні конвеєри даних і конвеєри машинного навчання
Spark: створюйте масштабовані та надійні програми для великих даних!
Jules S. Damji - інженер програмного забезпечення для багатьох провідних компаній, таких як Netscape, Sun Microsystems, Verisign і ProQuest. Займається розподіленими системами.
Брук Веніг– очолює команду, яка розробляє конвеєри машинного навчання. Він також проводить навчання в області розподіленого машинного навчання.
Татхагата Дас - є членом комітету з управління проектом Apache Spark. Він працює над структурованою потоковою трансляцією та Delta Lake.
Денні Лі – займається розподіленими системами та розробкою даних, особливо для галузі охорони здоров’я.
