Іскра. Миттєвий аналіз даних


Код: 18337784621
1318 грн
Ціна вказана з доставкою в Україну
Товар є в наявності
ЯК ЕКОНОМИТИ НА ДОСТАВКЕ?
Замовляйте велику кількість товарів у цього продавця
Інформація
  • Час доставки: 7-10 днів
  • Стан товару: новий
  • Доступна кількість: 15

Просматривая «Искра. Мгновенный анализ данных», вы можете быть уверены, что данное изделие из каталога «Базы данных» вы получите через 5-7 дней после оплаты. Товар будет доставлен из Европы, проверен на целостность, иметь европейское качество.

Іскра. Миттєвий аналіз даних. Видання II

Автори: Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee

Видавець: Helion

Рік видання: 2023

Перекладач: Роберт Górczyński

ISBN: 9788328399143

Формат: 165x235

Серія: O'Reilly

Палітурка: м'яка

Сторінок: 360

The книга нова

Ціна обкладинки книги: 89,00 злотих > ви знайдете акційну ціну на нашому аукціоні!

Apache Spark — це програмне забезпечення з відкритим вихідним кодом, розроблене для кластерної обробки даних, що надаються в різних форматах. Це дозволяє досягти безпрецедентної продуктивності та дозволяє працювати в пакетному та потоковому режимах. Цей фреймворк також добре підготовлений для запуску складних програм, включаючи машинне навчання та алгоритми прогнозного аналізу. Усе це робить Apache Spark чудовим вибором для розробників, які займаються великими даними, інтелектуальним аналізом даних.

Ця книга призначена для інженерів із обробки даних і розробників, які хочуть використовувати Spark для аналізу складних даних і використання алгоритмів машинного навчання, навіть якщо дані надходять із різних джерел. Тут пояснюється, як зчитувати й уніфікувати великі набори інформації за допомогою Apache Spark для створення надійних озер даних, як виконувати інтерактивні запити SQL, як створювати конвеєри за допомогою MLlib і розгортати моделі за допомогою MLflow. Також обговорюється сумісність програми Spark з її розподіленими компонентами та режими її реалізації в окремих середовищах.

У книзі:

  • Структурований API для Python, SQL, Scala та Java
  • Операції Spark і механізм SQL
  • Конфігурації Spark та інтерфейс Spark UI
  • підключення до джерел даних: JSON, Parquet, CSV, Avro, ORC, Hive, S3 і Kafka
  • аналітичні операції над пакетними та потоковими даними
  • надійні конвеєри даних і конвеєри машинного навчання

Spark: створюйте масштабовані та надійні програми для великих даних!

Jules S. Damji - інженер програмного забезпечення для багатьох провідних компаній, таких як Netscape, Sun Microsystems, Verisign і ProQuest. Займається розподіленими системами.

Брук Веніг– очолює команду, яка розробляє конвеєри машинного навчання. Він також проводить навчання в області розподіленого машинного навчання.

Татхагата Дас - є членом комітету з управління проектом Apache Spark. Він працює над структурованою потоковою трансляцією та Delta Lake.

Денні Лі – займається розподіленими системами та розробкою даних, особливо для галузі охорони здоров’я.