Online-Ressource | |
Verfasst von: | Tandon, Akash [VerfasserIn] |
Ryza, Sandy [VerfasserIn] | |
Laserson, Uri [VerfasserIn] | |
Owen, Sean [VerfasserIn] | |
Wills, Josh [VerfasserIn] | |
Titel: | Zaawansowana analiza danych w PySpark |
Titelzusatz: | metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark |
Mitwirkende: | Watrak, Andrzej [ÜbersetzerIn] |
Werktitel: | Advanced analytics with PySpark |
Verf.angabe: | Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak |
Ausgabe: | [First edition]. |
Verlagsort: | Gliwice |
Verlag: | Helion |
E-Jahr: | 2023 |
Jahr: | [2023] |
Umfang: | 1 online resource (192 pages) |
Illustrationen: | illustrations |
ISBN: | 978-83-8322-070-3 |
83-8322-070-7 | |
Abstract: | Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. |
URL: | Aggregator: https://learning.oreilly.com/library/view/-/9788383220703/?ar |
Datenträger: | Online-Ressource |
Sprache: | pol |
K10plus-PPN: | 1850983151 |
Lokale URL UB: | Zum Volltext |
Bibliothek der Medizinischen Fakultät Mannheim der Universität Heidelberg | |
Bestellen/Vormerken für Benutzer des Klinikums Mannheim Eigene Kennung erforderlich | |
Bibliothek/Idn: | UW / m4343641481 |
Lokale URL Inst.: | Zum Volltext |